Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

948

.pdf
Скачиваний:
0
Добавлен:
17.06.2024
Размер:
943.68 Кб
Скачать

5. АППРОКСИМАЦИЯ ЗАКОНА РАСПРЕДЕЛЕНИЯ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

5.1. Задачи аппроксимации

Конкретное содержание обработки одномерных экспериментальных данных зависит от поставленных целей исследования. В простейшем случае достаточно определить первый момент распределения. В других случаях требуется установить вероятностно-временные характеристики распределения, например, оценить вероятность своевременной обработки запросов или вероятность безотказной работы системы в течение заданного периода времени. Для нахождения таких значений требуется знание закона распределения как наиболее полной характеристики соответствующей случайной величины.

Вклассической математической статистике вид закона распределения предполагается известным и производится оценка значений его параметров по результатам наблюдений. Но обычно заранее вид закона распределения неизвестен, а теоретические предположения не позволяют его однозначно установить. Обработка экспериментальных данных также не позволит точно вычислить истинный закон распределения показателя. В таком случае следует говорить только об аппроксимации (приближенном описании) реального закона некоторым другим, который не противоречит экспериментальным данным и в каком-то смысле похож на этот неизвестный истинный закон.

Всоответствии с этими положениями постановка задачи аппроксимации закона распределения экспериментальных данных формулируется следующим образом.

за случайной величинойn1 2

X . Объем выборки n фиксирован.

Необходимо подобрать закон распределения (вид и параметры), который бы в статистическом смысле соответствовал имеющимся наблюдениям.

Ограничения: выборка представительная, ее объем достаточен для оценки параметров и проверки согласованности выбранного закона распределения и экспериментальных данных; плотность распределения унимодальная.

Наличие в функции плотности распределения нескольких мод может быть следствием различных причин, например, существования сезонной разницы остроты пара при тепловлажностной обработке железобетонных изделий. Выборку с несколькими модами разделяют на составные части так, чтобы каждая из них имела одну моду. В последнем случае функция распределения исходной выборки представляет собой взвешенную сумму

61

s

соответствующих функций отдельных выборок: F x pi Fi x , где s

i 1

количество выборок, выбранное исходя из требований унимодальности распределения; pi – вероятность принадлежности элемента выборки к вы-

борке i ; Fi x – функция распределения выборки i .

Решение поставленной задачи аппроксимации осуществляется на основе применения "типовых" распределений, специальных рядов или семейств универсальных распределений [5, 9, 10, 11, 15].

5.2. Аппроксимация на основе типовых распределений

Задача аппроксимации на основе типовых распределений решается итерационно и включает выполнение трех основных шагов:

предварительного выбора вида закона распределения;

определения оценок параметров закона распределения;

оценки согласованности закона распределения и экспериментальных данных.

Если заданный уровень согласованности достигнут, то задача считается решенной, а если нет, то шаги повторяются снова, начиная с первого шага, на котором выбирается другой вид закона, или начиная со второго – путем некоторого уточнения параметров распределения.

Выбор вида закона распределения осуществляется посредством анализа гистограммы распределения, оценок коэффициентов асимметрии и эксцесса. По степени «похожести» гистограммы и графиков плотностей распределения типовых законов или по «близости» значений оценок коэффициентов и диапазонов их теоретических значений выбираются распределения – кандидаты для последующей оценки параметров. На рис. 3.5, 5.1–5.4 представлены графики типовых функций плотностей распределения, часто применяемых в задачах аппроксимации экспериментальных данных, а в табл. 5.1 приведены функции плотности и теоретические параметры этих распределений.

Рис. 5.1. Логарифмически нормальное распределение

62

а) = 0;

б) = 1

Рис. 5.2. Экспоненциальное

Рис. 5.3. Распределение Вейбулла

распределение

Рис. 5.4. Гамма-распределение:

а) =1; б) =3

Следует отметить, что гамма-распределение соответствует распределению Эрланга, если – целое, и экспоненциальному распределению при

1.

После выбора подходящего вида распределения производится оценка его параметров, используя методы максимального правдоподобия, моментов или квантилей. В целях упрощения решения задачи в табл. 5.2 приведены расчетные формулы для вычисления оценок параметров типовых распределений.

Применительно к выбранному закону распределения производится проверка гипотезы о том, что имеющаяся выборка может принадлежать этому закону. Если гипотеза не отвергается, то можно считать, что задача аппроксимации решена. Если гипотеза отвергается, то возможны следующие действия: изменения значений оценок параметров распределения; выбор другого вида закона распределения; продолжение наблюдений и пополнение выборки. Конечно, такой подход не гарантирует нахождение «истинного» или даже подбора подходящего закона распределения.

63

Таблица 5.1

 

 

 

 

 

 

 

 

Тип и функция

 

 

 

Математическое ожидание m1,

 

 

 

 

 

 

 

 

 

 

дисперсия m , асимметрия b m

 

m3 2

,

 

 

 

плотности распределения

 

 

 

 

 

 

 

2

 

 

 

 

 

1

 

3

2

 

 

 

 

 

 

 

 

 

эксцесс b m

m2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

4

2

 

 

 

 

 

Нормальное

 

 

 

 

 

 

 

m1 1;

 

m2 2 2 ;

 

 

 

 

 

 

 

 

 

 

1

 

 

exp x 1 2

2 2 ,

b1 0 ; b2

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Логарифмически нормальное

m1 exp 1 0,5 2 ;

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

ln x 1 2

 

m2 exp 2 1

2 exp 2 1 ;

 

 

 

 

 

 

 

 

 

 

 

 

exp

 

 

 

 

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

2

 

 

 

 

2

 

 

 

b1 exp 2 2

exp 2 1 ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x 0, 0, x 0

 

 

 

 

 

 

 

b2 exp

4 4 2exp 3 2 3exp 2 2 3

Экспоненциальное

 

 

 

 

m1 1 m2 1

2 ;

 

 

 

 

 

 

 

 

 

exp x ,

 

 

 

 

 

 

 

 

b1 2; b2

9

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x 0,

 

0, x 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Вейбулла

 

 

 

 

 

 

 

 

m1 g1;

m2 2 g2

g12 ;

 

 

 

 

 

 

 

x

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3 2

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

exp

 

 

 

 

,

 

 

b

g

3

3g g

2

2g3

g

2

g2

 

;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

1

 

1

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a g4 4g1g3 6g2 g12 3g14 ;

 

 

 

 

 

 

x 0, 0, x 0, 0, 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

b2 a g2 g12 2 ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

g1 Г 1 i

 

 

 

 

 

 

 

 

 

 

 

Гамма

 

 

 

 

 

 

 

 

 

m1 ; m2

2 ;

 

 

 

 

 

 

 

 

 

 

 

 

x 1 exp x ,

 

 

 

 

b1 2

 

; b2

 

3 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Г

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x 0, 0, x 0, 0, 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Преимущество применения типовых законов распределения состоит в их хорошей изученности и возможности получения состоятельных, несмещенных и относительно высокоэффективных оценок параметров. Однако рассмотренные выше типовые законы распределения не обладают необходимым разнообразием форм, поэтому их применение не дает необходимой общности представления случайных величин, которые встречаются при обработке экспериментальных данных.

64

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 5.2

Тип

 

 

 

 

 

 

 

Оценка параметров распределения

распределения

 

 

 

 

 

 

 

 

по выборочным данным

 

Нормальное

 

 

 

1

n

 

1

 

 

 

 

n

 

 

 

 

 

 

1

 

xi ; 2 2

 

 

 

xi 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n i 1

 

n 1 i 1

 

 

 

 

 

Логарифмически

 

 

 

1

n

 

 

 

1

 

n

 

 

 

 

 

нормальное

1

 

ln xi

; 2 2

 

 

ln xi 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n i 1

 

 

n 1 i 1

 

 

 

 

 

Экспоненциальное

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Вейбулла

 

 

 

 

 

ln a ln xq lnbln xp

 

ln a lnb

 

 

exp

 

 

 

 

 

 

 

;

 

 

 

 

;

 

 

ln a lnb

 

 

 

 

 

 

ln xq ln xp

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0 q p 1, a ln 1 p , b ln 1 q ;

 

 

xq , xp

– выборочные квантили

 

 

 

 

 

Гамма

 

 

 

0,5001

0,1649q 0,0544q2

1, 0 q 0,577,

 

 

 

 

 

 

 

 

q

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8,899 9,060q 0,9775q2

 

 

 

 

 

 

 

 

 

1,

0,577 q 17,

 

 

 

 

 

17,80 11,97q q

2

q

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ln 1

6 , 1

 

 

 

 

 

 

 

 

 

 

n

 

 

где q

 

1 ,

 

1

1 xi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n i 1

 

5.3. Аппроксимация на основе специальных рядов

Типовые ряды, известные из математического анализа (ряды Тейлора, Фурье), не подходят для описания функций распределений, так как не обладают свойствами, присущими этому виду функций. Для подобного описания предложены специальные функции, например, основанные на полиномах Чебышева – Эрмита. К числу таких функций относится ряд Грама – Шарлье

F x Ф u

1

2

 

3

u

1

 

 

 

 

 

4

u

1 2

 

6

u ..., (5.1)

 

3

Ф

 

 

 

 

4

3

Ф

 

 

3

Ф

 

 

 

 

 

 

 

 

 

6

32

 

 

 

24

 

22

 

 

 

 

72 32

 

 

 

65

где Ф u – функция нормального распределения центрированной и нормированной случайной величины u x 1 0,52 , Ф k u k -я произ-

водная от функции нормального распределения.

Вычисление Ф u не требует численного интегрирования, так как

имеются ее приближения на основе полиномов, а производные представимы элементарными функциями:

Ф 3 u u2 1 fн u ,

Ф 4 u u3 3u fн u ,

(5.2)

Ф 6 u u5 10u3 15u fн u , fн u 2 0,5 exp u22 .

Ряд Грама – Шарлье целесообразно использовать для описания распределений, близких к нормальному. В других случаях начинают проявляться серьезные недостатки: ряд может вести себя нерегулярно (увеличение количества членов ряда иногда снижает точность аппроксимации); ошибки аппроксимации возрастают с удалением от центра распределения; сумма конечного числа членов ряда при большой асимметрии распределения приводит к отрицательным значениям функций, особенно на краях распределений. Этот ряд применяют только при весьма умеренном коэффициенте асимметрии, не превышающем 0,7. Следовательно, применение рядов тоже не обеспечивает необходимой общности решения задач аппроксимации.

Пример 5.1. Оценить качество аппроксимации экспериментальных данных, табл. 2.4, на основе ряда Грама – Шарлье. Проверку согласованности провести с использованием критерия хи-квадрат при уровне значимости 0,5.

Решение. В примере 2.3 были вычислены значения оценок моментов:

1 27,508 , 2 0,913, 3 0,132 , 4 1,819 .

На основе табл. 2.4 построим табл. 5.3.

Таблица 5.3

i

 

 

 

1

2

3

4

5

6

ni

 

 

 

5

9

10

9

5

6

Верхняя граница, xi

26,37

26,95

27,53

28,11

28,69

 

F xi

 

 

0,127

0,303

0,517

0,721

0,877

1

Fi

 

 

 

0,127

0,176

0,214

0,204

0,156

0,123

Fi

 

 

 

5,588

7,744

9,416

9,976

6,864

5,412

ni

Fi

2

Fi

0,062

0,204

0,036

0,000

0,506

0,063

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

66

В таблице значения функции распределения F xi для верхней границы интервала и теоретическое значение оценки вероятности Fi попадания

случайной величины в i -й интервал вычислены на основе ряда ГрамаШарлье. Обозначения оценки частоты попадания Fi Fi n случайной ве-

личины в i -й интервал, вероятности Fi попадания случайной величины в интервал xi xi 1 , взвешенного квадрата отклонения ni Fi 2 Fi анало-

гичны табл. 3.2. Сумма взвешенных квадратов отклонения 2 0,872 (кри-

тическое значение составляет 7,815).

Выборка имеет слабо выраженную асимметрию. По сравнению с аналогичным значением 2 1,318 при аппроксимации экспериментальных

данных нормальным распределением, ряд Грама – Шарлье дает более «точное» описание данных.

5.4. Аппроксимация на основе универсальных семейств распределений

Существуют различные подходы к построению универсальных семейств распределений. Рассмотрим два наиболее типичных. Первый подход является дальнейшим развитием метода моментов, а второй основан на замене исходной выборки другой, распределение которой является стандартным.

Аппроксимация на основе семейства распределений К. Пирсона

В рамках первого подхода одно из универсальных семейств распределений предложил К. Пирсон. Моменты распределения случайной величины, даже если все они существуют, не характеризуют полностью этого распределения, но они определяют его однозначно при некоторых условиях, которые выполняются почти для всех используемых на практике распределений. Иначе говоря, при решении задач обработки экспериментальных данных знание моментов эквивалентно знанию функции распределения, и совпадение значений первых r моментов двух распределений говорит о приблизительной одинаковости распределений. Не зная точно вид функции распределения, но найдя r первых моментов, можно подобрать другое распределение с теми же первыми моментами. Практически такая аппроксимация оказывается хорошей при совпадении первых трех-четырех моментов.

Анализ характерных черт функций плотности унимодальных распределений показывает, что эти распределения начинаются с нуля, поднимаются до максимума, а затем уменьшаются снова до нуля. Это означает, что

67

для описания подобных функций плотности распределений f x необходимо выбрать такие уравнения, для которых df x dx 0 при следующих

условиях:

1) f x 0 , тогда, по крайней мере, на одном краю распределения бу-

дет соприкосновение с осью абсцисс высшего порядка;

2) x a , где величина a соответствует моде распределения.

Этим условиям для центрированной переменной x удовлетворяет

дифференциальное уравнение df dx x a f

b0 b1x b2 x2 , решение

которого приводит к семейству распределений Пирсона. Действительно, в этом уравнении df x dx равно нулю, если f x 0 или x a . Семейство

распределений Пирсона включает не только унимодальные распределения, но и распределения, имеющие U -образную форму (две моды).

Уравнение содержит четыре неизвестных параметра. Их вычисление основано на методе моментов – четыре выборочных момента приравниваются к соответствующим моментам теоретического распределения, являющимся функциями от неизвестных параметров. Решая полученную систему уравнений относительно неизвестных параметров, получают искомые оценки параметров в виде функций выборочных моментов

a 3 4 3 22 A,

 

B0 2 4 2 4 3 32 A,

 

B1 3 4 3 22 A,

(5.3)

B2 2 2 4 3 32 6 32

A,

A 10 2 4 18 32 12 32.

 

Выражения для плотности f x выводятся

путем интегрирования

дифференциального уравнения. Интегрирование позволяет получить одиннадцать типов функций плотности распределения, три из которых являются основными, а восемь – их частными случаями, в том числе, и такие общеизвестные, как нормальное, экспоненциальное, гамма-распределение.

Распределение f x сосредоточено:

– на конечном интервале, если корни уравнения B0 B1x B2 x2 0 представляют собой действительные числа различных знаков;

на положительной полупрямой, если корни – действительные числа одного знака и a 0, или на отрицательной полупрямой при a 0;

на всей оси абсцисс, если уравнение не имеет действительных кор-

ней.

68

Принимая моду за начало отсчета исходной центрированной величины, т.е. полагая t x a , исходное уравнение представим в виде

dtd ln f t t B0 B1t B2t2 .

Первый основной тип распределения получается в случае, когда корни уравнения B0 B1t B2t2 0 являются действительными числами с различными знаками. Обозначим корни уравнения через c1 и c2 соответственно, причем, величины c1 и c2 – положительные числа. Тогда по извест-

ной теореме B B t B t

2 B t c

t c

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

1

2

 

 

2

 

 

 

 

1

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Исходное уравнение преобразуем к виду

 

 

 

 

 

 

 

 

 

 

 

 

 

 

d

ln f1 t

 

 

t

 

 

 

 

 

 

 

c1

 

 

1

 

 

 

 

 

c2

 

 

1

 

 

.

 

dt

 

B t c t c

B

c

c

t c

 

 

B

c

c

t c

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

1

 

 

2

 

 

 

 

2

1

2

1

 

 

 

2

1

2

2

 

 

 

Обозначим c1

B2 c1

c2

 

и c2

B2 c1

c2 . Тогда можно за-

писать d ln f1 t d ln t c1

 

ln c2 t . Решение дифференциально-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

го уравнения с точностью до некоторого коэффициента k1

можно предста-

вить в виде

f t k

c

t c

 

t . Размах данного распределения со-

 

 

 

 

1

1

1

 

 

2

 

 

c2 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

средоточен

на

 

интервале

c1,

Проведем

 

 

замену

переменной

t c1

c2 y c1, учитывая,

что

 

dt c1

c2 dy , включим постоянный со-

множитель

c

c 1

в

 

состав

коэффициента

k .

В

итоге получим

 

 

 

 

1

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

f1 y

k1 y 1 y , где

y

изменяется в пределах от 0 до 1. Интегрируя в

этих

 

пределах

 

функцию

f t

, можно найти значение

k

из условия

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k1 y 1 y dy 1. Интеграл в данном выражении по определению соот-

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ветствует бета-функции B 1,

 

1 , которая определяется через гамма-

функцию

 

 

B 1,

1 Г 1 Г 1 Г 2 .

 

 

 

Итак,

k1 1

B 1, 1 . Окончательно плотность распределения

 

 

 

 

 

 

 

 

 

 

 

 

f1 y 1 B 1,

1 y 1 y ,

 

 

 

 

 

(5.4)

где 0 y 1.

Переменная y определяется через исходный (не центрированный и не-

смещенный) аргумент x в соответствии с ранее введенными подстановка-

ми: y c1 x 1 a c1 c2 .

69

Функция плотности распределения первого типа соответствует бетараспределению (рис. 5.5). Функция распределения

F y

Г 2

y y 1 y dy .

(5.5)

 

1

Г 1 Г 1 0

 

 

 

 

Рис. 5.5. Распределение Пирсона первого типа (бета-распределение):

а – >1, >1; б – <1, < 1; в – =2, 1; г – = 1

При наличии действительных корней одного знака получается распре-

деление Пирсона шестого типа. Пусть корни c1

и c2 меньше нуля, т.е.

B2 , c1 и c2 положительны c1 c2 , тогда можно записать

 

 

 

d

ln f6

t

 

c1

 

 

 

1

 

 

 

c2

 

 

 

1

 

,

 

dt

B

c c

2

t c

 

B c c

t c

 

 

 

 

 

 

 

 

 

 

2

1

1

 

 

2

1

2

2

 

 

где c1 t . Обозначим с1B2 c1 c2 и c2 B2 c1 c2 .

После преобразований получим

d ln f6

 

 

t

 

c2

t

 

 

 

t d ln c1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

или f6 t k6 c1 t c2 t . Здесь, как и для распределения первого ти-

па, t x 1 a .

Используем подстановку c

c

c

2

t , тогда dt c

c z 2dz .

1

2

 

 

2

1

Функция плотности распределения

 

 

шестого типа

примет вид

f6 t k6 1 z z 2 . Нормировочный коэффициент

определяется

 

70

 

 

 

 

 

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]