Скачиваний:
35
Добавлен:
23.04.2022
Размер:
4.96 Mб
Скачать

Рассмотрим часто применяемый критерий согласия χ² (критерий Пирсона) для проверки статистических гипотез. Суть этого критерия состоит в следующем. Пусть нужно проверить гипотезу Н0, состоящую в том, что результаты наблюдений образуют выборку из n значений Х – случайной величины, которая имеет некоторое заданное теоретическое распределение. Ставится задача – определить, насколько близко выборочное распределение случайной величины к ее теоретическому распределению.

Для решения этой задачи все пространство значений наблюдаемой величины разобьем на непересекающиеся области S1, S2, …, Sk. Обозначим через Pi вероятности попадания (при заданном распределении) в области Si , а через mi – число попавших в эти области наблюдений (частоты).

По данным наблюдений и с учетом теоретического распределения случайной величины определим:

k

(m nP )2

k

m2

 

 

χнабл2 =

 

 

i

i

 

 

=

 

i

n .

(1.70)

 

 

nP

 

 

 

 

nP

i=1

 

 

 

 

i

 

 

 

 

 

 

 

i =1

i

 

 

Величину f=k1 называют

числом степеней свободы, где

k – число сравниваемых частот (разрядов). При

n ∞ плотность

распределения величины χ2 выражается соотношением

 

 

 

 

 

x

k 3

e

x

 

 

 

 

 

ϕ(x)=

 

 

 

2

2

 

 

 

.

 

 

(1.71)

 

 

k 1

 

 

 

 

 

 

 

 

 

 

 

 

 

k 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

2 Г

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

На практике при применении критерия согласия χ² пространство выборок разбивают не менее чем на пять непересекающихся областей Sk (k 5), а число реализаций, попавших в область, должно быть не менее десяти. Для χ²-распределения вычислены таблицы

вероятностей P = P(χнабл2 < χкр2 ) (см. табл. П2). При использовании

таблицы следует иметь в виду следующее. Если в качестве теоретического распределения задано однопараметрическое распределение, то берут число степеней свободы, равное f = k – 1. Если задано многопараметрическое распределение, то число степеней свободы принимают равным f = k – p – 1, где p – число неизвестных параметров.

71

По значению χнабл2 , вычисленному по формуле (1.71), и известному числу степеней свободы f, используя табл. П2, находят P. Если значение P близко к единице, т. е. χ02,9 , χ02,99 , ..., χ02,999 , то вероятность того, что χ2 > χкр2 мала, и, следовательно, гипотезу Н0 нужно

отбросить.

Для применения критерия χ² применяют метод, когда полученные данные группируют по интервалам частот и сравнивают с ожидаемым числом наблюдений для принятого распределения. На основе этого сравнения вычисляют критерий, который приближенно следует χ²-распределению только в том случае, если модель выбрана правильно. Если модель выбрана неправильно, то значение критерия превысит значение случайной величины, распределенной по закону χ². Для оценки правильности принятой модели используют

численные значения процентилей χ2P( f ) – распределения, приведен-

ные в табл. П2.

Критерий Пирсона вычисляют по формуле

k

2

 

 

χнабл2 =

(mi mi )

 

,

(1.72)

mi

 

i =1

 

 

 

где k число сравниваемых частот; mi и mi' эмпирическая и теоретическая частоты в i-м интервале.

Полученные статистические данные делят таким образом, чтобы в каждый интервал попадало не менее пяти наблюдений. Если в каком-либо интервале число наблюдений окажется меньше пяти, то его объединяют с соседним интервалом таким образом, чтобы ожидаемое число наблюдений в объединенном интервале было не менее пяти.

Расчет значений χнабл2 удобно выполнять в форме табл. 1.6. После заполнения всей таблицы вычисляется число степеней свободы:

f = k – p – 1 ,

где k – число сравниваемых частот (в нашем примере k = 7); p – число параметров теоретического распределения (для нормального закона p = 2). В нашем примере f = 7 – 2 – 1 = 4.

72

Область допустимых значений критерия χ2 или область принятия гипотезы характеризуются неравенством

χ2набл < χ2кр (γ1, f ) ,

где χ2набл – значение критерия, вычисленное по данным наблюдений; χ2кр(γ1, f) – критические значения критерия при заданных γ1 и f; γ1 – уровень значимости в технике, обычно принимается равным 0,05.

Номер

интервала

1

1

2

3

4

5

6

7

8

9

10

11

12

13

14

Сумма

Таблица 1.6

Вычисление критерия Пирсона

 

 

 

 

 

 

| mi – mi'|2

 

 

m

m

 

2

 

 

 

 

 

 

 

 

 

 

 

mi

 

 

mi'

| mi – mi'|

 

 

i

i

 

 

 

 

 

 

 

 

 

 

 

 

mi

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

3

4

5

 

 

 

6

 

 

 

3

}

2,94

 

 

 

 

 

 

 

 

 

11

9, 29

1,71

2,9241

 

 

 

0,31

 

8

 

6,35

 

 

 

 

11

 

13,48

2,48

6,1504

 

 

 

0,46

 

20

 

18,80

1,20

1,4400

 

 

 

0,08

 

27

 

25,88

1,12

1,2544

 

 

 

0,05

 

36

 

30,17

5,83

33,9889

 

 

 

1,13

 

29

 

30,59

1,59

2,5281

 

 

 

0,08

 

18

 

26,63

8,63

74,4769

 

 

 

2,80

 

17

 

19,92

2,92

8,5264

 

 

 

0,43

 

17

 

14,79

2,21

4,8841

 

 

 

0,33

 

 

8

 

7,06

0,94

0,8836

 

 

 

0,12

 

4

 

3, 42

 

 

 

 

 

 

 

 

 

1

 

 

1, 40

 

0,69

0,4761

 

 

 

0,09

 

6

5,31

 

 

 

 

1

 

 

0, 49

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

200

 

 

 

 

 

 

 

 

5,88

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

73

По табл. П2 находим χ2кр (0,05; 8) = 15,5. Поскольку 5,88 < 15,5,

гипотеза о нормальном распределении анализируемой погрешности справедлива.

Используя метод разбиения на интервалы, можно определить вероятность попадания случайного наблюдения в i-й интервал из соотношения

P(xн x xв ), i = 1, 2, …, k,

(1.73)

i

i

 

где xiн нижняя граница i-го интервала; xiв верхняя граница i-го

интервала; k – число интервалов.

Границы интервала х1, х2, , хk определяют с помощью теоретического распределения с использованием следующих оценок параметров:

P(x x )= 1

,

P(x x

2

)=

2

, ...,

P(x x

k 1

)=

k 1

.

(1.74)

 

 

1

k

 

 

 

k

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

Нижняя граница первого интервала и верхняя граница последнего интервала являются соответственно наименьшим и наибольшим значениями, которые может принимать случайная величина. Границы интервалов установлены таким образом, что для каждого интервала вероятность попадания случайной величины в него оценивается как 1/k.

Математическое ожидание Мхi числа наблюдений в каждом интервале для принятой теоретической модели определяют таким образом:

Мхi = N/k, i = 1, 2, …, k .

(1.75)

Подсчитывают число наблюдений в каждом интервале mi и вычисляют критерий:

2

k

k

2

 

 

χнабл =

 

 

mi

N.

(1.76)

 

 

N i =1

 

 

 

Сравнивают вычисленное значение χнабл2 с табличным значением для заданного уровня значимости и числа степеней свободы. Если вычисленное значение χнабл2 превышает его табличное значение для α = 0,95, то вероятность того, что полученные данные имеют принятое распределение, не превышает 0,05, и модель отвергают как не удовлетворяющую требованиям.

74

Кроме того, можно пользоваться критерием Романовского:

A =

χ2

f

(1.77)

 

.

P

 

2 f

 

 

 

 

Если АР < 3, гипотеза принимается. Если АР > 3, гипотеза отвергается.

В нашем случае AР = (5,88 8) 2 8 = 0,53, следовательно, эм-

пирическое распределение соответствует нормальному закону. Если теоретические значения параметров известны, то лучшим

является критерий Колмогорова λк:

λк = Dк

N

1,

(1.78)

где Dк – наибольшее отклонение теоретической кривой распределения от экспериментальной; N – общее количество экспериментальных точек.

При неизвестных параметрах этот критерий также применим, но в этом случае дает несколько завышенные оценки.

Применение данного критерия рассмотрим на примере, представленном в табл. 1.7.

 

 

 

 

Вычисление критерия Колмогорова

 

Таблица 1.7

 

 

 

 

 

 

 

 

Номер

 

mi

 

mi'

 

mi

 

mi'

 

mi – mi'

 

 

 

 

 

 

 

 

 

интервала

 

 

 

(накопленные)

 

(накопленные)

 

(накопленные)

 

 

1

 

2

 

3

 

4

 

5

 

6

 

 

1

 

3

 

2,94

 

3

 

2,94

 

+0,06

 

 

2

 

8

 

6,35

 

11

 

9,29

 

+1,71

 

 

3

 

11

 

13,48

 

22

 

22,77

 

–0,77

 

 

4

 

20

 

18,80

 

42

 

41,57

 

+0,48

 

 

5

 

27

 

25,88

 

69

 

67,45

 

+1,55

 

 

6

 

36

 

30,17

 

105

 

97,62

 

+7,38

 

 

7

 

29

 

30,59

 

134

 

128,21

 

+5,79

 

 

8

 

18

 

26,63

 

152

 

154,84

 

2,84

 

 

9

 

17

 

19,92

 

169

 

174,76

 

5,76

 

 

10

 

17

 

14,79

 

186

 

189,55

 

3,55

 

 

11

 

8

 

7,06

 

194

 

196,61

 

2,61

 

 

12

 

4

 

3,42

 

198

 

200,03

 

 

 

 

 

 

 

 

2,03

 

 

13

 

1

 

1,40

 

199

 

201,43

 

 

 

 

 

 

 

 

2,43

 

 

14

 

1

 

0,49

 

200

 

201,92

 

 

 

 

 

 

 

 

1,92

 

 

ма

 

200

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

75

В колонках 4 и 5 табл. 1.7 приведены накопленные суммы, которые образуются путем прибавления последующих частот к сумме предыдущих. Затем составляется разность между накопленными теоретическими и накопленными эмпирическими суммами (колонка 6) и находится максимальное значение этой разности. В данном примере она равна 7,38.

После этого находим

Dmax = 7,38/N = 7,38/200 = 0,037, N = ∑mi = 200.

Коэффициент λк находится по формуле

λк = Dmax N = 0,036· 200 = 0,50904.

Пользуясь табл. 1.8 для данного значения λк, находим Р(λ) – вероятность того, что гипотетическая функция выбрана правильно. Для λк = 0,5 имеем Р(λ) = 0,9639, т. е. эмпирическая и теоретическая кривая согласуются.

Таблица 1.8 Таблица значений Р(λ) критерия Колмогорова

λ

Р(λ)

λ

Р(λ)

0,30

1,000

1,00

0,2700

0,35

0,9997

1,10

0,1777

0,40

0,9972

1,20

0,1122

0,45

0,9874

1,30

0,0681

0,50

0,9639

1,40

0,0397

0,55

0,9228

1,50

0,0222

0,58

0,8896

1,60

0,0120

0,60

0,8643

1,70

0,0062

0,64

0,8073

1,80

0,0032

0,65

0,7920

1,90

0,0015

0,70

0,7112

2,00

0,0007

0,75

0,6272

2,10

0,0003

0,80

0,5441

2,20

0,0001

0,85

0,4653

2,30

0,0001

0,90

0,3927

2,40

0,0000

0,95

0,3275

2,50

0,0000

76

Пример 1.6. В процессе испытаний десяти генераторов были зафиксированы следующие значения наработок между отказами,

выраженные в часах: 2, 4, 4, 5, 5, 5, 6, 8, 8, 10, 12, 12, 15, 15, 16, 16, 18, 18, 19, 20, 21, 21, 21, 21, 22, 22, 22, 22, 23, 23, 23, 23, 23, 24, 24, 24, 24, 24, 24, 24, 2, 3, 4, 4, 4, 4, 5, 5, 5, 6.

Испытания генераторов проводились в течение t = 500 ч, при этом весь период разбит на пять интервалов. Первые десять реализаций зафиксированы на первом интервале (0, t1) = 100 ч, вторые десять реализацийзафиксированы на втором интервале (t1, t2) = 100 ч и т. д. В качестве теоретического распределения наработки между отказами принят экспоненциальный закон с параметрами потока отказов (параметром распределения на каждом участке, равном λi). Ставится задача – провести проверку соответствия статистических данных наработок между отказами теоретическому распределению с помощью критерия χ2.

Решение. Для вычисления квантиля χ2-распределения воспользуемся формулой (1.70):

5

(m

nP )2

χнабл2 =

i

i

.

nP

 

i=1

 

i

 

 

Статистические данные разобьем на пять интервалов, и тогда в каждый интервал попадет по десять реализаций, т. е. m1 = m2 =…= = mi =10. Общее число реализаций в процессе испытаний: n = 50. Вероятность отказа на каждом участке (интервале) соответствует параметру интенсивности отказов на данном участке, который определяют по формуле

Pi = λi = miti .

Вычислим λi для каждого интервала:

λ1 = ( 10 ) = 0,17; 2 + 4 + 4 +5 +5 +5 +6 +8 +8 +10

λ2 = ( 10 ) = 0,06; 12 +12 +15 +15 +16 +16 +18 +18 +19 + 20

77

 

 

 

10

 

 

 

 

 

 

 

 

 

 

 

 

λ3 =

 

 

 

 

 

 

 

= 0,045;

 

 

 

 

(4 21+ 4 22 + 2 23)

 

 

 

 

10

 

 

 

 

 

 

 

 

 

 

 

 

 

λ4 =

 

 

 

 

= 0,042;

 

 

 

 

 

 

 

(3 23 + 7 24)

 

 

 

 

 

10

 

 

 

 

 

 

 

 

 

 

 

 

 

λ5 =

 

 

 

 

= 0,24.

 

 

 

 

 

(2 + 3 + 4 4 + 3 5 + 6)

 

 

Далее найдем значение χнабл2

:

 

 

 

 

 

 

 

 

 

χ2

= (10 50 0,17)2 + (10 50 0,06)2

+ (10 50 0,045)2

+

набл

 

 

 

50 0,17

 

 

50 0,06

 

 

 

50 0,045

 

 

 

 

 

 

 

 

 

 

+

 

(10 50 0,042)2

+

(10 50 0,24)2

= 73,3.

 

 

 

50 0,042

 

50 0,24

 

 

 

 

 

 

 

 

 

Принимая в качестве теоретического закона экспоненциальное распределение, найдем число степеней свободы: f = k – 1 = 5 – 1 = 4. Затем для числа степеней свободы f = 4 и квантиля χнабл2 = 73,3 по табл. П2 определим, что вероятность P > 0,999. Следовательно, гипотезу об экспоненциальном распределении для P > 0,999 следует

отбросить, т. к. χкр2 (18,5) < χнабл2 (73,3).

Пример 1.7. По результатам эксплуатации двадцати приборов (n = 20) получены статистические данные о наработке до отказа каждого из них (табл. 1.9). На основе этих данных определить вероятность безотказной работы прибора за 10 ч, предполагая, что время безотказной работы распределено по экспоненциальному закону с помощью критерия χ2.

Таблица 1.9 Время работы ti до отказа каждого из 20 приборов

Номер

ti, ч

Номер

ti, ч

Номер

ti, ч

Номер

ti, ч

интервала

интервала

интервала

интервала

 

1

 

20

 

95

 

268

 

4

 

40

 

106

 

459

1

5

2

40

3

125

4

827

 

6

 

60

 

151

 

840

 

15

 

93

 

200

 

1089

78

Решение. Предположив экспоненциальный закон распределения времени работы прибора до отказа, найдем оценку параметра интенсивности отказа:

λ = nti ; λ = 444420 = 0,0045 ч–1.

На основании того, что n = 20, число интервалов выбираем рав-

ным n/5, поэтому k = 20/5 = 4.

Для функции экспоненциального распределения F(t,λ)=1e−λt находим границы интервалов, полагая, что:

P(x x1 )=1e0,0045x1 =1k = 0,25;

P(x x2 )=1e0,0045x2 = 2k = 0,50;

P(x x3 )=1e0,0045x3 = 3k = 0,75;

P(x x4 )=1e0,0045x4 = 4k =1,00.

Решая эти уравнения относительно x1, x2, x3, x4, находим интервалы:

x =

0,25

= 55,5; x

2

=

0,50

=110,0;

1

0,0045

 

0,0045

 

 

 

 

 

x3 = 0,00450,75 =165,5; x4 = 0,00451,00 = 222,0 .

Поскольку экспоненциально распределенная случайная величина при λ = 0 изменяется от 0 до , нижняя граница первого интервала равна нулю, а верхняя граница последнего интервала равна ∞. Вероятность попадания случайной величины в любой из интервалов равна 0,25. Исходя из данных табл. 1.9, примем x1 = 61; x2 = 152; x3 = 300 и составим таблицу (табл. 1.10).

79

Таблица 1.10

Сравнение фактических и ожидаемых данных, сгруппированных в интервалы

 

 

Фактическое число mi

Ожидаемое число Mxi

Интервал

наблюдений для выбранной

наблюдений

 

 

модели

 

 

 

0

… 60,9

9

5

61

… 151,9

5

5

152 … 299,9

2

5

300

… 1200,0

4

5

Математическое ожидание числа наблюдений в интервале для принятой математической модели находят по формуле (1.75), оно составляет: Mxi = N/k = 20/4 = 5 для i = 1, 2, 3, 4. Фактическое число mi наблюдений в i-м интервале находят непосредственно по исходным наблюдениям, приведенным в табл. 1.5. Сравнение величин mi и Mxi дано в табл. 1.6.

Используя формулу (1.71), вычислим значение χнабл2 :

4

2

 

2

 

2

 

2

 

2

 

χнабл2 =

(mi M xi )

=

(9 5)

+

(5 5)

+

(2 5)

+

(4 5)

= 5,2 .

M xi

5

5

5

5

i =1

 

 

 

 

 

Поскольку для экспоненциального распределения находили оценку одного параметра, значит p = 1. Отсюда число степеней свободы равно f = k p – 1 = 4 – 1 – 1 = 2. По табл. П2 для двух степеней свободы находим:

P [χкр2 (2)> 6,0]= 0,05 или P [χкр2 (2)> 4,6]= 0,10.

Следовательно, вероятность получить значение χнабл2 = 5,2

для принятой теоретической модели заключена между 0,05 и 0,10. Таким образом, следует отвергнуть гипотезу об экспоненциальном законе распределения наработки прибора до отказа. Гипотеза об экспоненциальном законе распределения отвергается с вероятностью 0,9.

80