fd02aed
.pdfРассмотрим часто применяемый критерий согласия χ² (критерий Пирсона) для проверки статистических гипотез. Суть этого критерия состоит в следующем. Пусть нужно проверить гипотезу Н0, состоящую в том, что результаты наблюдений образуют выборку из n значений Х – случайной величины, которая имеет некоторое заданное теоретическое распределение. Ставится задача – определить, насколько близко выборочное распределение случайной величины к ее теоретическому распределению.
Для решения этой задачи все пространство значений наблюдаемой величины разобьем на непересекающиеся области S1, S2, …, Sk. Обозначим через Pi вероятности попадания (при заданном распределении) в области Si , а через mi – число попавших в эти области наблюдений (частоты).
По данным наблюдений и с учетом теоретического распределения случайной величины определим:
k |
(m − nP )2 |
k |
m2 |
|
|
|||||||||||||
χнабл2 = ∑ |
|
|
i |
i |
|
|
= |
|
∑ |
i |
− n . |
(1.70) |
||||||
|
|
nP |
|
|
|
|
nP |
|||||||||||
i=1 |
|
|
|
|
i |
|
|
|
|
|
|
|
i =1 |
i |
|
|
||
Величину f=k−1 называют |
числом степеней свободы, где |
|||||||||||||||||
k – число сравниваемых частот (разрядов). При |
n → ∞ плотность |
|||||||||||||||||
распределения величины χ2 выражается соотношением |
|
|||||||||||||||||
|
|
|
|
x |
k −3 |
e |
− |
x |
|
|
|
|
|
|||||
ϕ(x)= |
|
|
|
2 |
2 |
|
|
|
. |
|
|
(1.71) |
||||||
|
|
k −1 |
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
k −1 |
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
2 |
|
2 Г |
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
2 |
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
На практике при применении критерия согласия χ² пространство выборок разбивают не менее чем на пять непересекающихся областей Sk (k ≥ 5), а число реализаций, попавших в область, должно быть не менее десяти. Для χ²-распределения вычислены таблицы
вероятностей P = P(χнабл2 < χкр2 ) (см. табл. П2). При использовании
таблицы следует иметь в виду следующее. Если в качестве теоретического распределения задано однопараметрическое распределение, то берут число степеней свободы, равное f = k – 1. Если задано многопараметрическое распределение, то число степеней свободы принимают равным f = k – p – 1, где p – число неизвестных параметров.
71
По значению χнабл2 , вычисленному по формуле (1.71), и известному числу степеней свободы f, используя табл. П2, находят P. Если значение P близко к единице, т. е. χ02,9 , χ02,99 , ..., χ02,999 , то вероятность того, что χ2 > χкр2 мала, и, следовательно, гипотезу Н0 нужно
отбросить.
Для применения критерия χ² применяют метод, когда полученные данные группируют по интервалам частот и сравнивают с ожидаемым числом наблюдений для принятого распределения. На основе этого сравнения вычисляют критерий, который приближенно следует χ²-распределению только в том случае, если модель выбрана правильно. Если модель выбрана неправильно, то значение критерия превысит значение случайной величины, распределенной по закону χ². Для оценки правильности принятой модели используют
численные значения процентилей χ2P( f ) – распределения, приведен-
ные в табл. П2.
Критерий Пирсона вычисляют по формуле
k |
′ |
2 |
|
|
χнабл2 = ∑ |
(mi − mi ) |
|
, |
(1.72) |
mi′ |
|
|||
i =1 |
|
|
|
где k − число сравниваемых частот; mi и mi' − эмпирическая и теоретическая частоты в i-м интервале.
Полученные статистические данные делят таким образом, чтобы в каждый интервал попадало не менее пяти наблюдений. Если в каком-либо интервале число наблюдений окажется меньше пяти, то его объединяют с соседним интервалом таким образом, чтобы ожидаемое число наблюдений в объединенном интервале было не менее пяти.
Расчет значений χнабл2 удобно выполнять в форме табл. 1.6. После заполнения всей таблицы вычисляется число степеней свободы:
f = k – p – 1 ,
где k – число сравниваемых частот (в нашем примере k = 7); p – число параметров теоретического распределения (для нормального закона p = 2). В нашем примере f = 7 – 2 – 1 = 4.
72
Область допустимых значений критерия χ2 или область принятия гипотезы характеризуются неравенством
χ2набл < χ2кр (γ1, f ) ,
где χ2набл – значение критерия, вычисленное по данным наблюдений; χ2кр(γ1, f) – критические значения критерия при заданных γ1 и f; γ1 – уровень значимости в технике, обычно принимается равным 0,05.
Номер
интервала
1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
Сумма
Таблица 1.6
Вычисление критерия Пирсона
|
|
|
|
|
|
| mi – mi'|2 |
|
|
m |
– m′ |
|
2 |
|
|
|
|
|
|
|
|
|
|
|
||||
mi |
|
|
mi' |
| mi – mi'| |
|
|
i |
i |
|
|
|
||
|
|
|
|
|
|||||||||
|
|
|
|
mi′ |
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|||
2 |
|
|
3 |
4 |
5 |
|
|
|
6 |
|
|
|
|
3 |
} |
2,94 |
|
|
|
|
|
|
|
|
|
||
11 |
9, 29 |
1,71 |
2,9241 |
|
|
|
0,31 |
|
|||||
8 |
|
6,35 |
|
|
|
|
|||||||
11 |
|
13,48 |
2,48 |
6,1504 |
|
|
|
0,46 |
|
||||
20 |
|
18,80 |
1,20 |
1,4400 |
|
|
|
0,08 |
|
||||
27 |
|
25,88 |
1,12 |
1,2544 |
|
|
|
0,05 |
|
||||
36 |
|
30,17 |
5,83 |
33,9889 |
|
|
|
1,13 |
|
||||
29 |
|
30,59 |
1,59 |
2,5281 |
|
|
|
0,08 |
|
||||
18 |
|
26,63 |
8,63 |
74,4769 |
|
|
|
2,80 |
|
||||
17 |
|
19,92 |
2,92 |
8,5264 |
|
|
|
0,43 |
|
||||
17 |
|
14,79 |
2,21 |
4,8841 |
|
|
|
0,33 |
|
||||
|
8 |
|
7,06 |
0,94 |
0,8836 |
|
|
|
0,12 |
|
|||
4 |
|
3, 42 |
|
|
|
|
|
|
|
|
|
||
1 |
|
|
1, 40 |
|
0,69 |
0,4761 |
|
|
|
0,09 |
|
||
6 |
5,31 |
|
|
|
|
||||||||
1 |
|
|
0, 49 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
200 |
|
|
|
|
|
|
|
|
5,88 |
|
|||
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
73
По табл. П2 находим χ2кр (0,05; 8) = 15,5. Поскольку 5,88 < 15,5,
гипотеза о нормальном распределении анализируемой погрешности справедлива.
Используя метод разбиения на интервалы, можно определить вероятность попадания случайного наблюдения в i-й интервал из соотношения
P(xн ≤ x ≤ xв ), i = 1, 2, …, k, |
(1.73) |
|
i |
i |
|
где xiн − нижняя граница i-го интервала; xiв − верхняя граница i-го
интервала; k – число интервалов.
Границы интервала х1, х2, …, хk определяют с помощью теоретического распределения с использованием следующих оценок параметров:
P(x ≤ x )= 1 |
, |
P(x ≤ x |
2 |
)= |
2 |
, ..., |
P(x ≤ x |
k −1 |
)= |
k −1 |
. |
(1.74) |
|
|
|
||||||||||||
1 |
k |
|
|
|
k |
|
|
|
k |
|
|||
|
|
|
|
|
|
|
|
|
|
Нижняя граница первого интервала и верхняя граница последнего интервала являются соответственно наименьшим и наибольшим значениями, которые может принимать случайная величина. Границы интервалов установлены таким образом, что для каждого интервала вероятность попадания случайной величины в него оценивается как 1/k.
Математическое ожидание Мхi числа наблюдений в каждом интервале для принятой теоретической модели определяют таким образом:
Мхi = N/k, i = 1, 2, …, k . |
(1.75) |
Подсчитывают число наблюдений в каждом интервале mi и вычисляют критерий:
2 |
k |
k |
2 |
|
|
|
χнабл = |
|
|
∑mi |
– N. |
(1.76) |
|
|
||||||
|
N i =1 |
|
|
|
Сравнивают вычисленное значение χнабл2 с табличным значением для заданного уровня значимости и числа степеней свободы. Если вычисленное значение χнабл2 превышает его табличное значение для α = 0,95, то вероятность того, что полученные данные имеют принятое распределение, не превышает 0,05, и модель отвергают как не удовлетворяющую требованиям.
74
Кроме того, можно пользоваться критерием Романовского:
A = |
χ2 |
− f |
(1.77) |
|
. |
||
P |
|
2 f |
|
|
|
|
Если АР < 3, гипотеза принимается. Если АР > 3, гипотеза отвергается.
В нашем случае AР = (5,88 −8) 2 8 = 0,53, следовательно, эм-
пирическое распределение соответствует нормальному закону. Если теоретические значения параметров известны, то лучшим
является критерий Колмогорова λк:
λк = Dк |
N |
≤1, |
(1.78) |
где Dк – наибольшее отклонение теоретической кривой распределения от экспериментальной; N – общее количество экспериментальных точек.
При неизвестных параметрах этот критерий также применим, но в этом случае дает несколько завышенные оценки.
Применение данного критерия рассмотрим на примере, представленном в табл. 1.7.
|
|
|
|
Вычисление критерия Колмогорова |
|
Таблица 1.7 |
||||||
|
|
|
|
|
|
|
||||||
|
Номер |
|
mi |
|
mi' |
|
mi |
|
mi' |
|
mi – mi' |
|
|
|
|
|
|
|
|
||||||
|
интервала |
|
|
|
(накопленные) |
|
(накопленные) |
|
(накопленные) |
|
||
|
1 |
|
2 |
|
3 |
|
4 |
|
5 |
|
6 |
|
|
1 |
|
3 |
|
2,94 |
|
3 |
|
2,94 |
|
+0,06 |
|
|
2 |
|
8 |
|
6,35 |
|
11 |
|
9,29 |
|
+1,71 |
|
|
3 |
|
11 |
|
13,48 |
|
22 |
|
22,77 |
|
–0,77 |
|
|
4 |
|
20 |
|
18,80 |
|
42 |
|
41,57 |
|
+0,48 |
|
|
5 |
|
27 |
|
25,88 |
|
69 |
|
67,45 |
|
+1,55 |
|
|
6 |
|
36 |
|
30,17 |
|
105 |
|
97,62 |
|
+7,38 |
|
|
7 |
|
29 |
|
30,59 |
|
134 |
|
128,21 |
|
+5,79 |
|
|
8 |
|
18 |
|
26,63 |
|
152 |
|
154,84 |
|
–2,84 |
|
|
9 |
|
17 |
|
19,92 |
|
169 |
|
174,76 |
|
–5,76 |
|
|
10 |
|
17 |
|
14,79 |
|
186 |
|
189,55 |
|
–3,55 |
|
|
11 |
|
8 |
|
7,06 |
|
194 |
|
196,61 |
|
–2,61 |
|
|
12 |
|
4 |
|
3,42 |
|
198 |
|
200,03 |
|
|
|
|
|
|
|
|
|
–2,03 |
|
|||||
|
13 |
|
1 |
|
1,40 |
|
199 |
|
201,43 |
|
|
|
|
|
|
|
|
|
–2,43 |
|
|||||
|
14 |
|
1 |
|
0,49 |
|
200 |
|
201,92 |
|
|
|
|
|
|
|
|
|
–1,92 |
|
|||||
|
ма |
|
200 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
75
В колонках 4 и 5 табл. 1.7 приведены накопленные суммы, которые образуются путем прибавления последующих частот к сумме предыдущих. Затем составляется разность между накопленными теоретическими и накопленными эмпирическими суммами (колонка 6) и находится максимальное значение этой разности. В данном примере она равна 7,38.
После этого находим
Dmax = 7,38/N = 7,38/200 = 0,037, N = ∑mi = 200.
Коэффициент λк находится по формуле
λк = Dmax N = 0,036· 200 = 0,50904.
Пользуясь табл. 1.8 для данного значения λк, находим Р(λ) – вероятность того, что гипотетическая функция выбрана правильно. Для λк = 0,5 имеем Р(λ) = 0,9639, т. е. эмпирическая и теоретическая кривая согласуются.
Таблица 1.8 Таблица значений Р(λ) критерия Колмогорова
λ |
Р(λ) |
λ |
Р(λ) |
0,30 |
1,000 |
1,00 |
0,2700 |
0,35 |
0,9997 |
1,10 |
0,1777 |
0,40 |
0,9972 |
1,20 |
0,1122 |
0,45 |
0,9874 |
1,30 |
0,0681 |
0,50 |
0,9639 |
1,40 |
0,0397 |
0,55 |
0,9228 |
1,50 |
0,0222 |
0,58 |
0,8896 |
1,60 |
0,0120 |
0,60 |
0,8643 |
1,70 |
0,0062 |
0,64 |
0,8073 |
1,80 |
0,0032 |
0,65 |
0,7920 |
1,90 |
0,0015 |
0,70 |
0,7112 |
2,00 |
0,0007 |
0,75 |
0,6272 |
2,10 |
0,0003 |
0,80 |
0,5441 |
2,20 |
0,0001 |
0,85 |
0,4653 |
2,30 |
0,0001 |
0,90 |
0,3927 |
2,40 |
0,0000 |
0,95 |
0,3275 |
2,50 |
0,0000 |
76
Пример 1.6. В процессе испытаний десяти генераторов были зафиксированы следующие значения наработок между отказами,
выраженные в часах: 2, 4, 4, 5, 5, 5, 6, 8, 8, 10, 12, 12, 15, 15, 16, 16, 18, 18, 19, 20, 21, 21, 21, 21, 22, 22, 22, 22, 23, 23, 23, 23, 23, 24, 24, 24, 24, 24, 24, 24, 2, 3, 4, 4, 4, 4, 5, 5, 5, 6.
Испытания генераторов проводились в течение t = 500 ч, при этом весь период разбит на пять интервалов. Первые десять реализаций зафиксированы на первом интервале (0, t1) = 100 ч, вторые десять реализацийзафиксированы на втором интервале (t1, t2) = 100 ч и т. д. В качестве теоретического распределения наработки между отказами принят экспоненциальный закон с параметрами потока отказов (параметром распределения на каждом участке, равном λi). Ставится задача – провести проверку соответствия статистических данных наработок между отказами теоретическому распределению с помощью критерия χ2.
Решение. Для вычисления квантиля χ2-распределения воспользуемся формулой (1.70):
5 |
(m |
−nP )2 |
||
χнабл2 = ∑ |
i |
i |
. |
|
nP |
|
|||
i=1 |
|
i |
|
|
Статистические данные разобьем на пять интервалов, и тогда в каждый интервал попадет по десять реализаций, т. е. m1 = m2 =…= = mi =10. Общее число реализаций в процессе испытаний: n = 50. Вероятность отказа на каждом участке (интервале) соответствует параметру интенсивности отказов на данном участке, который определяют по формуле
Pi = λi = ∑miti .
Вычислим λi для каждого интервала:
λ1 = ( 10 ) = 0,17; 2 + 4 + 4 +5 +5 +5 +6 +8 +8 +10
λ2 = ( 10 ) = 0,06; 12 +12 +15 +15 +16 +16 +18 +18 +19 + 20
77
|
|
|
10 |
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
λ3 = |
|
|
|
|
|
|
|
= 0,045; |
|
||||||||
|
|
|
(4 21+ 4 22 + 2 23) |
|
||||||||||||||||
|
|
|
10 |
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
λ4 = |
|
|
|
|
= 0,042; |
|
|
|
|
|||||||
|
|
|
(3 23 + 7 24) |
|
|
|||||||||||||||
|
|
|
10 |
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
λ5 = |
|
|
|
|
= 0,24. |
|
|
|||||||||
|
|
|
(2 + 3 + 4 4 + 3 5 + 6) |
|
|
|||||||||||||||
Далее найдем значение χнабл2 |
: |
|
|
|
|
|
|
|
|
|
||||||||||
χ2 |
= (10 −50 0,17)2 + (10 −50 0,06)2 |
+ (10 −50 0,045)2 |
+ |
|||||||||||||||||
набл |
|
|
|
50 0,17 |
|
|
50 0,06 |
|
|
|
50 0,045 |
|
||||||||
|
|
|
|
|
|
|
|
|||||||||||||
|
+ |
|
(10 −50 0,042)2 |
+ |
(10 −50 0,24)2 |
= 73,3. |
|
|||||||||||||
|
|
50 0,042 |
|
50 0,24 |
|
|
||||||||||||||
|
|
|
|
|
|
|
Принимая в качестве теоретического закона экспоненциальное распределение, найдем число степеней свободы: f = k – 1 = 5 – 1 = 4. Затем для числа степеней свободы f = 4 и квантиля χнабл2 = 73,3 по табл. П2 определим, что вероятность P > 0,999. Следовательно, гипотезу об экспоненциальном распределении для P > 0,999 следует
отбросить, т. к. χкр2 (18,5) < χнабл2 (73,3).
Пример 1.7. По результатам эксплуатации двадцати приборов (n = 20) получены статистические данные о наработке до отказа каждого из них (табл. 1.9). На основе этих данных определить вероятность безотказной работы прибора за 10 ч, предполагая, что время безотказной работы распределено по экспоненциальному закону с помощью критерия χ2.
Таблица 1.9 Время работы ti до отказа каждого из 20 приборов
Номер |
ti, ч |
Номер |
ti, ч |
Номер |
ti, ч |
Номер |
ti, ч |
интервала |
интервала |
интервала |
интервала |
||||
|
1 |
|
20 |
|
95 |
|
268 |
|
4 |
|
40 |
|
106 |
|
459 |
1 |
5 |
2 |
40 |
3 |
125 |
4 |
827 |
|
6 |
|
60 |
|
151 |
|
840 |
|
15 |
|
93 |
|
200 |
|
1089 |
78
Решение. Предположив экспоненциальный закон распределения времени работы прибора до отказа, найдем оценку параметра интенсивности отказа:
λ = ∑nti ; λ = 444420 = 0,0045 ч–1.
На основании того, что n = 20, число интервалов выбираем рав-
ным n/5, поэтому k = 20/5 = 4.
Для функции экспоненциального распределения F(t,λ)=1−e−λt находим границы интервалов, полагая, что:
P(x ≤ x1 )=1−e−0,0045x1 =1k = 0,25;
P(x ≤ x2 )=1−e−0,0045x2 = 2k = 0,50;
P(x ≤ x3 )=1−e−0,0045x3 = 3k = 0,75;
P(x ≤ x4 )=1−e−0,0045x4 = 4k =1,00.
Решая эти уравнения относительно x1, x2, x3, x4, находим интервалы:
x = |
0,25 |
= 55,5; x |
2 |
= |
0,50 |
=110,0; |
1 |
0,0045 |
|
0,0045 |
|
||
|
|
|
|
x3 = 0,00450,75 =165,5; x4 = 0,00451,00 = 222,0 .
Поскольку экспоненциально распределенная случайная величина при λ = 0 изменяется от 0 до ∞, нижняя граница первого интервала равна нулю, а верхняя граница последнего интервала равна ∞. Вероятность попадания случайной величины в любой из интервалов равна 0,25. Исходя из данных табл. 1.9, примем x1 = 61; x2 = 152; x3 = 300 и составим таблицу (табл. 1.10).
79
Таблица 1.10
Сравнение фактических и ожидаемых данных, сгруппированных в интервалы
|
|
Фактическое число mi |
Ожидаемое число Mxi |
|
Интервал |
наблюдений для выбранной |
|||
наблюдений |
||||
|
|
модели |
||
|
|
|
||
0 |
… 60,9 |
9 |
5 |
|
61 |
… 151,9 |
5 |
5 |
|
152 … 299,9 |
2 |
5 |
||
300 |
… 1200,0 |
4 |
5 |
Математическое ожидание числа наблюдений в интервале для принятой математической модели находят по формуле (1.75), оно составляет: Mxi = N/k = 20/4 = 5 для i = 1, 2, 3, 4. Фактическое число mi наблюдений в i-м интервале находят непосредственно по исходным наблюдениям, приведенным в табл. 1.5. Сравнение величин mi и Mxi дано в табл. 1.6.
Используя формулу (1.71), вычислим значение χнабл2 :
4 |
2 |
|
2 |
|
2 |
|
2 |
|
2 |
|
|
χнабл2 = ∑ |
(mi − M xi ) |
= |
(9 −5) |
+ |
(5 −5) |
+ |
(2 −5) |
+ |
(4 −5) |
= 5,2 . |
|
M xi |
5 |
5 |
5 |
5 |
|||||||
i =1 |
|
|
|
|
|
Поскольку для экспоненциального распределения находили оценку одного параметра, значит p = 1. Отсюда число степеней свободы равно f = k – p – 1 = 4 – 1 – 1 = 2. По табл. П2 для двух степеней свободы находим:
P [χкр2 (2)> 6,0]= 0,05 или P [χкр2 (2)> 4,6]= 0,10.
Следовательно, вероятность получить значение χнабл2 = 5,2
для принятой теоретической модели заключена между 0,05 и 0,10. Таким образом, следует отвергнуть гипотезу об экспоненциальном законе распределения наработки прибора до отказа. Гипотеза об экспоненциальном законе распределения отвергается с вероятностью 0,9.
80