![](/user_photo/_userpic.png)
книги из ГПНТБ / Рябинин И.А. Надежность судовых электроэнергетических систем и судового электрооборудования учебник
.pdfНулевая гипотеза # 0 , подлежащая проверке, заключается в пред положении, что функции распределения случайных величин X и У одинаковы, т. е. что
H0 = {F(x) = F(y)\ |
(4.30) |
и результаты наблюдений с этим согласуются. Эту гипотезу можно выразить тождеством
Н0= |
{M[F;,(x)} |
= M[F'm(y)])- |
(4.31) |
Рассмотрим ниже два различных критерия проверки однород ности двух выборок: критерий Н. В. Смирнова п критерий Т. В. Ан дерсона.
К р и т е р и й D m , „ Н. В. С м и р н о в а
Применение критерия £>,„,„ Н. В. Смирнова предусматривает графическое построение эмпирических функций распределения FN (х) и F,„ (у) и определение статистики Dm, „ — так называемого наиболь шего абсолютного расхождения функций FM (у) и FN (х):
Din. п = max (Dm , „, D~t, „), |
(4.32) |
где через DJ,t п и D„, „ обозначены односторонние наибольшие рас хождения этих функций (положительные и отрицательные соответ ственно), вычисляемые по следующим формулам:
|
ДА. „ = |
max |
U- |
- |
F\ |
(Х,)\ |
= |
max f F*M |
(ys) |
- |
; |
(4.33) |
|||
|
Dm, „ = |
max |
\F*N (xr) - |
-^=-Ц = |
max f - f |
- |
F"M (y5)). |
(4.34) |
|||||||
На |
рис.29 |
показан |
случай, |
|
когда |
Dm,n |
= |
Dm,л, |
|
||||||
|
D,t |
„=-L- |
— F*n (xr) |
= |
~ |
— Fso {xs) = |
F]N (ys) |
— -s -=-i- |
= |
||||||
|
|
|
|
= |
^ |
W |
- Z |
2 |
T |
= |
0,30, |
|
|
|
|
a Dm, n |
= |
0,20. |
|
|
|
|
|
|
|
|
|
|
|
|
|
Неотрицательные случайные величины Dm, n и Dm, „ распределены дискретно, и множество их возможных значений представляет собой
решетку с шагом Ilk, |
где k — k |
(in, п) — наименьшее |
общее |
крат |
|
ное чисел т и п [в примере, показанном на рис. 29, |
k = |
k (10, 20) = |
|||
= 20]. Следовательно, |
величины |
kD~m,n " kDZ,n |
принимают |
лишь |
неотрицательные целочисленные значения (в соответствии с рис. 29 kDm,n = 20-0,3 = 6).
90
Если гипотеза Н0 верна и объемы выборок т и п неограниченно увеличиваются, то имеют место следующие предельные соотношения:
! | ^ ! 1 / ^ с |
" " " < г |
Ь С ( г |
|
р " 2 > 0 |
|
(4.35) |
|||
, п |
; |
|
|||||||
\\mp\Y- |
тп |
|
An. n<z\=K(z) |
|
При Z > 0 , |
(4.36) |
|||
т + а |
|
||||||||
|
|
|
|
|
|
|
|
||
где С (г) — функция |
распределения Смирнова |
|
|
||||||
|
|
С(г) = |
\-е~™ |
|
|
|
(4.37) |
||
и /( (z) — функция |
распределения |
Колмогорова |
|
|
|||||
|
К{г)= £ |
|
k—2k*z* |
|
|
(4.38) |
|||
|
( - l ) V |
|
|
|
|||||
|
|
|
k=—СО |
|
|
|
|
|
|
Однако для практических |
применений |
необходимо |
знать не |
||||||
только асимптотические |
распределения |
статистик |
Dt'n,n |
и D m , „ , |
Рис. 29. Односторонние наибольшие расхождения |
п , Dm п |
эмпирических функций F*n (х) и F*m (у).
но и их распределения при конечных значениях т и п. Это позволяет определить так называемое критическое значение D m , „ (а) статистики D„Un, соответствующее уровню значимости а:
P\Dm, „ s>Dm , „ ( « ) } < « • |
(4.39) |
91
Для проверки гипотезы Я 0 |
при заданных |
п, |
т и а |
необходимо |
||||||
сравнить полученную из опыта величину Dnun |
(4.32) с критическим |
|||||||||
значением Dnun |
(а) этой |
статистики. Если |
окажется, |
что |
|
|||||
|
|
|
А „ . л < А , , , |
«(а), |
|
|
|
|
(4.40) |
|
то гипотеза |
Я 0 |
об однородности двух выборок |
(4.29) |
не |
бракуется; |
|||||
если же |
|
|
Dm, n^D,„, |
„(а), |
|
|
|
|
(4.41) |
|
|
|
|
|
|
|
|
||||
то гипотезу |
Я 0 |
следует |
отбросить. |
|
|
|
|
|
|
|
Критическое значение |
D„un |
(а) при /;. =^ 20 |
и |
т ^ |
а |
можно вы |
||||
числить с помощью табл. 6.5а |
из работы |
[5]. |
Для |
этого следует |
||||||
определить |
целое число /• (а), |
расположенное на |
пересечении строк |
с заданным набором п и т и столбцов, отвечающих заданному уровню значимости а, и разделить его на наименьшее общее кратное k (т, п), т. е.
и'п< " (а> |
к (Ш. п |
При п > 20 для вычисления Dnun(a) формулой
Dm п (ос) Dv (а) + —г1— 1 |
1— |
где D v (a) — критическое значение для
(4.42)
можно воспользоваться
5 m + n + d(m. n) \ >^Лй>
наибольшего отклонения
тп
эмпирического распределения от теоретического при v — т ) ( , которое можно определить с помощью табл. 6.2 из работы [5], а d (т, п) — наибольший общий делитель чисел т и п.
К р и т е р и й А Т. В. А н д е р с о н а
Применение порядкового критерия А Т. В. Андерсона преду
сматривает |
вычисление |
статистики |
|
|
|
|
||||
А = • |
|
1 |
т |
|
п |
4mn |
— 1 |
(4.44) |
||
|
/ » £ k - - 0 |
2 - m £ ( s / - / ) 2 |
||||||||
тп (т - |
6 (от + |
п) |
||||||||
|
|
|
|
|
где ri — порядковый номер yi и s;- — порядковый номер xf в общем вариационном ряду, построенном по объединенной выборке, пред ставленной в табл. 12.
|
|
|
|
|
|
|
|
Таблица 12 |
|
|
|
Вариационный |
ряд объединенной |
выборки |
|
||
1 |
2 |
3 |
4 |
5 |
|
si |
sn |
• п + m |
*1 |
х2 |
У\ |
х3 |
У*. |
Ui |
Xj |
|
Ут |
92
При tn —> оо, п —> со и ——> с = const (с > 0) предельное 'рас пределение статистики Л существует и равно
|
|
lim Р \А < |
2} = |
ах |
(г). |
|
|
|
(4.45) |
|||
Функция аг |
(г) табулирована |
(см. табл. 6.4а работы [5]). |
|
пользо |
||||||||
При |
конечных значениях т и п вместо А рекомендуется |
|||||||||||
ваться |
статистикой |
|
|
|
|
|
|
|
|
|
|
|
|
|
л |
L ( т + " \ |
L3( fm+n |
\- |
|
|
|||||
|
|
А* |
16 V |
тп ) |
256 V |
тп |
|
|
(4.46) |
|||
|
|
1 + т -|- п |
3 |
/т+п |
\ |
9 |
/ т + п \ 2 ' |
|
|
|||
|
|
8 |
\ |
тп |
) |
128 V |
тп ) |
|
|
|||
Критические значения |
статистики А (а) в зависимости от уровня |
|||||||||||
значимости а приведены |
в табл. 13. |
|
|
|
|
|
|
|||||
|
|
Критические значения статистики А (а) |
Таблица 13 |
|||||||||
|
|
|
|
|||||||||
|
|
в зависимости от уровня значимости а |
|
|
||||||||
а |
|
0,001 |
0,01 |
|
|
0,02 |
|
0,03 |
|
0,05 |
||
А (а) |
1,1679 |
0,7435 |
|
0,6198 |
|
0,5489 |
|
0,4614 |
||||
а |
|
0,10 |
0,20 |
|
|
0,30 |
|
0,40 |
|
0,50 |
||
А (а) |
0,3473 |
0,2412 |
|
0,1843 |
|
0,1467 |
' |
0,1184 |
Для проверки гипотезы Н0 при заданных п, т и а необходимо сравнить полученную из наблюдений величину Л* (4.46) с крити ческим значением А (а) этой статистики.
Если окажется, что
Л* < |
Л (а), |
(4.47) |
то гипотеза Н0 об однородности двух выборок |
(4.29) не отвергается; |
|
если же |
|
|
Л* ^ |
Л (а), |
(4.48) |
то гипотезу На следует забраковать.
Опыт применения критериев D m , „ Смирнова и Л Андерсона пока зывает несколько большую мощность последнего критерия.
Пример 10. Проверим однородность статистических данных табл. 2.
Для примера сравним |
вначале данные наиболее расходящихся вы |
|||
борок, а именно первой и третьей. Эмпирические |
функции распре |
|||
деления |
F\ (t) и F*3 (t) показаны на рис. 30, откуда |
видно, что абсо |
||
лютное |
максимальное |
расхождение |
D 2 0 ,2 0 равно |
|
|
|
•0-0,20 = Аю,20 |
= 0,35. |
|
93
По табл. 6.5а работы [5] для а = 10% находим
/•(10%) = 8; 0,0.20(10%) = - ^ - = 0,40.
Так как полученное из наблюдения абсолютное максимальное
расхождение меньше критического |
D 2 0 > 2 ( | <С D 2 0 i |
2 0 (10%), то гипо |
||
теза |
об однородности |
выборок 1 и 3 табл. 2 на уровне значимости |
||
10% |
не отвергается, |
и их можно |
обрабатывать |
совместно. |
Аналогичная проверка других |
пар выборок |
табл. 2 показала, |
что все выборки являются однородными. Этого и следовало ожидать,
10 |
F.'ltl.Fflt) |
1 |
|
I |
|
|
|
0,8
0,6,
1 |
ч и
J
!ПИ
Lf |
35 |
|
0,2 / |
| |
i |
if |
|
|
fl |
|
1 |
X |
|
1 |
|
|
1 |
|
|
t, 10"V |
Рис. 30. К проверке гипотезы об однородности двух выборок, |
так как они были получены независимым путем из одной и той же
1
генеральной совокупности с функцией распределения F(t) — \—г •2000 Пример 11. Решим задачу, поставленную в пример 10, с помощью критерия Андерсона. Для этого составим общий вариационный ряд по данным первой и третьей выборок табл. 2 и определим статистику А
(табл. 14). |
|
|
|
|
|
|
|
|
|
|
|
По |
формуле |
(4.44) |
имеем |
|
|
|
|
|
|
|
|
А = |
п п п п L . |
п п , [20 • 1974 + |
20 • 3546J - |
^ У ? " , |
1 |
= |
0,2375. |
||||
|
20-20 (20 + 20) |
|
|
|
|
6 (20 + |
20) |
|
|
||
По |
формуле |
(4.46) |
получим |
|
|
|
|
|
|
|
|
|
0.2375 - |
2 0 + |
2 0 |
_3_ / |
20+2 0 |
|
|
|
|
||
|
256V |
20-20 |
|
|
|
|
|
||||
|
|
|
16-20-20 |
|
|
|
: |
0,2343. |
|||
|
1 |
3 / 20 + 20 \ |
9_ / 2 0 + 20 \ ! |
|
|||||||
|
|
|
|
||||||||
|
1 + •2 0 + |
20 |
8 \ |
20-20 ) |
128 \ |
20-20 |
/ |
|
|
|
Для а = 10% критическое значение статистики А равноЛ(10%);
=0,3473 (см. табл. 13). Таким образом,
А* = 0,2343 < А (а) = 0,3473, и гипотеза Н0 не отвергается, как и в примере 10.
94
Таблица 14
Вычисление статистики А для примера 11
1 |
1 |
"1 |
|
7 |
Г., |
S, |
|
Л |
|
|
1 |
|
|
69 |
|
2 |
83 |
|
69 |
|
3 |
122 |
||
|
4 |
|
||
|
5 |
198 |
168 |
|
|
3 |
|
|
7214
8244
9343
10 |
412 |
11 |
496 |
12 |
618 |
13618
14641
15641
16679
17 |
679 |
18725
19816
20893
21923
221 122
231152
241 152
251 396
261 419
271 731
281 770
291 953
302 098
312388
322 640
332 853
343006
|
35 |
|
3 906 |
? |
36 |
|
4379 |
: |
37 |
• |
4715 |
|
38 |
|
4715 |
|
39 |
|
9 041 |
|
40 |
|
10 376 |
Г. — / |
(Г. - <)2 |
(*/ - /)* |
1 |
|
|
|
1—1=0 |
|
3—1=2 |
2—2=0 |
|
4 |
1 |
|
|
4-3=1 |
|
|
5—4=1 |
1 |
6—2=4 |
16 |
|
7—3=4 |
16 |
|
8—4=4 |
16 |
|
9—5=4 |
16 |
|
10—6=4 |
16 |
36 |
|
11—5=6 |
|
|
12—6=6 |
36 |
13—7=6 |
36 |
|
14—8=6 |
36 |
|
15-9=6 |
36 |
|
16—10=6 |
36 |
|
18—11=7 |
17—7=10 |
100 |
49 |
|
|
19—12=7 |
49 |
|
20—13=7 |
49 |
|
21—14=7 |
49 |
196 |
|
22—8=14 |
|
23—15=8 |
64 |
225 |
|
24—9=15 |
|
|
25—10=15 |
225 |
|
26—11=15 " |
225 |
|
27—12=15 |
225 |
|
28—13=15 |
225 |
|
29—14=15 |
225 |
31—16=15 |
30—15=15 |
225 |
225 |
256 |
|
|
32—16=16 |
|
34—17=17 |
33—17=16 |
256 |
289 |
289 |
|
|
35—18=17 |
|
36—18=18 |
324 |
|
37—19=18 |
324 |
|
38—20=18 |
324 |
400 |
|
39—19=20 |
|
|
40—20=20 |
400 |
20 |
20 |
S <'<-''>9 = 1974 |
= 3546 |
1=1 |
/=1 |
95
§ 15. Проверка гипотезы о законе распределения
Как указывалось в гл. 2, наиболее полной характеристикой надежности элементов является функция распределения времени безотказной работы Q (/). О виде этой функции можно судить по эмпирической функции распределения, определяемой соотношением
Q'(t) = Q'a(t\ti, |
to, |
.... |
tn) |
= |
p'{T<t\h, |
t2> |
/„} = |
|
0, |
если |
t^ty, |
|
|
|
|
|
|
-—, если t,<'t |
= |
/.•„. |
1 |
|
(4.49) |
|||
1, |
если |
t > |
/„, |
|
|
|
|
|
где / х = ^ / 2 ==^ • ••<:/„ — наблюденные |
реализации |
случайной ве |
личины Т, расположенные в порядке возрастания их значений (ва
риационный |
ряд). |
|
|
|
|
|
|
График |
эмпирической |
функции распределения — это |
ступенча |
||||
тая линия со скачками, по величине |
равными \1п по всех |
точках I- |
|||||
(см. рис. 29, 30). В каждой |
точке / , . ( £ = 1 , 2 , . . . , п) |
|
|
||||
Q* (tc - |
0) = |
Q* (/,.) = - Ц ^ - |
и Q* (/, + 0) = JL . |
• |
(4.50) |
||
В полусегменте |
/ , - _ i •< / «s; /(- функция Q* (/) сохраняет |
постоян- |
|||||
|
I — 1 |
|
|
|
|
|
|
ное значение |
. |
|
|
|
|
|
|
Нулевая гипотеза Я 0 , подлежащая проверке, заключается в пред |
|||||||
положении, |
что закон |
распределения |
случайной величины |
Т опи |
|||
сывается функцией Q (/), |
т. е. что |
|
|
|
|||
|
|
|
# о = |
Ш [<?„(*)] = Q(0I- |
|
(4.51; |
Рассмотрим теперь несколько критериев непараметрической ста тистики, с помощью которых можно осуществить проверку гипотезы о законе распределения.
К р и т е р и й Dn А. Н. К о л м о г о р о в а Применение критерия Dn А. Н. Колмогорова предусматривает
построение эмпирической функции распределения Qn (/) и гипоте тического закона распределения Q (/), а также определение стати стики Dn, выражающей наибольшее абсолютное расхождение между функциями Q,* (/) и Q (/):
D„ = max (D+ D~), |
(4.52) |
|
где через Dt и Dn обозначены |
|
|
D'n = max |
• i - < M > . |
(4.53) |
|
|
|
D'n' -= max Q(tt)-i^2 |
(4.54) |
|
l*Si s£n |
|
|
96
|
А. Н. Колмогоровым в 1933 г. была доказана следующая предель |
|||
ная |
теорема. |
|
|
|
|
Если функция Q (t) непрерывна, |
то при п -> сю. |
||
|
, |
г - |
, Г |
0 при z=sS0; |
где |
К {z)— функция |
распределения |
Колмогорова (4.38). |
Теорема Колмогорова дает возможность построить критерий
проверки типа распределения по малым выборкам. |
|
|
|
Пусть а — заданный уровень значимости и пусть Dn |
(а) — кри |
||
тическое значение статистики D„, определяемое как решение урав |
|||
нения " |
|
|
|
P\Dn^Dn(a)\ |
= *. |
(4.56) |
|
Если фактически найденное наибольшее расхождение Dn |
ока |
||
жется больше критического значения |
статистики D„ (а) |
или |
равно |
ему, то, согласно критерию Колмогорова, с уровнем значимости а
гипотеза |
Н0 должна быть |
отвергнута. |
|
|
|
Критические значения статистики Dn (а) приведены в табл. 6.2 |
|||||
работы |
[5 ]. |
|
распределения Q (t) |
||
Если начертить по обе стороны от функции |
|||||
кривые |
|
|
|
|
|
|
|
Q (t)-Dn |
(а) и Q (t) + D„ (а) |
(4.57) |
|
как границы зоны допустимых отклонений, то эмпирическая |
функ |
||||
ция |
распределения Q„(t) с вероятностью 1 — а |
будет лежать |
внутри |
||
этой |
зоны. Или наоборот, если около графика |
эмпирической |
функ |
ции распределения Q„ (/) построить параллельные графики, удален ные от него на ±Dn (а), то получим зону, которая с вероятностью 1—а накроет теоретическую функцию распределения Q (/).
Критерий Колмогорова намного проще других критериев, по этому его весьма часто используют на практике. Однако имеется много примеров неоправданного применения данного критерия при сравнительно небольших значениях п.
При построении эмпирической функции распределения Q„ (t) недопустимо объединение статистических данных в разряды, так как критерий Колмогорова предполагает использование индивидуаль ных значений непрерывной случайной величины Тв выборке объема п,
а не |
группированных. |
Ошибки возникают также |
из-за |
незнания |
||
гипотетической |
функции |
Q (t). Дело |
в том, что в теореме |
Колмого |
||
рова |
считается |
известной функция |
распределения |
Q (t). |
Однако |
обычно из теоретических соображений бывает известен только об
щий вид функции Q (i), а входящие в нее числовые параметры |
опре |
||
деляются по имеющемуся статистическому материалу. Поэтому |
кри |
||
терий дает заведомо завышенные значения |
вероятности |
(4.56), и |
|
мы рискуем принять в качестве правдоподобной гипотезу, |
плохо |
||
согласующуюся с опытными данными, т. е. |
существует |
большая |
7 И . А . Р я О ш ц ш |
У7 |
вероятность В совершить ошибку второго рода —• принять гипо тезу Н0 , когда она ложна. В силу этого иногда бывает целесообразно увеличить вероятность ошибки первого рода а и выбрать заранее более высокий уровень значимости (например, а = 0,20), уменьшив тем самым несколько зону допустимых уклонений и вероятность
ошибок второго |
рода. |
1 |
К р и т е р и и cof, М и з е с а |
Выше рассматривались конкурирующие гипотезы, в которых «расстояние» между гипотетическим и истинным распределением выражалось в равномерной метрике (за меру расхождения прини малось экстремальное значение разности М [Qr! (/) ] — Q (/)). Кри терий о)2 Мизеса построен на квадратичной метрике:
1 = 1
При п > оо существует предельное распределение статистики tm'*
limP [/гсо2 <г] =ал(г), |
(4.59) |
п-усо |
|
аналогичное (4.45). |
|
Для проверки гипотезы Н0 (4.51) при заданном |
уровне значи |
мости а необходимо сравнить полученную из наблюдений величину /10)2 с критическим значением псо2 (ее) этой статистики, совпадающим с критическим значением статистики А (а) (см. табл. 13). Если ока жется, что
|
гт2п |
< т о 2 |
(а), |
(4.60) |
то |
гипотеза Н0 не отвергается; |
если |
же |
|
|
/го2 |
5;/ico2 |
(а), |
(4.61) |
то |
гипотезу Н0 следует забраковать. |
|
||
|
Критерий о)2 Мизеса обладает рядом преимуществ перед извест |
|||
ным критерием %2 К. Пирсона, |
излагаемым ниже. Он полнее исполь |
зует информацию, заключающуюся в данных выборках, основы ваясь непосредственно на всех наблюденных значениях рассматри ваемой величины.
Кр и т е р и й ?v„ К. П и р с о н а
В1933 г. К. Пирсоном был предложен еще один весьма удобный критерий проверки, названный им Я,„-критернем. Этот' критерий основан на известной лемме, согласно которой если величина X подчиняется непрерывному закону F (х), то распределение случай ной величины Y = F (X) является равномерным в интервале [0, 1 ].
98
На рис. 31 дана |
наглядная иллюстрация описанной трансформа |
|||||
ции для двух типов функции F (х): экспоненциального закона |
рас |
|||||
пределения F± (х) и нормального |
закона |
распределения F2 (х). Дей |
||||
ствительно, черные и светлые точки на |
оси х распределены |
явно |
||||
различно, а точки |
на оси у, отмеченные |
крестиками, |
распределены |
|||
строго равномерно |
в интервале |
[0, 1 ]. |
|
|
|
|
Из леммы следует, что если мы хотим использовать набор из |
||||||
независимых наблюдении для проверки |
гипотезы Н0 |
(4.51) |
[о том, |
|||
что эта выборка извлечена из генеральной совокупности, |
имеющей |
|
Рис. 31. Графическая иллюстрация к лемме. |
|
||||
распределение |
Q (t)], |
то это молено с т л а т ь путем проверки |
экви |
|||
валентной гипотезы |
Я 0 , |
согласно которой |
величины |
|
||
Ух = Q (*i). |
У2 |
= Q (*а ). • • •. |
Уп = Q ( У |
(4.62) |
||
распределены |
равномерно |
в интервале [0, |
1 ]. |
|
Применение критерия Кп К- Пирсона предусматривает вычисле
ние статистики |
|
|
|
|
|
|
|
K = Q(ti)Q(t*)---Q(tn)= |
|
П(?(/.). |
(4.63) |
||||
К. Пирсон доказал, |
что |
|
|
|
|
|
|
F{K) = P\K<K) |
= |
h |
1пЛ„ |
_|_ |
(In ^ |
(In Я,,)3 |
|
|
1 ! |
' |
2! |
3! |
|||
|
i |
/ |
1 y i - i |
( 1 п |
^п)' |
л—1 |
(4.64) |
|
|
||||||
|
r |
^ |
-1 |
( л — 1)! |
|
Для практических расчетов удобно распределение (4.64) выразить
через интеграл вероятностей |
%2 в следующем |
виде: |
F (*,„) = |
/> ( - 2 In А,,, 2л). |
(4.65) |
99