Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Рябинин И.А. Надежность судовых электроэнергетических систем и судового электрооборудования учебник

.pdf
Скачиваний:
25
Добавлен:
24.10.2023
Размер:
10.14 Mб
Скачать

Нулевая гипотеза # 0 , подлежащая проверке, заключается в пред­ положении, что функции распределения случайных величин X и У одинаковы, т. е. что

H0 = {F(x) = F(y)\

(4.30)

и результаты наблюдений с этим согласуются. Эту гипотезу можно выразить тождеством

Н0=

{M[F;,(x)}

= M[F'm(y)])-

(4.31)

Рассмотрим ниже два различных критерия проверки однород­ ности двух выборок: критерий Н. В. Смирнова п критерий Т. В. Ан­ дерсона.

К р и т е р и й D m , „ Н. В. С м и р н о в а

Применение критерия £>,„,„ Н. В. Смирнова предусматривает графическое построение эмпирических функций распределения FN (х) и F,„ (у) и определение статистики Dm, „ — так называемого наиболь­ шего абсолютного расхождения функций FM (у) и FN (х):

Din. п = max (Dm , „, D~t, „),

(4.32)

где через DJ,t п и D„, „ обозначены односторонние наибольшие рас­ хождения этих функций (положительные и отрицательные соответ­ ственно), вычисляемые по следующим формулам:

 

ДА. „ =

max

U-

-

F\

(Х,)\

=

max f F*M

(ys)

-

;

(4.33)

 

Dm, „ =

max

\F*N (xr) -

-^=-Ц =

max f - f

-

F"M (y5)).

(4.34)

На

рис.29

показан

случай,

 

когда

Dm,n

=

Dm,л,

 

 

D,t

„=-L-

— F*n (xr)

=

~

— Fso {xs) =

F]N (ys)

— -s -=-i-

=

 

 

 

 

=

^

W

- Z

2

T

=

0,30,

 

 

 

a Dm, n

=

0,20.

 

 

 

 

 

 

 

 

 

 

 

 

 

Неотрицательные случайные величины Dm, n и Dm, „ распределены дискретно, и множество их возможных значений представляет собой

решетку с шагом Ilk,

где k — k

(in, п) — наименьшее

общее

крат­

ное чисел т и п [в примере, показанном на рис. 29,

k =

k (10, 20) =

= 20]. Следовательно,

величины

kD~m,n " kDZ,n

принимают

лишь

неотрицательные целочисленные значения (в соответствии с рис. 29 kDm,n = 20-0,3 = 6).

90

Если гипотеза Н0 верна и объемы выборок т и п неограниченно увеличиваются, то имеют место следующие предельные соотношения:

! | ^ ! 1 / ^ с

" " " < г

Ь С ( г

 

р " 2 > 0

 

(4.35)

, п

;

 

\\mp\Y-

тп

 

An. n<z\=K(z)

 

При Z > 0 ,

(4.36)

т + а

 

 

 

 

 

 

 

 

 

где С (г) — функция

распределения Смирнова

 

 

 

 

С(г) =

\-е~™

 

 

 

(4.37)

и /( (z) — функция

распределения

Колмогорова

 

 

 

К{г)= £

 

k—2k*z*

 

 

(4.38)

 

( - l ) V

 

 

 

 

 

 

k=—СО

 

 

 

 

 

 

Однако для практических

применений

необходимо

знать не

только асимптотические

распределения

статистик

Dt'n,n

и D m , „ ,

Рис. 29. Односторонние наибольшие расхождения

п , Dm п

эмпирических функций F*n (х) и F*m (у).

но и их распределения при конечных значениях т и п. Это позволяет определить так называемое критическое значение D m , „ (а) статистики D„Un, соответствующее уровню значимости а:

P\Dm, „ s>Dm , „ ( « ) } < « •

(4.39)

91

Для проверки гипотезы Я 0

при заданных

п,

т и а

необходимо

сравнить полученную из опыта величину Dnun

(4.32) с критическим

значением Dnun

(а) этой

статистики. Если

окажется,

что

 

 

 

 

А „ . л < А , , ,

«(а),

 

 

 

 

(4.40)

то гипотеза

Я 0

об однородности двух выборок

(4.29)

не

бракуется;

если же

 

 

Dm, n^D,„,

„(а),

 

 

 

 

(4.41)

 

 

 

 

 

 

 

то гипотезу

Я 0

следует

отбросить.

 

 

 

 

 

 

Критическое значение

D„un

(а) при /;. =^ 20

и

т ^

а

можно вы­

числить с помощью табл. 6.5а

из работы

[5].

Для

этого следует

определить

целое число /• (а),

расположенное на

пересечении строк

с заданным набором п и т и столбцов, отвечающих заданному уровню значимости а, и разделить его на наименьшее общее кратное k (т, п), т. е.

и'п< " >

к (Ш. п

При п > 20 для вычисления Dnun(a) формулой

Dm п (ос) Dv (а) + —г11

1—

где D v (a) — критическое значение для

(4.42)

можно воспользоваться

5 m + n + d(m. n) \ >^Лй>

наибольшего отклонения

тп

эмпирического распределения от теоретического при v — т ) ( , которое можно определить с помощью табл. 6.2 из работы [5], а d (т, п) — наибольший общий делитель чисел т и п.

К р и т е р и й А Т. В. А н д е р с о н а

Применение порядкового критерия А Т. В. Андерсона преду­

сматривает

вычисление

статистики

 

 

 

 

А = •

 

1

т

 

п

4mn

1

(4.44)

 

/ » £ k - - 0

2 - m £ ( s / - / ) 2

тп (т -

6 (от +

п)

 

 

 

 

 

где ri — порядковый номер yi и s;- — порядковый номер xf в общем вариационном ряду, построенном по объединенной выборке, пред­ ставленной в табл. 12.

 

 

 

 

 

 

 

 

Таблица 12

 

 

 

Вариационный

ряд объединенной

выборки

 

1

2

3

4

5

 

si

sn

• п + m

*1

х2

У\

х3

У*.

Ui

Xj

 

Ут

92

При tn —> оо, п > со и ——> с = const > 0) предельное 'рас­ пределение статистики Л существует и равно

 

 

lim Р \А <

2} =

ах

(г).

 

 

 

(4.45)

Функция аг

(г) табулирована

(см. табл. 6.4а работы [5]).

 

пользо­

При

конечных значениях т и п вместо А рекомендуется

ваться

статистикой

 

 

 

 

 

 

 

 

 

 

 

 

л

L ( т + " \

L3( fm+n

\-

 

 

 

 

А*

16 V

тп )

256 V

тп

 

 

(4.46)

 

 

1 + т -|- п

3

/т+п

\

9

/ т + п \ 2 '

 

 

 

 

8

\

тп

)

128 V

тп )

 

 

Критические значения

статистики А (а) в зависимости от уровня

значимости а приведены

в табл. 13.

 

 

 

 

 

 

 

 

Критические значения статистики А (а)

Таблица 13

 

 

 

 

 

 

в зависимости от уровня значимости а

 

 

а

 

0,001

0,01

 

 

0,02

 

0,03

 

0,05

А (а)

1,1679

0,7435

 

0,6198

 

0,5489

 

0,4614

а

 

0,10

0,20

 

 

0,30

 

0,40

 

0,50

А (а)

0,3473

0,2412

 

0,1843

 

0,1467

'

0,1184

Для проверки гипотезы Н0 при заданных п, т и а необходимо сравнить полученную из наблюдений величину Л* (4.46) с крити­ ческим значением А (а) этой статистики.

Если окажется, что

Л* <

Л (а),

(4.47)

то гипотеза Н0 об однородности двух выборок

(4.29) не отвергается;

если же

 

 

Л* ^

Л (а),

(4.48)

то гипотезу На следует забраковать.

Опыт применения критериев D m , „ Смирнова и Л Андерсона пока­ зывает несколько большую мощность последнего критерия.

Пример 10. Проверим однородность статистических данных табл. 2.

Для примера сравним

вначале данные наиболее расходящихся вы­

борок, а именно первой и третьей. Эмпирические

функции распре­

деления

F\ (t) и F*3 (t) показаны на рис. 30, откуда

видно, что абсо­

лютное

максимальное

расхождение

D 2 0 ,2 0 равно

 

 

 

•0-0,20 = Аю,20

= 0,35.

 

93

По табл. 6.5а работы [5] для а = 10% находим

/•(10%) = 8; 0,0.20(10%) = - ^ - = 0,40.

Так как полученное из наблюдения абсолютное максимальное

расхождение меньше критического

D 2 0 > 2 ( | <С D 2 0 i

2 0 (10%), то гипо­

теза

об однородности

выборок 1 и 3 табл. 2 на уровне значимости

10%

не отвергается,

и их можно

обрабатывать

совместно.

Аналогичная проверка других

пар выборок

табл. 2 показала,

что все выборки являются однородными. Этого и следовало ожидать,

10

F.'ltl.Fflt)

1

 

I

 

 

0,8

0,6,

1 |

ч и

J

!ПИ

Lf

35

 

0,2 /

|

i

if

 

fl

 

1

X

 

1

 

 

1

 

 

t, 10"V

Рис. 30. К проверке гипотезы об однородности двух выборок,

так как они были получены независимым путем из одной и той же

1

генеральной совокупности с функцией распределения F(t) — \—г •2000 Пример 11. Решим задачу, поставленную в пример 10, с помощью критерия Андерсона. Для этого составим общий вариационный ряд по данным первой и третьей выборок табл. 2 и определим статистику А

(табл. 14).

 

 

 

 

 

 

 

 

 

 

По

формуле

(4.44)

имеем

 

 

 

 

 

 

 

А =

п п п п L .

п п , [20 • 1974 +

20 • 3546J -

^ У ? " ,

1

=

0,2375.

 

20-20 (20 + 20)

 

 

 

 

6 (20 +

20)

 

 

По

формуле

(4.46)

получим

 

 

 

 

 

 

 

 

0.2375 -

2 0 +

2 0

_3_ /

20+2 0

 

 

 

 

 

256V

20-20

 

 

 

 

 

 

 

 

16-20-20

 

 

 

:

0,2343.

 

1

3 / 20 + 20 \

9_ / 2 0 + 20 \ !

 

 

 

 

 

 

1 + •2 0 +

20

8 \

20-20 )

128 \

20-20

/

 

 

 

Для а = 10% критическое значение статистики А равноЛ(10%);

=0,3473 (см. табл. 13). Таким образом,

А* = 0,2343 < А (а) = 0,3473, и гипотеза Н0 не отвергается, как и в примере 10.

94

Таблица 14

Вычисление статистики А для примера 11

1

1

"1

 

7

Г.,

S,

 

Л

 

 

1

 

 

69

 

2

83

 

69

 

3

122

 

4

 

 

5

198

168

 

3

 

 

7214

8244

9343

10

412

11

496

12

618

13618

14641

15641

16679

17

679

18725

19816

20893

21923

221 122

231152

241 152

251 396

261 419

271 731

281 770

291 953

302 098

312388

322 640

332 853

343006

 

35

 

3 906

?

36

 

4379

:

37

4715

 

38

 

4715

 

39

 

9 041

 

40

 

10 376

Г. — /

(Г. - <)2

(*/ - /)*

1

 

 

1—1=0

 

3—1=2

2—2=0

 

4

1

 

4-3=1

 

5—4=1

1

6—2=4

16

 

7—3=4

16

 

8—4=4

16

 

9—5=4

16

 

10—6=4

16

36

 

11—5=6

 

12—6=6

36

13—7=6

36

 

14—8=6

36

 

15-9=6

36

 

16—10=6

36

 

18—11=7

17—7=10

100

49

 

19—12=7

49

 

20—13=7

49

 

21—14=7

49

196

 

22—8=14

23—15=8

64

225

 

24—9=15

 

25—10=15

225

 

26—11=15 "

225

 

27—12=15

225

 

28—13=15

225

 

29—14=15

225

31—16=15

30—15=15

225

225

256

 

32—16=16

34—17=17

33—17=16

256

289

289

 

35—18=17

36—18=18

324

 

37—19=18

324

 

38—20=18

324

400

 

39—19=20

 

40—20=20

400

20

20

S <'<-''>9 = 1974

= 3546

1=1

/=1

95

§ 15. Проверка гипотезы о законе распределения

Как указывалось в гл. 2, наиболее полной характеристикой надежности элементов является функция распределения времени безотказной работы Q (/). О виде этой функции можно судить по эмпирической функции распределения, определяемой соотношением

Q'(t) = Q'a(t\ti,

to,

....

tn)

=

p'{T<t\h,

t2>

/„} =

0,

если

t^ty,

 

 

 

 

 

-—, если t,<'t

=

/.•„.

1

 

(4.49)

1,

если

t >

/„,

 

 

 

 

 

где / х = ^ / 2 ==^ • ••<:/„ — наблюденные

реализации

случайной ве­

личины Т, расположенные в порядке возрастания их значений (ва­

риационный

ряд).

 

 

 

 

 

 

График

эмпирической

функции распределения — это

ступенча­

тая линия со скачками, по величине

равными \1п по всех

точках I-

(см. рис. 29, 30). В каждой

точке / , . ( £ = 1 , 2 , . . . , п)

 

 

Q* (tc -

0) =

Q* (/,.) = - Ц ^ -

и Q* (/, + 0) = JL .

(4.50)

В полусегменте

/ , - _ i •< / «s; /(- функция Q* (/) сохраняет

постоян-

 

I — 1

 

 

 

 

 

 

ное значение

.

 

 

 

 

 

Нулевая гипотеза Я 0 , подлежащая проверке, заключается в пред­

положении,

что закон

распределения

случайной величины

Т опи­

сывается функцией Q (/),

т. е. что

 

 

 

 

 

 

# о =

Ш [<?„(*)] = Q(0I-

 

(4.51;

Рассмотрим теперь несколько критериев непараметрической ста­ тистики, с помощью которых можно осуществить проверку гипотезы о законе распределения.

К р и т е р и й Dn А. Н. К о л м о г о р о в а Применение критерия Dn А. Н. Колмогорова предусматривает

построение эмпирической функции распределения Qn (/) и гипоте­ тического закона распределения Q (/), а также определение стати­ стики Dn, выражающей наибольшее абсолютное расхождение между функциями Q,* (/) и Q (/):

D„ = max (D+ D~),

(4.52)

где через Dt и Dn обозначены

 

 

D'n = max

• i - < M > .

(4.53)

 

 

D'n' -= max Q(tt)-i^2

(4.54)

l*Si s£n

 

 

96

 

А. Н. Колмогоровым в 1933 г. была доказана следующая предель­

ная

теорема.

 

 

 

 

Если функция Q (t) непрерывна,

то при п -> сю.

 

,

г -

, Г

0 при z=sS0;

где

К {z)— функция

распределения

Колмогорова (4.38).

Теорема Колмогорова дает возможность построить критерий

проверки типа распределения по малым выборкам.

 

 

Пусть а — заданный уровень значимости и пусть Dn

(а) — кри­

тическое значение статистики D„, определяемое как решение урав­

нения "

 

 

 

P\Dn^Dn(a)\

= *.

(4.56)

Если фактически найденное наибольшее расхождение Dn

ока­

жется больше критического значения

статистики D„ (а)

или

равно

ему, то, согласно критерию Колмогорова, с уровнем значимости а

гипотеза

Н0 должна быть

отвергнута.

 

 

Критические значения статистики Dn (а) приведены в табл. 6.2

работы

[5 ].

 

распределения Q (t)

Если начертить по обе стороны от функции

кривые

 

 

 

 

 

 

Q (t)-Dn

(а) и Q (t) + D„ (а)

(4.57)

как границы зоны допустимых отклонений, то эмпирическая

функ­

ция

распределения Q„(t) с вероятностью 1 — а

будет лежать

внутри

этой

зоны. Или наоборот, если около графика

эмпирической

функ­

ции распределения Q„ (/) построить параллельные графики, удален­ ные от него на ±Dn (а), то получим зону, которая с вероятностью 1—а накроет теоретическую функцию распределения Q (/).

Критерий Колмогорова намного проще других критериев, по­ этому его весьма часто используют на практике. Однако имеется много примеров неоправданного применения данного критерия при сравнительно небольших значениях п.

При построении эмпирической функции распределения Q„ (t) недопустимо объединение статистических данных в разряды, так как критерий Колмогорова предполагает использование индивидуаль­ ных значений непрерывной случайной величины Тв выборке объема п,

а не

группированных.

Ошибки возникают также

из-за

незнания

гипотетической

функции

Q (t). Дело

в том, что в теореме

Колмого­

рова

считается

известной функция

распределения

Q (t).

Однако

обычно из теоретических соображений бывает известен только об­

щий вид функции Q (i), а входящие в нее числовые параметры

опре­

деляются по имеющемуся статистическому материалу. Поэтому

кри­

терий дает заведомо завышенные значения

вероятности

(4.56), и

мы рискуем принять в качестве правдоподобной гипотезу,

плохо

согласующуюся с опытными данными, т. е.

существует

большая

7 И . А . Р я О ш ц ш

У7

вероятность В совершить ошибку второго рода —• принять гипо­ тезу Н0 , когда она ложна. В силу этого иногда бывает целесообразно увеличить вероятность ошибки первого рода а и выбрать заранее более высокий уровень значимости (например, а = 0,20), уменьшив тем самым несколько зону допустимых уклонений и вероятность

ошибок второго

рода.

1

К р и т е р и и cof, М и з е с а

Выше рассматривались конкурирующие гипотезы, в которых «расстояние» между гипотетическим и истинным распределением выражалось в равномерной метрике (за меру расхождения прини­ малось экстремальное значение разности М [Qr! (/) ] — Q (/)). Кри­ терий о)2 Мизеса построен на квадратичной метрике:

1 = 1

При п > оо существует предельное распределение статистики tm'*

limP [/гсо2 <г] л(г),

(4.59)

п-усо

 

аналогичное (4.45).

 

Для проверки гипотезы Н0 (4.51) при заданном

уровне значи­

мости а необходимо сравнить полученную из наблюдений величину /10)2 с критическим значением псо2 (ее) этой статистики, совпадающим с критическим значением статистики А (а) (см. табл. 13). Если ока­ жется, что

 

гт2п

< т о 2

(а),

(4.60)

то

гипотеза Н0 не отвергается;

если

же

 

 

/го2

5;/ico2

(а),

(4.61)

то

гипотезу Н0 следует забраковать.

 

 

Критерий о)2 Мизеса обладает рядом преимуществ перед извест­

ным критерием %2 К. Пирсона,

излагаемым ниже. Он полнее исполь­

зует информацию, заключающуюся в данных выборках, основы­ ваясь непосредственно на всех наблюденных значениях рассматри­ ваемой величины.

Кр и т е р и й ?v„ К. П и р с о н а

В1933 г. К. Пирсоном был предложен еще один весьма удобный критерий проверки, названный им Я,„-критернем. Этот' критерий основан на известной лемме, согласно которой если величина X подчиняется непрерывному закону F (х), то распределение случай­ ной величины Y = F (X) является равномерным в интервале [0, 1 ].

98

На рис. 31 дана

наглядная иллюстрация описанной трансформа­

ции для двух типов функции F (х): экспоненциального закона

рас­

пределения F± (х) и нормального

закона

распределения F2 (х). Дей­

ствительно, черные и светлые точки на

оси х распределены

явно

различно, а точки

на оси у, отмеченные

крестиками,

распределены

строго равномерно

в интервале

[0, 1 ].

 

 

 

 

Из леммы следует, что если мы хотим использовать набор из

независимых наблюдении для проверки

гипотезы Н0

(4.51)

[о том,

что эта выборка извлечена из генеральной совокупности,

имеющей

 

Рис. 31. Графическая иллюстрация к лемме.

 

распределение

Q (t)],

то это молено с т л а т ь путем проверки

экви­

валентной гипотезы

Я 0 ,

согласно которой

величины

 

Ух = Q (*i).

У2

= Q (*а ). • • •.

Уп = Q ( У

(4.62)

распределены

равномерно

в интервале [0,

1 ].

 

Применение критерия Кп К- Пирсона предусматривает вычисле­

ние статистики

 

 

 

 

 

 

 

K = Q(ti)Q(t*)---Q(tn)=

 

П(?(/.).

(4.63)

К. Пирсон доказал,

что

 

 

 

 

 

F{K) = P\K<K)

=

h

1пЛ„

_|_

(In ^

(In Я,,)3

 

1 !

'

2!

3!

 

i

/

1 y i - i

( 1 п

^п)'

л—1

(4.64)

 

 

 

r

^

-1

( л — 1)!

 

Для практических расчетов удобно распределение (4.64) выразить

через интеграл вероятностей

%2 в следующем

виде:

F (*,„) =

/> ( - 2 In А,,, 2л).

(4.65)

99

Соседние файлы в папке книги из ГПНТБ