Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

2003_-_Gmurman__TV_i_MS

.pdf
Скачиваний:
19
Добавлен:
27.03.2015
Размер:
16.8 Mб
Скачать

ожидание и среднее квадратическое отклонение),

поэтому

r =

2 и число степеней свободы k = 5 - 1 - r = s -

1 - 2 =

=

5-3.

 

Если, например, предполагают, что генеральная сово­ купность распределена по закону Пуассона, то оцени­

вают один параметр л., поэтому r = 1 и k =5-2.

Пос~ольку односторонний критерий более «жестко» отвергает нулевую rипотезу, чем двусторонний, построим

правостороннюю критическую область, исходя из требо­

вания, чтобы вероятность попадания критерия в эту об­

ласть в предположении справедливости нулевой гипотезы

была равна принятому уровню значимости а:

Р [х!l > )(;~p (а; k)] = а.

Таким образом. правосторонняя критическая область

определяется неравенством х2 > )(;~p (а; k), а область при­ нятия нулевой гипотезы-неравенством )(;2 < x~p (а; k).

Обозначим значение критерия, вычисленное по дан­

ным наблюдений, через Х~а6л И Сформулируем правило

проверки нулевой гипотезы.

Правило. Для того чтобы при заданном уровне зна­

чимости проверить нулевую гипотезу Ho~ генеральная

совокупность распределена нормально, надо сначала вы­

числить теоретические частоты, а затем наблюдаемое

значение критерия:

Х~аБJI = ~ (n,-nа2/n, (**)

и по таблице критических точек распределения х2 , по

заданному

уровню значимости а и

числу степеней сво­

боды k = 5 -

3 найти крнтическую точку x~p (а; k).

Если Х~аБJI < X~p-HeT оснований

отвергнуть нулевую

гипотезу.

Если Х~lIБJI > х~р-нулевую гипотезу отвергают.

3 _а м е ч а н и е 1.

Объем выборки долж(>н быть достаточно велик,

во всяком случае .не

менее 50. Каждая группа должна содержать не

менее 5-8 вариант; малочисленные группы следует объединять в од­

ну, суммируя частоты.

3 а м е ч а н и е 2. Поскольку возможны ошибки первого и вто­

рого рода, в особенностн еслн согласование теоретическнх и эмпи­

рических частот «слишком хорошее», следует проявлять осторожность.

Например, можно повторить опыт, увеличить число наблюдений, вос­ пользоваться другими критериями, построить график распределеиия, вычислить асимметрию и эксцесс (см. гл. XVII, § 8).

3 а м е ч 8 н И е 3. Для' контроля вычислении формулу (**) пре­

образуют к виду

331

Рекомендуем читателю выполнить это пре06разование самостоятеJJЬИО,

ДЛЯ чего

иадо

в

(**) возвести

в ~BaдpaT Rазиость частот, сократить

результат

на

n;

и учесть,

что

~nl'=

n, "};nl = n.

Пример. При

уровне

значимости

О,05проверить гипотезу о нор­

мальном распределеиии геиеральиой совокупиости, если известиы эм­

пирические и теоретические частоты:

эмп. частоты ..... 6

13

38

74

106

85

30

14

теорет. частоты ... 3

14

42

82

99

76

37

13

Реш е н и е. Вычислим Х~аб.n, для чего СОС1авим расчетиую

табл. 26.

К о н т р о л ь: Х~аб.n = 7,19:

[~n'/nt]-n = 373,19-366 = 7,19.

Вычислеиия произве,о.еиы правильно.

Найдем число степеней свободы, учитЬ/вая, что число групп вы­

борки (число различных вариаит) s = 8; k = 8 - 3 = 5.

т а.бл и ц а 26

1 2 З 4 5 б 7 8

1

nj

n

,

 

,

( nгn;)"

(

nj-n i

/n,

t

n ,11n,'

,

nj-ni

 

 

 

 

 

 

 

')1'n 2

 

1

6

 

3

 

3

9

 

 

 

3

 

з6

12

2

13

14

-1

1

 

 

 

0,07

 

169

12,07

3

38

42

- 4

16

 

 

 

0,38

 

1444

34,38

4

74

82

- 8

64

 

 

 

0,78

 

5476

66,78

5

106

99

 

7

49

 

 

 

0,49

 

11236

113,49

6

85

76

 

9

81

 

 

 

1,07

 

7225

~5.07

7

30

37

-7

49

 

 

 

1,32

 

900

24,32

8

14

13

 

1

1

 

 

 

0,08

 

196

15,08

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

I

 

 

 

 

 

 

 

 

 

 

 

~

366

366

 

 

 

 

 

 

2

 

 

373,19

 

 

 

 

 

 

ХНаБЛ=

 

 

 

 

 

 

 

 

 

 

 

=7,19

 

 

По та6лице критических

точек

распределения х2 (см.

приложе­

иие 5),

по

уровию

аначимости а. = 0,05 и числу степеней свободы

k=5 иаходим ~p (0,05;

5)= 11,1.

 

 

 

 

 

 

 

Так

как Х:аб.n < ~p-Heт

осиований

отвергиуть нулевую гипо­

тезу. Другими словами,

расхождеиие

эмпирических

и теоретических

частот

незначимое.

Следовательио,

даиные наблюдений согласуются

с гипотезоii

о иормальиом распределеиии

 

геиеральиой совокупности.

332

§ 24. Метрдика вычисления теоретических частот

нормального распределения

Как следует из предыдущего параграфа, СУЩНОСТЬ

критерия согласия Пирсона состоит в сравнении эмпири­ ческих и теоретических частот. ЯСНО, что эмпирические частоты находят из опыта. Как найти теоретические часто­

ты, если предполагается, что генеральная совокупность

распределена нормально? Ниже приведен один из способов

решения этой задачи.

1. Весь интервал наблюдаемых значений Х (выборки

объема n) делят на s частичных интервалов (Х" X1'+1) оди­

наковой длины. Находят середины частичных интервалов

Х; = (Х; +Xi+1)/2; в качестве частоты ni варианты- Х; при-

.

нимают число вариант, которые попали в ,-и интервал.

Витоге получают последовательность равноотстоящих

вариант и соответствующих им частот:

Х4iII: ••• х·s

При этом ~ n; = n.

2. Вычисляют, например методом произведений, выбо-

рочную среднюю х* и выборочное среднее квадратическое

отклонение 0*.

3. Нормируют случайную величину Х, т. е. переходят

к величине Z =

-

х*)/о* и вычисляют концы интервалов

(г{. г{+1):

-

 

-

 

2, =

 

 

(х{ -х*)/о*,

2i+f = (Xl+f-X*)/O*'

причем

наименьшее значение Z, т. е. 2f.

полагают равным

- 00, а

наибольшее,

т. е.

2а• полагают

равным 00.

4. Вычисляют теоретические вероятности Pi попадания

Х в интервалы (Х" Xi+l) по равенству (Ф (z)-функция Лапласа)

и,, наконец, находят искомые теоретические частоты

ni =nPI"

Прнмер. Найти теоретические частоты по задаииому интервально­

му распределению выборки объема n =200, предполагая, что генераль­

ная совокупность распределена нормально (табл. 27).

Реш е и и е 1. Найдем середины интервалов Х7 = (Х, +Х{+1)/2. Например, x~=-(4+6)/2=5. Поступая аналогично, получим последова-

333

тельиоc:rь равноотсrоящих вариант х; и соответствующих им частот nj:

 

xi

5

7

9

11

13

15

]7

19

21

 

 

nl

15

26

25

30

26

21

24

20

13

 

2. Пользуясь методом произведений, иайдем выборочную среднюю

и выборочное среднее квадратическое отклонение:

 

 

 

 

 

х- =

12,63,

0'. =

4,695.

 

 

 

3. Найдем интервалы

(Ч, Zj+l)'

учитывая, что х-= 12,63, 0'.=

= 4,695, 1/0'·=0,213, для чего

соc:rавим расчетную табл. 28.

 

 

 

 

 

 

 

 

 

 

Таблица 27

Номер

Граиицы

 

 

 

Номер

 

Границы

Частота

ннтер-

Частота

нитер-

 

ннтервала

 

интервала

вала

 

 

 

вала

 

 

 

 

 

 

 

 

 

 

 

1

%j

I %j+l

п{

1

%/ I

1

4

6

15

6

14

2

6

8

26

7

16

3

8

10

25

8

]8

4

10

12

30

9

20

5

12

14

26

 

 

 

 

 

 

I

I

%{+1 п!

16

21

18

24

20

20

22

13

n=200

4.

Найдем теоретические вероятности PI и НСкомые теоретические

частоты n; = npi, для

чего составим расчетную табл. 29.

 

 

 

 

 

 

Т а б л и ц а 28

1

Граиицы

--

%i+l-%

Границы интервала

 

интервала

 

--

 

 

 

 

 

 

I%j+1

%/-%

 

 

 

 

%j

 

 

21=

2j+l=

 

 

 

=(%j-X -)/0 -

=(%/+I-Х *)/О"

1

4

6

-

-6,63

- 00

-1,41

2

6

8

-6,63

-4,63

-1,41

-0,99

3

8

10

-4,63

-2,63

-0,99

-0,56

4

10

12

-2,63

-0,63

-0,156

, 13

5

]2

14

-0,63

1,37

-0,13

0,29

6

14

16

1,37

3,37

0,29

0,72

7

16

18

3,37

5,37

0,72

1, 14

8

18

20

5,37

7,37

1,14

1,57

9

20

22

7,37

-

1,57

00

334

 

 

 

 

Таблица

29

Граннцы

 

 

 

 

интервала

 

 

,

 

.. '

Ф(ч'

ф (21 + 1)

Р,=ф(2/ +1)-

 

rt1=rtPI=200

Р;

- Ф (21)

 

 

2;

21+1

 

 

 

 

1

- 00

-1,41

-0,5

-0,4207

0,0793

15,86

2

-1,41 -0,99 -0,4207 -0,3389

0,0818

16,36

3

-0,99 ,56 -0,3389 -0,2123

0,1266

25,32

4

-0,56 -0,13 -0,2123 -0,0517

0,1606

32,12

5

-0,13

0,29

-0,0517

0,1141

0,1658

33,16

6

0,29

0,72

0,1141

0,2642

0,1501

30,02

7

0,72

1,14

0,2642

0,3729

0,1087

21,74

8

1, 14

1,57

0,3729

0,4418

0,0689

13,78

9

1,57

00

0,4418

0,5

0,0582

11 ,64

 

I

 

 

-

 

 

 

 

 

 

~PI=1

~ n:=200

 

 

 

 

 

 

Искомые теоретические частоты помещены в последнем столбце табл. 29.

§ 25. Выборочный коэффициент ранговой корреляции Спирмена и проверка гипотезы

оего значимости

Допустим, что объекты генеральной совокупно­ сти обладают двумя качественными признаками. Под ка­ чественны,М подразумеваегся признак, который невозмож­

но измерить точно, но он позволяет сравнивать объекты между собой Н, СJlедовательно, расположить их. в порядке

убывания или возрастания качества. Для определенности

б у Д е м в с е г Д а

р а с п о л а г а т ь о б ъ е к т ы в пор я д­

к е у х у Д ш е н и я

к а ч е с т в а. При таком «ранжирова­

нию> на первом месте находится объект наилучшего каче­

ства по сравнению с остальными; на втором месте ока­

жется объект «хуже» первого, но «лучше» других, и т. д.

Пусть ~ыборка объема n содержит независимые объ­ екты, которые обладают двумя качественными признака­

ми А и В. ДЛЯ оценки степени связи признаков

вводят, в частности, коэффициенты ранговой корреляции Спирмена (изложен в настоящем параграфе) и Кендалла

(см. § 26).

Для практических целей использование ранговой кор­

реляции весьма полезно. Например, если установлена

335

высокая ранговая корреляция междv двумя качествен­

ными признаками изделий, то достаточно контролировать

изделия только по одному из признаков, что удешевляет

и ускоряет контроль.

Расположим сначала объекты выборки в порядке ухуд­

шения качества по признаку А при допущении, что в с е объекты ~меют ра зличное качество по обоим

при з н а к а м (случай, когда это допущение не выполняет­ ся, рассмотрим ниже). Припишем объекту, стоящему на i-M месте, число-ранг X j , равный порядковому номеру объекта.

Например, ранг объекта, занимающего первое место, Х1 = 1; объект, расположенный на втором месте, имеет ранг Х2 = 2, и т. д. В итоге получим последовательность рангов по

признаку А: Х1 = 1, Х2 = 2, ... , ХN= n.

Расположим теперь объекты в порядке убывания ка­

чества по признаку В и припишем каждому из них

ранг Yj, однако (для удобства сравнения рангов) и н Д е к с i

при У будет по-прежнему равен порядко­ вому номеру объекта по признаку А. Напри­ мер, запись У2 = 5 означает, что по признаку А объект

стоит на втором месте, а по признаку В-на пятом.

В итоге получим две последовательности рангов:

по признаку А ... Х1, Х2, ••• , ХN

по признаку В ... Уl' У2' "', Уn

Заметим, что в первой строке индекс i совпадает с по­

рядковым номером объекта, а во второй, вообще говоря,

не совпадает. Итак, в общем случае Х; =1= Yj.

Рассмотрим два «крайних случая».

1. Пусть ранги по признакам А и В совпадают при

всех значениях индекса i:Xj = Yj. в этом случае ухуд­

шение качества по одному признаку влечет ухудшение

качества по другому. Очевидно, признаки связаны: имеет

место «ПОlIная прямая зависимость».

, 2. Пусть ранги

по признакам А и В противоположны

в том смысле, что

если

Х1 =

1, то

Y1 =

n; если Х2 = 2, то

Уа = n-l; ... , если хn =

n,

то Уn =

1. В этом случае ухуд­

шение качества по одному

признаку

влечет

улучшение

по другому. Очевидно,

признаки

связаны -

имеет место

«противоположная зависимостЬ».

На практике чаще будет встречаться промежуточный

случай, когда ухудшение качества по одному признаку

влечет для некоторых объектов ухудшение, а для дру­ гих-улучшение качества. Задача состоит в том, чтобы

336

оценить связь между признаками. Для ее решения рас­

смотрим ранги хн Х2, ••• , Хn как возможные значения

случайной величины Х, а Ур у2, ••• , уn-как возможные

значения случайной величины У. Таким образом, о связи между качественными признаками А и В можно судить по связи между случайными величинами Х и У, дЛЯ оценки

которой используем коэффициент корреляции. Вычислим выборочный коэффициент корреляции слу­

чайных величин Х и У в условных вариантах (см. гл.

XVIlI. § 8):

приняв в качестве условных вариант отклонен.ия И; =

= х,.-Х, и; = У,.-У. Каждому рангу Х; соответствует только один ранг Yj, поэтому частота любой пары ран­ гов с одинаковыми индексами, а следовательно, и любой

пары ус;ловных вариант с одинаковыми индексами равна

единице: n u .v

. = 1. Очевидно, что частота любой пары

I

I

в~риант с разными индексами равна нулю. Учитывая,

кроме того, что среднее значение отклонения равно нулю

(см. гл. XVI, § 7, следствие), т. е. u=v=O, получим

более простую формулу вычисления выборочного коэф­

фициента корреляции:

Таким

образом, надо найти ~ UjVj, <1а

И <1f1'

Выразим ~UiVj через известные числа-объем выбор­

ки n

и разности рангов d j =X,.-=Yj.

Заметим, что по-

скольку средние значения рангов Х = (1

+ 2 + ... +n)/n

и У = (1 + 2 + ... + n)jn равны между собой, то У-Х = о.

Используем последнее равенство:

dj = Х; -У; = Xj-Yi + (У-Х) = (Xj-X)-(Yi-Y) = Uj-Vj.

Следовательно,

dl=(u,-vy.

Учитывая, что (см. далее пояснение)

~ Ui2 = ~ Vl = (nЗ -n)jI2,

22 2ЛО

имеем

~dl=~(Uj-V;)1 = ~ur-2~Uivj+~vl=

-= [(nз -n}/6]-2 ~ U1V/.

Отсюда

 

(***)

Остается найти аа

И <Jv ..!10 определению выборочной

дисперсии, учитывая,

что и = О, и используя (**), по­

лучим

 

Da = ~(щ-u)2/fl. = ~ ипn = (n 3-n)jl2n = (n l -l)/l2.

Отсюда среднее квадратическое отклонение

(Уа = V (n 2 -1)/12.

Аналогично найдем

Следовательно,

n<Ju<J = (n 3

-- n)J12.

v

 

Подстав_ив правые части этого равенства и соотно­ шения (***) в (*), окончательно получим выборочный коэф­ фициент ранговой корреляции Сnирмена

Рв =

1-[(6 ~dl)/(n3-n)],

(****)

где d j = Xj-Yj.

 

 

 

П о я С н е н и е.

Покажем,

что ~ и? = (n 3 --n)/12. Дей­

ствительно, учитывая, что

 

 

~Xj= 1 +2+ ... +n = (1 +n) n/2,

 

х = ~xj/n =

(1 + n)/2,

 

~ X~ = 12 + 22 + ... + n 2

= [n (n + 1) (2n + 1)]/6,

 

~ иl = ~ (Х, -х)2 = ~xl2х ~Xj+ n (х)2,

после элементарных выкладок получим

~и'=(nЗ-.n)/12.

Аналогично можно показать, что

~V, = (nЗ -n)/12.

338

Приведем свойства выборочного ко9ффициента корре­

ляции Спирмена.

С в о й с т в О 1. Если между качествеННЫ'ми nризна­

ка,Ми А и В и'меется «полная nрЯ'мая зависи'мость» в то'м

С'мысле, что ранги объектов совnадают при всех значе­

ниях i, то выборочный коэффициент ранговой корреляции

Сnир,Мена равен единице.

Действительно, подставив d l = Xl - Yl = О В (****), по­

лучим

Рв= 1.

Св о й с т в о 2. Если 'между качествеННЫ'ми nризнака,Ми

Аи В и'меется «противоположная зависи'мость» в то'м

С'мысле,

что рангу Х. = 1 соответствует ранг Yl = n;

рангу Х"

соответствует ранг У'.1. = n - 1; ... ; рангу Хn = n

соответствует ранг Уn= 1, то выборочный коэффициент

ранговой корреляции Сnир,м,ена равен 'минус единице.

Действительно,

d 1 = l- n, d'il= 3-n, ... , dn = (2n-1)-n.

Следовательно,

~dl=(I-n)2+(3-n)2+ ... +[(2n-l)-n]2=

= [1" +32 + ... + (2n-l)"]-2n [1 +3+ ... + (2n -1)]+

+ n ·n" = [n (4n 2 -1)/3]-2n ·n" + nВ = (n B -n)/3.

Подставив ~ dl = (n B -n)/3 в (****), окончательно по­

лучим

рв=-I.

С в о й с т в о 3. Если 'между качес,mвенны,Ми nризнака,Ми

Аи В нет ни «полной прямоЙ», ни «противоположной»

зависи'мостей,

то

коэффициент Рв заключен 'между - 1

и + 1, nриче'м

че'м

ближе к нулю его абсолютная величина,

те,м зависи'мость .меньше.

Пример 1. Найти выборочный коэффициент ранговой корреляции

Спнрмена по данным ранга объектов выборки объема n = 10:

Xl

1 2 3 4 5 6

7 8 9 10

Yi 6 4 8 ] 2 5

10 3 7 9

Реш е н и е. Найдем разности рангов dl=XI-Уi: -5. -2. -5.

3, 3, 1. - 3, 5, 2, 1.

Вычислим сумму квадратов разностей рангов:

~dr=25+4+25+9+9+ 1+9+25+4+ 1= 112.

22*

ЗЗ9

НаЙд.ем нскомый коэффицнент ранговой корреляцин, учитывая, что n= 10:

Рв= 1 -[6 ~ d~/(nз-n)J = 1 - [6·112/(1000-10)] =0,32.

3 а м е ч а н н е. Если выборка содержит объекты с о Д н н а к 0-

в ы м к а ч е с т в о м, то каждому из них приписывается ранг, рав­

ный среднему арифметнческому порядковых номеров объектов. Напри­

мер, если объекты одинакового качества по признаку А имеют

порядковые иомера 5 и 6, то НХ рангн соответственно равны: Ха =

= (5+6)/2=5,5; хе =5,5.

Приведем правило, позволяющее установить значи­

мость или незначимость ранговой корреляции связи для

выборок объема n ~ 9.

Если

n < 9, то пользуются таб­

лицами (см., например, табл.

6.10а, 6.10б в книге: Б о л ь­

ш е в

Л. Н., С м и р н о в

Н.

В. Таблицы математической

статистики. М., «Наука», 1965).

Правило. Для того

чтобы при уровне значимости а

проверить нулевую

гипотезу

о равенстве нулю генераль­

ного

коэффициента

ранговой

корреляции Рг Спирмена

при

конкурирующей

гипотезе

Н1: Рг =1= О, надо вычислить

критическую точку:

Ткр = t кр (а.; k) V (1- p~)/(n - 2),

где n-объем выборки, рв-выборочный коэффициент ран­

говой корреляции Спирмена, t Kp (а; k)-критическая точка

д в у с т о р о н н е й критической области, которую находят

по таблице критических точек распределения Стьюдента,

по уровню значимости а И числу степеней свободыk=n-2.

Если IРв I < Т"Р- нет оснований отвергнуть нулевую

гипотезу. Ранговая корреляционная связь между качест­

венными признаками незначима.

Если IРвl > Т"р-нулевую гипотезу отвергают. Между

качественными признаками существует значимая ранговая

корреляционная связь.

"ример 2. При уровне значимостн 0,05 провернть, является ли

ранговая корреляционная связь, вычисленная в примере 1, значимой?

Реш е н и е. Найдем критическую точку двусторонней критичес­ кой'области распределения Стьюдента по уровню значимостн а. = 0,05

ичислу степеней сво60ДЫ k=n-2=IO-2=8 (см. приложение 6):

t"p (0,05; 8) = 2 ,31.

~айдем критнческую точку:

т"р= tKp (а; k) У(1 -р:)/(n-2) .

Подставив t Kp =2,31, n= 10, рв=О,24, получим Т"р=О,79.

Итак, Т"р=О,79, рв=О,24.

Так как Рв < Ткр - нет оснований отвергнуть нулевую гипотезу;

ранговая корреляционная связь между признаками незначимая.

340