Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

uchebnik10

.pdf
Скачиваний:
35
Добавлен:
21.03.2015
Размер:
8.26 Mб
Скачать

'де d=Rx-Rу - разность между рангами сопряженных значе­

!ИЙ признаков Х и У; n- число парных членов ряда, или объем

JЫборки 1.

В основу конструкции этого показателя положены весьма про­

'Тые соображения. Ранжируя попарно связанные значения при­

:наков, можно видеть, как они распределяются относительно

фуг друга. Если возрастающим значениям одного признака Х

'оответствуют возрастающие значения другого У, то между ними :уществует положительная связь. Если же при возрастании зна­ rений одного признака значения другого последовательно умень­ lIаются, это указывает на наличие отрицательной связи между

[Ими. При отсутствии корреляции ранжированным значениям

IДHOГO признака будут соответствовать самые различные значе­

шя другого.

Таблица 106

ГОДОВ~lе удои коров. кг

материнского

дочериего

(xi-x)

(угу)

покоnеиия Х

покоnения

У

 

3770

2991

3817

4593

2450

3529

3463

4274

3500

3103

5544

3949

2112

3491

3150

3559

3 118

2916

3018

4580

4291

4510

3463

4144

1:=42696

45639

+

-

+

+

-

-

-

+

-

-

+

+

-

-

-

-

-

-

-

+

+

+

-

+

-

-

 

- -

11"_ -:O4!I!!t ~

ОбознаЧИtl ранжированные значения признаков порядковыми

-'ислами 1, 2, 3, 4, ..., нетрудно определить ранги этих значений

-1 по их разности судить о степени зависимости одного признака

JT изменений другого. Очевидно, при ПОЛНОЙ связи ранги кор­

)елируемых признаков совпадут и разность между ними будет JaBHa нулю. В таких случаях коэффициент корреляции рангов

жажется равным единице. Если же признаки варьируют неза-

I Эквивалентная формула коэффициента корреляцин рангов:

r s =

3

[4'f.RxRg

]

 

1 -

(n + 1) •

- n-I

n(n + )

 

239

висимо друг от друга, то величина 6 ~d2

1, и коэффициент

n (n2 - 1)

корреляции рангов будет равен нулю. Таким образом, как и пир­ соновский коэффициент корреляции и КОЭффициент корреляции

Фехнера, коэффициент корреляции рангов выражается в долях

единицы и может принимать значения от -1 до + 1, т. е. сопро­

вождается положительным или отрицательным зиаком.

Как и другие выборочные показатели, эмпирический коэффи­

циент корреляции рангов служит оценкой генерального парамет­ ра ps и, как величина случайная, меняет свои значения при по­

вторных выборках вариант из одной и той же генеральной сово­

купности. Значимость этого показателя, имеющего распределе­ ние со средней ps=o и дисперснейо~s =1/l..n-1), оценивают пу-

тем сравнения выборочного коэффициента rs с критической точкой r81, которую можно определить по формуле

гsl =

t

(1- т ),

 

Уn-l

n - l

где n- объем выборки; t и т -

величины, связанные с уровнем

значимости а следующим образом: для а=5% t= 1,96 и m=0,16; для сх= 1% t=2,58 и m=0,69. Нулевую гипотезу отвергают, ес-

 

 

ли эмпирически наиденная величина rs

превзоидет или окажется

rst

для принятого уровня значи-

равнои критическому значению

мости а и объема выборки n. Чтобы каждый раз не рассчитывать

критические точки rst, составлена специальная таблица, которая

приводится в Приложениях (см. табл. XXIII).

Приведенный способ оценки значимости выборочного rs не

единственный. При n~ 10 значимость эмпириче~кого коэффици­

ента корреляции рангов можно оценить с помощью t-критерия

Стьюдента, т. е. по отношению этого показателя к своей стати-

стической ошибке tф=IГRl/ n-22i ';;:-fSI для n-2 и принятого

V 1- ' s

уровня значимости (а). Рассмотрим применение '-s на конкретных

примерах.

ПРUlrlер 11. Изучали зависимость между массой живого тела

исодержанием гемоглобина (по Сали) в крови павианов-гамад­

рилов. Результаты наблюдений и их обработка приведены в табл. 107.

Если бы отдельные члены ряда не повторялись, их рангами были бы порядковые числа. Но так как некоторые варианты по­

вторяются, их рангами будут средние арифметические из соот­ ветствующих чисел натурального ряда. У одинаковых членов ря­

да должны быть и одинаковые ранги. Так, в ряду Х вариаиты 18

и19 повторяются дважды и их ранги равны полусуммам соот­

ветствующих порядковых чисел: (2+3)/2=2,5 и (4+5)/2=4,5

240

! Т. д. В последнем столбце табл. 107 показан расчет рангов для

rле~~~JЯ:а~;:; рассчитаны правильно, их 'суммы должны быть

Jдинаковыми, т. е. Rx=Ry и ~d=O. Если же ~d*O, следует ис­

;ать ошибку в присвоении рангов или в их разностях. Поэтому, lрежде чем рассчитывать ~d2, следует проверить 'Ld, которая дол­

хна быть равна нулю. Так, в данном примере Rx= 55 и Ry= 55,

< ~d = +9-9=0, что указывает на отсутствие ошибки в расче­

:'е рангов. Подставляя ~d2=54,00 в формулу (163), находим

 

г =1-

6·54,00

1 - 324 =1-033=067.

 

 

s

 

10(102-1)

 

990

'

,

 

 

 

 

 

 

 

 

 

Таблица 107

Номера

 

 

 

Раиги рядов

 

 

Расчет раигов У

Масса Х,

 

 

 

Rх-R у -

 

 

 

ИССJlедо-

У

 

 

d2

 

 

 

кг

 

 

-d

 

 

ваии!!

 

 

 

 

 

 

 

 

 

 

Rx

R"

 

 

У

R"

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

17

70

1

1

0,,0

0,00

70

1

2

 

18

74

2,5

3

-05,

0,25

72

2

3

 

18

78

2,5

7

-45,

20,25

74

3

4

 

19

72

4,5

2

+2,5

6,25

76

4

5

 

19

77

4,5

5,5

-1,0

1,00

77

5,5

6

 

20

76

6

4

+2,0

4,00

77

5,5

7

 

21

88

7

10

-3,0

9,00

78

7

8

 

22

80

8

8

0,0

0,00

80

8

9

 

23

77

9

5,5

+3,5

12,25

86

9

10

 

25

86

10

9

+1,0

1,00

88

10

Сумма

 

 

-

55

55

0,0

54,00

-

-

10лученная

величина

(0,67)

превосходит

критическую

точку

'0,64) для п=10 и 5%-ного уровня значимости

(см. табл. XXIII

lриложений), что позволяет отвергнуть нулевую гипотезу

0,01 <Р<0,05). К такому же выводу приводит и оценка значи­ юсти '8=0,67 по величине t-критерия Стьюдента:

0,67 VIO - 2

0,67 ,2,83

1,896

=257.

1 - ,67)2

0,551

0,142

 

'

в табл, V Приложений

k=n-2=8 и

а=5%

находим tst=

-=2,23. Так как tф>ist, нулевую гипотезу отвергают на 5%-ном

'ровне значимости. Следовательно, с вероятностью Р>0,95 мож­

[Q утверждать, что между массой тела и количеством гемоглоби­

[а в крови у павианов-гамадрилов существует положительная ;орреляционная связь.

241

Рассчитывая коэффициент корреляции рангов, следует имеТi:

в виду, что на его значении сказывается наличие групп с один"

КОВЫми рангами, и тем сильнее, чем больше таких групп срею

сопряженных значений признаков Х и У. Чтобы получить боле~

или менее точную оценку генерального пара метра ps, нужно пDl

наличии указанных групп вносить поправку в формулу (163,

Эту поправку, обозначаемую буквой Т, прибавляют к числитеЛI<

формулы, т. е.

 

 

 

*

1

6 ~d2 + Т

 

 

(163а

 

 

 

' s = -

n(n2 -1) ,

 

 

 

 

 

 

 

 

где

Т= Vx + Vy , а

Vx -

поправка для одного признака (ряд Х)

Vy -

для другого

(ряд У). ДЛЯ определения Vx и

Vy

составлен,­

специальная таблица,

в которой 1 обозначает число групп с оду.

наковыми рангами, а t -

число рангов в этих группах (табл. 108)

 

 

 

 

 

 

 

 

Таблица 10;

~ 1

2

 

3

4

5

6

7

2

0,5

1,0

 

1,5

2,0

2,5

3,0

3,5

3

2,0

4,0

 

6,0

8,0

10,0

12,0

14,0

4

5,0

10,0

 

15,0

20,0

25,0

30,0

35,0

5

10,0

20,0

 

30,0

40,0

50,0

60,0

70,0

Так, в отношении только что рассмотренного примера (табл

107) в ряду Х-две группы с одинаковыми рангами, т. е. 1=::'

в каждой группе - по два ранга, т. е. t=2. В табл. 108 для этогr ряда находим ~lx= 1,0. В ряду У- одна группа с одинаковымг

рангами, т. е. [=1; в ней два ранга, т. е. t=2. В табл. 108 дл>­

ряда У находим Vy =0,5. Всего Т= 1,0+0,5= 1,5. Эту поправк'

вносим в формулу (163) и определяем коэффициент корреляцю

рангов:

г*=1- 6·54+1,5 =1- 325,5 =1-0329=0671~067.

s

1О (102 - 1)

990

'

,

,

В данном случае число групп с одинаковыми вариантами HeBt-

лико, поэтому 'поправка практически не сказалась на величине i&

Прuмер 12. Воспользуемся данными табл. 105 и вычислим Ю.J

эффициент корреляции рангов между жирномолочностью КОрОЕ материнской линии и их дочернего потомства. Предварительнr

освободимся от дробей, уменьшив каждую варианту на три еду.

НИЦbI и умножив сотые доли на 100. Тогда вместо 3,10 получи~

10, вместо 3,65-65 и т. д. Такое преобразование чисел никак Ht

скажется на конечном результате, а вычисление 1:.d2 значитеЛЬНt

упростится (табл. 109).

242

Как и в предыдущем примере, здесь поправка Т= 1,5, откуда

г"=I-

6·129+1,5

=1- 775,5 =1-0452=0548;::::;055.

s

12(122-1)

1716

'

,

,

Эта величина

(0,55)

для n= 12 и а=5% не превосходит крити­

ческую точку

(0,58)

(см. табл. ХХI Приложений) . Такой же ре­

зультат дает оценка Г8=0,55 по величине t-критерия Стьюдента:

t

ф

=0,55

1 /

12 - 2

0,55 V14,3=0,55.3,76=2,08.

 

 

V

1 - (0,55)2

 

Эта величина не превосходит

критическую точку tst = 2,23 для

k= 12-2= 10 и а=5% (см. табл. V Приложений) . Обе оценки не

дают основания для отвергания нулевой гипотезы. Полученный

результат не согласуется с оценкой пирсоновского коэффициента

корреляции (Гху=0,598), который оказался статистически зна­

чимым на 5%-ном уровне (0,01<Р<0,05).

 

 

 

 

 

 

Таблица 109

 

Жирномолочность

Ранги рядов

 

 

 

коров

 

 

 

 

 

 

 

Номера

 

 

 

 

d

d2

исследо-

 

 

 

 

ваиий

материи-

дочерних

R"

RlI

 

 

 

СКО!!

 

 

 

особей

 

 

 

линин Х

У

 

 

 

 

 

 

 

 

 

 

1

10

65

1

8

-7

49,00

2

17

11

2

1

+1

1,00

3

27

44

3

3

О

0,00

4

34

36

4

2

+2

4,00

5

45

45

5

4

+1

1,00

6

61

71

6,5

9

-2,5

6,25

7

61

61

6,5

6,5

О

0,00

8

65

98

8,5

12

-35,

12,25

9

65

89

8,5

11

-2,5

6,25

10

76

57

10

5

+5

25,00

11

80

61

11

6,5

+4,5

20,25

12

105

79

12

10

+2

4,00

Сумма

-

-

78

78

О

129,0

Какому показателю следует отдать предпочтение? Ответ на

этот вопрос не может быть однозначным. Дело в том, что пара­ метрический пирсоновский коэффициент корреляции достаточно точно характеризует линейную связь, когда коррелируемые при­ знаки Х и У имеют нормальное или лог-нормальное распределе­ ние, т. е. такое, при котором не сама случайная величина, а ло­ гарифмы ее значений распределяются нормально. Примеры та-

243

кого рода приведены в гл. IX. Коэффициент корреляции рангов

характеризует корреляционную связь независимо от закона рас­

пределения. И все же, если коррелируемые признаки распреде­

ляются нормально, предпочтение следует отдавать пирсоновско­

му коэффициенту корреляции, как более мощнаму показателю связи между переменными У и Х по сравнению с коэффициентом Спирмена. В тех случаях, когда коррелируемые признаки не рас­

пределяются нормально, следует исследовать непараметрические

показатели связи.

Коэффициент ранговой корреляции Спирмена и другие непа­

раметрические показатели независимы от закона распределения,

и в этом их большая ценность. Они позволяют измерять тесноту

сопряженности между такими признаками, которые не поддаются

непосредственному измерению, но могут быть выражены баллами

или другими условными единицами, позволяющими ранжироватр

выборку. Ценность коэффициента корреляции рангов заключает­ ся также в том, что он позволяет быстро оценивать взаимосвязь

между признаками независимо от закона распределения.

Коэффициент ассоциации. Тесноту связи между качественны­

ми признаками У и Х, группируемыми в четырехпольную корре­

ляционную таблицу, измеряют с помощью коэффициента ассоци­

ации, или теl'рахорического nоказателя связи, предложенного

1(. Пнрсоном в 1901 г. В простейшем виде формула, по которой

рассчитывают этот показатель, обозначаемый символом r А, вы­

глядит с.lедующим образом:

ad - Ьс

(164)

r А= -у:Г=(a=+=b=)(=C=+=d==)=(=a=+=c=)=(b:::::+=d==-)

Здесь а, Ь, с и d - численности коррелируемых групп (вариант). распределяемых 110 клеткам четырехпольной таблицы.

Коэффициент ассоциации, как и другие подобные показатели.

имеет прямое отношение к пирсоновскому критерию "1.2, на кото-

ром он основан; в данном случае rА= Vх21n. Коэффициент ассо­

циации, как и пирсоновский коэффициент корреляции, изменяет­ ся от -1 до + 1. Значимость выборочного коэффициента ассоциа­

ции оценивают по величине критерия Пирсона "1.2. Нулевая гипо­

теза сводится к предположению, что в генеральной совокупности

этот показатель РА равен нулю. Но-гипотезу отвергают, если "1.2=

=nr2A;?:;x2st для принятого уровня значимости (а) и числа сте­ пеней свободы k= (2-1) (2-1) = 1.

Значимость rА можно проверить и с помощью t-критерия Стьюдента. Нулевую гипотезу отвергают, если

244

;:ля принятого уровня значимостн (а) и числа степеней свободы

.'--n-2.

Прuмер 13. От скрещивания самцов плодовой мушки дрозо­

оилы, имеющих окраску тела и зачаточные крылья (рецессивные

Iризнаки), с нормальными самками того же вида, гетерозигот­

IЫМИ по генам этих признаков, в потомстве оказались мухи:

Серые с нормальнымн крыльямн

Серые с зачаточными крыльями.

Черные с нормальными крыльямн

Черные С зачаточными крыльями

. .

75

. .

 

 

 

16

.•

 

 

 

14

..

 

68

Выяснить, имеется ли связь между окраской тела и развитием

,рыльев у дрозофилы. Гууппируем эти данные 11 подсчитываем rисленность мух 110 столбцам и строкам четырехпольной таблицы

,табл. 110).

 

 

 

 

 

Таблица 110

 

 

Крылья У

 

 

 

Окраска тела Х

 

 

 

Сумма

 

нормальные

зачаточные

 

 

 

Серая

а=75

Ь=16

 

 

а+Ь=91

Чериая

с=14

d=68

 

 

c+d=82

Сумма

а+с=89

b+d=84

 

I

n=173

 

 

 

 

 

Подставляя известные значения в формулу (164), находим

r =

75·68 - 14·16 _

4876

4876

=0653.

А

V 89. 84 . 91 . 82

V55 785 912

7469

 

'

Ранее было показано, что распределение вероятных значений

:ритерия '13является непрерывным (см. рис. 22). Качественные

:~e признаки дискретны, их числовые значения не распределяют­

:я непрерывно. Учитывая эту особенность, в формулу (164) при­ -Уято вносить поправку йейтса на непрерывность вариации, рав­

IУЮ половине объема выборки. Эту поправку вычитают из раз-

юсти (ad-bc), и формула (164) принимает следующий вид:

r

 

( I ad - Ьс I ) - о ,5n

(165)

-~~==~~==~~7=~~~~

 

А-

f(a+b)(c+d)(a+c)(b+d)

lрименим эту формулу к только что рассмотренному примеру:

 

(75·68-14.16)-0,5.173

 

47895

0,641.

ГА=

У89.94.91.82

-

7469,0

 

245

Полученная величина указывает на наличие тесной связи между окраской тела и развитием крыльев у дрозофилы. Значимость

этого показателя (х2ф=173 (0,641)2=71,08) значительно превы­

шает критический уровень X2st= 10,83 для а=О,1 % и k= 1 (см. табл. УН Приложений). К такому же заключению приводит и

оценка достоверности (значимости) коэффициента гА = 0,641 по

величине t-критерия Стьюдента:

t

Ф

= О 641 -. /

173 - 2

О 641 1 /

171 _

 

,

V

1 - (0,641)2

'

V

0,589

=0,641 V290,3=0,641.17,0838= 10,92.

В табл. V Приложений для k= 173-2= 171 и а=О,I% находим tst=3,37. Так как iф>tst, нулевая гипотеза опровергается на вы­

соком уровне значимости (Р<О,ООl). Следовательно, с вероят­

ностью P~99% можно считать доказанным наличие тесной связи

между окраской тела и развитием крыльев у дрозофилы.

Коэффициент ассоциации Юла. Этот непараметрический по­

казатель связи между качественными признаками, группируемы­

ми в четырехпольную таблицу, определяют по формуле

ad ad

-Ьс

(166)

+Ьс

Как величина случайная, коэффициент ассоциации Юла сопро­

вождается статистической ошибкой

s

= l-r~

1,1_1 +_1 +_1 +_1 .

(167)

'Q

2

JI а Ь с d

 

в формулах (166) и (167) символы а, Ь, с и d имеют то же зна­ чение, что и в формуле (164). Достоверность этого выборочного

показателя проверяют по величине t-критерия Стьюдента. Вычис­

лим TQ для данных из примера 13. Необходимые данные содер­

жатся в табл. 110:

75·68 - 14·16

5100 - 224

4876

=0 916.

TQ=

+ 14·16

5100 + 224

5324

'

75·68

Полученная величина (rQ=0,916), как и можно было ожидать, значительно выше той, которая была найдена ранее [см. форму­

лу (164)], что связано с конструкцией коэффициента ассоциации

Юла. Находим ошибку этого. показателя:

1 -

(0,916)2

Vr-I--I---l--'~I-

StQ=

2

75 +68+14+16=

_ 0,161 VO,1599=0,0805.0,40=0,032.

2

246

Отсюда tф=0,916/0,032=28,6. Для k=173-2=171 и а=О,l%'

критическая точка t8t =3,37 (см. табл. V Приложений). Нулевая гипотеза отвергается на 0,1 %-ном уровне значимости (Р<О,ООI),

что подтверждает сделанный выше вывод о наличии связи между окраской тела и развитием крыльев у дрозофилы.

Коэффициент взаимной сопряженности. Для определения сте­

пени сопряженности между качественными признаками с числами

вариант, большими двух, служит коэффициент взаимной сопря­

женности или nолихорический nоказатель связи, предложенный

К. Пирсоном:

с-v

 

-v 'f2+ 1

 

 

 

 

12 +N

,

( 168)

 

 

 

 

'1..2

'1'2

 

 

где ~2-=

n

12

)

-1- величина, в которой {ху обозна-

~

ху

 

(

1=1

"i.lx"i.ly

 

 

 

 

 

чает частоты в клетках многопольной корреляционной таблицы,

а "щх и Щу - суммы частот по строкам и столбцам той же таб­ лицы; N=Щх+Щу - общая сумма частот, или объем выборки.

Пирсоновский коэффициент взаимной сопряженности (С)

имеет один существенный недостаток: его значение значительно

зависит от количества вариант коррелируемых качественных

признаков.

Учитывая этот недостаток, А. А. Чупров внес поправки в фор­

мулу (168), которые приняли следующие выражения:

N Y(nx-I)(ny-l) -

(169)

-v(nх - 1) (nу - 1)

Здесь К- коэффициент взаимной сопряженности Чупрова; nх и nу - численность групп по строкам и столбцам многопольной таб­ лицы; N - объем выборки. Остальные символы объяснены выше.

Нулевую гипотезу отвергают, если х2ф=NffJ2~х28t для принятого

уровня значимости и числа степеней свободы

Пример 14. Изучали зависимость между цветом волос и цве­

том глаз у человека. Результаты наблюдений сведены в табл. 111.

Определим коэффициент взаимной сопряженности между

этими признаками, предварительно рассчитав ве.1ИЧИНУ ffJ2:

ср2

1702

802

52

702

/522

+

255.308 + 255.572 + 255.20

+ 230.308

+ 230.572

+ 82

682

+ 3402

+ 72

-1=1,205-1=0,205.

230.20

-t- 415·308

415·308

415.20

 

 

Подставляем известные значения в формулу (169):

К=./

V

У(3

0,205

1/ 0,205

0,226.

- 1)(3 - 1)

4

 

247

Найденная величина К=0,226 указывает на наличие слабm

связи между цветом глаз и цветом волос у чеЛJвека. Критериi_

х2ф=N<р2=900·0,205= 184,5>X28t= 18,47 для a=O,l % и k= (3-

-1) (3-1) =4. Так как х2ф>х28t, нулевая гипотеза отвергается нс:..

весьма высоком уровне значимости (Р<О,ООI).

Необходимо помнить, что правильное применение критерш:

х2 основано на требовании, чтобы в клетках корреЛЯЦИОННОl

таблицы содержалось не менее пяти вариант и чтобы общее чи!

ло наблюдений не было меньше 50. Несоблюдение этих требовс

-

 

Таблица 11

Цвет волос

 

 

 

Цвет глаз

 

Всего

блондины

шатеиЫ

рыжие

Голубые

Серые

Карие

Всего

170

I

80

I

5

 

255

70

 

152

 

8

 

230

68

 

340

 

7

I

415

 

 

 

 

 

 

308

 

572

 

20

 

900

ний не гарантирует получение достаточно точных оценок гене­

рального параметра pi, а следовательно, и правильных выводо!;

которые делают на основании выборочных показателеЙ.

. Коэффициент корреляции знаков. Иногда коррелируемые ПрF

знаки выражают не числами, а знаками: наличие признака - зн"

ком плюс, отсутствие - знаком минус. Такие случаи встречаютсS'.

например, в психоло-педагогических исследованиях, когда выяс

няют зависимость между поведенческими признаками. ДЛЯ ИЗМt­ рения коррешщии между такими признаками предложена фор­

мула

Яху=

Р(ХУ) -Р(Х)Р(У)

(170

 

YP(X)P(Y)(I-P(X)(I-P(Y»

 

 

где Р(ХУ)-число совпадений положительных знаков в общеl серии испытаний, отнесенное к их числу n, т. е. Р (ХУ) =~ (:1: )/r.

Р (Х) и Р (У) - частdсти положительных знаков Д.'IЯ каждого ПрF

знака отдельно, т. е. Р (Х) =~x (+) /n и Р (У) =~y (+) /n. Коэффициент корреляции знаков принимает значения от нуш

до единицы. Чем сильнее связь между признаками, тем этот 0(. казатель ближе к единице, и, наоборот, чем слабее зависимост.

одного признака от другого, тем меньше будет и коэффициен~

корреляции знаков.

Прuмер 15. Изучали зависимость между увлеченностью зн"

ниями Х И склонностью учащихся к математике У. Под наБЛIOДt-

248

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]