Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Лакин Г.Ф. Биометрия учеб. пособие

.pdf
Скачиваний:
54
Добавлен:
25.10.2023
Размер:
16.09 Mб
Скачать

МНОЖЕСТВЕННАЯ КОРРЕЛЯЦИЯ

Вычисляя коэффициент корреляции между двумя признаками X и У, мы не учитывали зависимость их от других варьирующих признйков организма. Между тем известно, что организм — не мозаика признаков, а сложная система, части которой, ее приз­ наки сложным образом взаимодействуют друг с другом. Поэто­ му, наряду с изучением парных корреляций перед исследовате­ лем возникает задача измерения множественных связей между варьирующими признаками организма. Эта задача решается с помощью двоякого рода показателей: коэффициента общей или совокупной корреляции и частных или парциальных коэффици­ ентов корреляции. Совокупный коэффициент корреляции между тремя учитываемыми признаками X, Y и Z вычисляется по следу­ ющей формуле:

гхУг-V1

+ Гyz

■2глУгхггУг

(105)

— гху

 

где гху, rxz и ryz— парные коэффициенты линейной корреляции между признаками X и У, X и Z, У и Z.

Совокупный коэффициент корреляции обладает теми же свой­ ствами, которые присущи и парным коэффициентам прямолиней­ ной связи. Но, в отличие от последних, совокупный коэффициент корреляции всегда имеет только один — положительный знак.

Чаще, чем совокупный коэффициент, в практике используют­ ся парциальные коэффициенты, измеряющие силу связи между двумя варьирующими признаками при постоянном значении тре­ тьего учитываемого признака, который находится или может на­ ходиться в корреляционной зависимости от первых двух. Част­ ный или парциальный коэффициент корреляции между призна­ ками X и У при исключенном влиянии на эту связь третьего варьирующего признака Z равняется

Гх у

f x z X гуг

 

j

Г xy(z)

 

 

(106)

У(1- Г2 ) (1 — Г2

) '

9 Х

XZ. 4

yz

'

Соответственно коэффициент парциальной корреляции между признаками X и Z при исключенном влиянии связанного с ними третьего признака Y равен

r xz(y)

Гхг

Гху X Гу 7

(106а)

Ѵ(1 —г 2 ) ( 1 - г 2 )

1

4

х у ' ѵ

y z '

И коэффициент парциальной корреляции между Y и Z при посто­ янном значении признака X равняется

1 Знак исключенного признака принято заключать в скобки или же отде­ лять от остальных знаков точкой.

192

fyz

ГхуУ\ Гхг

(1066)

У(1 — Г *

)(1 - г* )

 

Из приведенных формул видно, что определение значений сово­ купного и парциальных коэффициентов связи осуществимо лишь посредством расчета парных коэффициентов корреляции. Как это делается, покажем на следующем простом примере.

На случайно отобранных десяти колосьях ржи была измерена их длина в мм (X), подсчитано число колосков (У) и количество зе­ рен (Z) в каждом колосе. Полученные результаты и их обработ­ ка приведены в табл. 64.

Т а б л и ц а 64

X

Y

Z

X2

уг

 

хк

YZ

X Z

70

18

36

4900

324

1 296

1 260

648

2 520

60

17

29

3 600

289

841

1 020

493

1 740

70

22

40

4 900

484

1 600

1540

880

2 800

46

10

12

2 116

100

144

460

120

552

58

16

31

3 364

256

961

928

496

1 798

69

18

32

4 761

324

1 024

1 242

576

2 208

32

9

13

1 024

81

169

288

117

416

62

18

35

3 844

324

1225

1 116

594

2 170

46

15

30

2 116

225

900

690

450

1 380

62

22

36

3 844

484

1 296

1364

792

2 232

570

165

294

34 469

2 891

9 456

9 908

5 166

17 816

Чтобы вычислить коэффициенты множественной корреляции, нужно сначала найти значения парных коэффициентов связи между этими признаками. Для этого рассчитаем суммы квадра­ тов отклонений вариант от их средних арифметических:

2 і — я )2 =

2х2 —

 

5702

= 34 469

 

п

 

1(Г

=

34 469 — 32 4 9 0 =

1979;

2 і - у)2=

(2ц12

 

1652

2г/2-

=

2891 - ~йГ

=

2891 — 2722,5= 168,5;

2942

2 (z — z)2 = 9456----- — = 9456 — 8643,6 = 812,4.

7—2802

193

Затем находим средние квадратические отклонения:

Ох

-і/

1979 _

14,04;

Оу

168,5

4,10;

 

 

*

10 _

 

 

 

10

 

 

 

 

 

 

812,4

9,014.

 

 

 

 

Далее рассчитываем: Oz 10

 

 

 

 

у;

 

 

 

 

 

 

 

П у Х П х

 

 

570X 165

2 і — у) (Хі — х) = Пух--------------- =

9908 — ------ ^

-----= 503;

 

 

 

П у Х П г

 

165X294

315,0;

2 і — у)(г — г) = Ъуг ------—

---- =

5166-------- £ —

=

 

 

 

п

 

 

 

10

 

 

 

 

 

у'ig \у 22

 

570 X 294

1061.

2 і — x)(z — z) = Hxz----------— =

17 816

10

 

 

 

 

п

 

 

 

 

 

Откуда парные

 

коэффициенты

корреляции

оказываются рав­

ными:

 

 

 

 

 

 

503

 

 

2 і — у) і х )

503

 

=

0,876;

' ху

похОу

10X4,1 X14,0

.—

 

574

 

 

' yz

315

315

0,853;

10X4,1 X9,0

- ---- =

 

369

 

 

1061

- ™ і -

0,842.

 

1 0 X 1 4 X 9

 

1260

 

Найденные значения парных коэффициентов позволяют рас­ считать величины парциальных коэффициентов корреляции:

r xy(z)

0,876 — 0,853 X 0,842

0,159

0,159 = 0,566;

 

У (1 — 0,8532) (1 — 0,8422)

У0,079

0,281

r yz(x) ----

0,853 — 0,876 X

0,842

0,116

0,116

У (1 — 0,8762) (1 —

0,8422)

У0,0677

: 0,446;

 

0,260

 

0,842 — 0,876 X 0,853

0,095

0,095

r xz(y)

У(1 — 0,8762) (1 — 0,8532)

уо,063

= 0,378.

 

0,251

Несколько более тесная связь обнаруживается между длиной ко­ лосьев и числом содержащихся в них колосков, независимо от влияния на эту связь количества зерен, заключенных в колосьях ржи.

J94

Критерием для оценки нулевой гипотезы служит отношение

Г части У ^ V

УI ■— Г2

' часты

где п — объем выборки, а ѵ — число учитываемых признаков. Нулевая гипотеза, т. е. предположение о независимости варьиро­ вания двух признаков при исключении влияния третьего (или многих других учитываемых признаков) отвергается при

для k = n—3 и принятого уровня

вероятности Р. Так, в данном

случае

 

 

 

0,566 У

10 — 3

1,498

1,498

txy(z) — ....

.......

■---- 1 ,8 .

у 1 -

0,5662

У0,68

0,825

Таким же способом

находим:

^(*>=1,24 и ^z(y)== 1,03. .Для

Т >= 0,05 и k = 7 по таблице Стьюдента ist= 2,365. Во всех случаях іф<Ut, что не позволяет отвергнуть нулевую гипотезу. Однако это не значит, что корреляция между признаками отсутствует. Этот факт скорее всего указывает на недостаточно большой объем выборки, а не на отсутствие парциальной корреляции.

Рассчитаем совокупный коэффициент корреляции между длиной колосьев (X) и двумя другими признаками — числом ко­ лосков (У) и количеством зерен (Z), содержащихся в отдельных колосьях:

2 __

fxy ”b ^xz

1 —

yz

ryz

 

Гxyz

 

 

r2

 

 

 

 

 

 

 

0,8762 + 0,8422 -

2 X 0,876 X 0,853 X 0,842

0,1581

= 0,584,

 

Г - 0,8532

 

0,2724

 

откуда

 

 

 

 

 

 

rXVz =

У0 584 = 0,764.

 

 

Сводный коэффициент корреляции оказался

довольно

высоким.

КОРРЕЛЯЦИОННОЕ ОТНОШЕНИЕ

 

Для измерения криволинейной зависимости между

перемен­

ными величинами

X и У коэффициент корреляции непригоден.

В таких случаях используется другой показатель, предложенный К. Пирсоном и называемый к о р р е л я ц и о н н ы м от н о ш ени- е м; его принято обозначать греческой буквой г) («эта»), В отли­ чие от коэффициента корреляции, который характеризует зависи­ мость между переменными І и Ус точки зрения прямой пропор-

7

195

циональности, корреляционное отношение описывает ее двусторонне. Поясним это на следующем простом примере. Возь­ мем несколько парных значений двух переменных величин X и У:

X:

2

4

6

8

4

6

2

 

6

К:

4

8

8

 

7 4

10

 

6

12

Ранжируем эту совокупность по Х\

X:

2

2

4

4

6

6

6

8

У:

4

6

4

 

8 10

8

12

7

Видно, что некоторые значения X повторяются, что позволяет распределить эту совокупность следующим образом:

2

4

6

8

5

6

10 7

Здесь Y x — частные или групповые средние, полученные усред­ нением значений У, соответствующих одинаковым значениям ве­ личины X. Например, (4 + 6) : 2=5, (10 + 8+12) : 3 = 10 и т. д.

Если же ранжировать эту совокупность по У, получается сле­ дующее:

Г:

4

4

б

 

7 8

 

8 10

12

2f:

2

4

2

8

6

4

6

6

Этот ряд состоит не из четырех, как в первом случае, а из шести

групп — 4 6 7 8 10

12, которым соответствуют частные сред­

ние ) : (2 + 4) : 2 = 3, 2, 8,

 

(6 + 4) : 2 = 5, 6 и 6, т. е. получается

следующее распределение:

 

 

 

 

 

у:

4

6

7

8

10

12

Ху.

3

2

8

5

6

6

Таким образом выясняется, что зависимость между перемен­ ными X и Y выражается по-разному в зависимости от того, по значениям какой из них — X или У— ранжируется совокупность. Этот пример позволяет понять, почему корреляционное отноше­ ние характеризует связь между варьирующими признаками дву­ сторонне— У по X и X по У, — а потому и выражается не одним, а двумя показателями г\Уіхи т]Хш- Они определяются по следую­ щим аналогичным формулам:

т]у / х = У о2 /о 2 и ц х / у — У а2 2 ,

(107)

- 2 ( у х - у ) 2

где Оух = ——------- — средний квадрат отклонении част-

п

ных или групповых средних (ух) от общей средней (у), т. е. частная дисперсия, а

196

2 2 (у*— у) 2

 

 

 

Gy — I---------

-— —общая дисперсия совокупности. Соответствен­

но:

2 2 (х у — х ) 2

 

2 і х ) 2

 

и Ох =

 

аХу —

-------------п

п

 

 

 

Эти формулы выражаются и в другом виде:

Чу/ х

1/ Ъ(ух — у) 2

 

 

ч / 2 (х ѵ — х )2

(107а)

 

 

ПЖ!/ *Ъ(Хі- х ) 2

 

 

 

 

или

%7Xу

у) 2

2 і У х ) 2

 

 

2 (;У і - У )2

 

 

 

 

 

 

-1/2(хг- - х ) 2- 2

 

(1076)

^

-------Г

2"(—

---------'

 

Обозначив частные или групповые суммы квадратов отклоне­ ний через Dxiy,а общие суммы квадратов отклонений — через £>, формулы 107а можно выразить в таком виде:

 

"1/

Dy!x

 

 

 

~j/ Dx/y

( 108),

 

T)J//JCV ~D~y

И

Т)у/а: —

 

]

 

 

 

 

 

 

 

где

Dyix — 2 (ух у) 2 — 2

(2Уі) 2

т

2 .t

 

 

 

 

 

Пі

 

п

 

 

Dx/y — 2 (Ху

х ) 2

Л L

(2*г)21

(2*)2

_

£>у =

Пі

 

п

>(2х)2

2 ( у г - у ) 2 =

2г/2

( М

!

и

D,с=

2х2

п

 

 

 

п

 

 

 

 

 

Итак, корреляционное отношение равно корню квадратному из отношений сумм квадратов отклонений групповых или частных средних (Ху и ух) от общих средних (х и у) к сумме квадратов отклонений отдельных вариант (xt и Уі) от общих средних дан­ ной совокупности.

Свойства корреляционного отношения

Как и коэффициент корреляции, корреляционное отноше­ ние— величина относительная; этот показатель принимает зна­ чения от 0 до 1: чем сильнее связь между признаками, тем выше

197

значение ц. При отсутствии корреляции г| = 0. Корреляционное отношение — величина всегда положительная, поэтому она не сопровождается знаком.

В отличие от коэффициента корреляции, который служит рав­ нозначной мерой связи для обоих коррелируемых признаков, показатели корреляционного отношения обычно не равны между собой, т. е. Цу/хФЦх/у Лишь при строго линейной связи между пе­ ременными X и У осуществляется равенство цух =Цхіу-Эта осо­ бенность корреляционного отношения позврляет характеризовать любую корреляционную зависимость между варьирующими при­ знаками— и линейную и криволинейную. Чем больше связь меж­ ду признаками приближается к прямолинейной функциональной связи, тем ближе по абсолютной величине показатели корреля­ ционного отношения друг к другу.

ВЫЧИСЛЕНИЕ КОРРЕЛЯЦИОННОГО ОТНОШЕНИЯ НА МАЛЫХ ВЫБОРКАХ

На малых выборках коэффициенты корреляционного отноше­ ния можно вычислить по указанным выше формулам без группи­ ровки выборочного материала в вариационные ряды и в корре­ ляционную таблицу. Покажем это на следующем примере. В табл. 65 собраны данные о живом весе (У) самок павиановгамадрилов в том возрасте (X), когда у них наступает первый половой цикл, внешне выражаемый набуханием «половой кожи».

 

 

 

Т а б л и ц а 65

Возраст ( мес.)

Вес (кг)

Возраст (мес.)

Вес (кг)

(X)

(У)

(X)

(У)

33,0

7,5

24,0

5,0

31,0

5,7

28,5

5,0

31,0

5,4

26,0

5,4

32,0

5,8

28,5

6,7

34,0

6,8

32,0

5,3

26,0

6,2

31,5

5,5

29,8

8,0

32,5

6,4

31,0

6,1

34,0

6,3

32,5

6,8

33,5

5 (О

32,5

5,6

33,5

6,0

Вычислим для этих данных корреляционное отношение. Сначала найдем коэффициент корреляционного отношения веса (У) по возрасту (X), т. е. г\уіх, для чего ранжируем выборку по X, т. е. расположим значения X в возрастающем порядке. Затем опре­ деляем частные средние (ух) и другие вспомогательные величи­ ны, нужные для вычисления корреляционного отношения У по X (табл. 66).

198

Возраст X

Вес

Ух

У

24,0

5,0

5,00

26,0

6,2

5,80

26,0

5,4

5,80

28,5

5,0

5,85

28,5

6,7

5,85

29,0

8,0

8,00

31,0

5,7

5,73

31,0

5,4

5,73

31,0

6,1

5,73

31,5

5,5

5,50

32,0

5,8

5,55

32,0

5,3

5,55

32,5

6,8

6,27

32,5

5,6

6,27

32,5

6,4

6,27

33,0

7,5

7,50

33,5

5,5

5,73

33,5

6,0

5,73

34,0

6,3

6,55

34,0

6,8

6,55

2:616,0

121,0

«=1 X 1 421

1,05

0,25

0,25

0,20

0,20

1,95

0,32

0,32

0,32

0,55

0,50

0,50

0,22

0,22

0,22

1,45

0,32

0,32

0,50

0,50

 

 

Т а б л и ц а 66

(Ух - У ) г

у— У

(у- уУ

1,1025

1,05

1,1025

0,0625

0,15

0,0225

0,0625

0,65

0,4225

0,0400

1,05

1,1025

0,0400

0,65

0,4225

3,8025

1,95

3,8025

0,1024

0,35

0,1225

0,1024

0,65

0,4225

0,1024

0,05

0,0025

0,3025

0,55

0,3025

0,2500

0,25

0,0625

0,2500

0,75

0,5625

0,0484

0,75

0,5625

0,0484

0,45

0,2025

0,0484

0,65

0,4225

2,1025

1,45

2,1025

0,1024

0,55

0,3025

0,1024

0,05

0,0025

0,2500

0,25

0,0625

0,2500

0,75

0,5625

9,1722

12,5700

Средние арифметические признаков X и У—£ = ^ = 3 0 ,8 мес. и

121

Частные средние определяем по значени­

у — — = 6,05 кг.

У20

ям X. Например, значениям У, равным 6,2 и 5,4, соответствует

6 2 + 54

одна и та же величина х = 26,0, откуда?/* = -1-------— == 5,8 и т.д.

Остальные действия понятны из табл. 66. Подставляя итоговые значения указанной таблицы в соответствующую формулу, нахо­ дим коэффициент корреляционного отношения веса по возрасту:

 

T / A

1 \у/х

 

12, = У0,73 = 0,85.

Таким же способом определяем корреляционное отношение возраста (X) по весу (У), ранжируя совокупность наблюдений по У, и затем рассчитываем частные средние ху и другие вспомо­ гательные величины, как показано в следующей табл. 67.

199

 

 

 

 

 

 

Т а б л и ц а 67

Вес (К)

Возраст (X)

Ху

Ху - X

{Ху X)2

Х{ X

{ Х і - х у

5,0

24,0

26,25

4,55

20,70

6,8

 

46,24

5,0

28,5

26,25

4,55

20,70

2,3

 

5,29

5,3

32,0

32,00

1,20

1,44

1,2

1,44

5,4

26,0

28,50

2,30

5,29

4,8

23,04

5,4

31,0

28,50

2,30

5,29

0,2

 

0,04

5,5

31,0

32,50

1,70

2,89

0,7

0,49

5,5

31,5

32,50

1,70

2,89

2,7

7,29

5,6

32,5

32,50

1,70

2,89

1,7

 

2,89

5,7

31,0

31,00

0,20

0,04

0,2

 

0,04

5,8

32,0

32,00

1,20

1,44

1,2

 

1,44

6,0

33,5

33,50

2,70

7,29

2,7

 

7,29

6,1

31,0

31,00

0,20

0,04

0,2

 

0,04

6,2

26,0

26,00

4,80

23,04

4,8

 

23,04

6,3

34,0

34,00

3,20

10,24

3,2

 

10,24

6,4

32,5

32,50

1,70

2,89

1,7

 

2,89

6,7

28,5

28,50

2,30

5,29

2,3

 

5,29

6,8

34,0

33,25

2,45

6,00

3,2

 

10,24

6,8

32,5

33,25

2,45

6,00

1,7

 

2,89

7,5

33,0

33,00

2,20

4,84

2,2

 

4,84

8,0

29,0

29,00

1,80

3,24

1,8

 

3,24

Сумма

132,44

 

158,20

Подставляем итоговые значения табл. 67 в формулу, находим ве­ личину коэффициента корреляционного отношения возраста по весу:

’1*'« = Ѵ ^ = Ѵ 0 , 8 4

= 0,92.

В итоге имеем: т)у/д:=8,5 и т^/у = 0,92. Эти

показатели говорят о

довольно сильной зависимости, существующей между весом те­ ла и возрастом, в котором у павианов-гамадрилов наступает пер­

вый половой цикл.

полученных величин. Для

Остается

оценить достоверность

этого можно

использовать критерии

і /

п — 2

t — ц \

---------, критиче-

 

 

I

1 —

ские значения которого для принятого уровня значимости (Р) и соответствующего числа степеней свободы (k — n—2) содержатся в таблице Стьюдента. Нулевая гипотеза, т. е. предположение об отсутствии связи между признаками, отвергается при t<p^tst.

200

Так, в данном случае:

 

 

 

 

іу/х =

0,85 У т 1 0_ ^

2=

0,85 у 66,7 =

6,94,

 

tx/y =

0,92 У , У°(()9|

- =

0,92 У112,5 =

9,71.

 

По табл. V приложений для

Р = 0,01 и /г = 20—2=18

находим

tst 2,88. Так как в обоих случаях ^>4<, сомневаться

в досто­

верности вычисленных коэффициентов г]у/ж и цх/у не приходится.

ВЫЧИСЛЕНИЕ КОРРЕЛЯЦИОННОГО ОТНОШЕНИЯ НА БОЛЬШИХ ВЫБОРКАХ

При наличии большого числа наблюдений вычисление коэф­ фициентов корреляционного отношения описанным способом ста­ новится довольно трудоемким. Поэтому приходится выборку группировать в корреляционную таблицу, как это делается и при вычислении коэффициента корреляции на больших выборках. В общем этот процесс сводится к следующим основным опера­ циям: 1) выборка разбивается на классы отдельно по каждому признаку; 2) затем строится корреляционная решетка; 3) далее по каждому классу X (а потом и по классу У) определяются частные средние ух и общая средняя у; 4) потом находят откло­ нения частных средних от общей средней ряда (уху), которые возводятся в квадрат и умножаются на частоты каждого класса, а затем подсчитывается сумма квадратов отклонений

2 рх(уху)2;

5) вслед за тем определяется сумма квадратов

отклонений

общего варьирования признака ' 2Іру{уіу)2.

С этой целью

находят отклонения вариант от общей средней

(Уіу), возводят их в квадрат и умножают на частоты ру, полу­ ченные величины складывают; 6) операция завершается опреде­ лением корреляционного отношения У по X с последующей оцен­

кой

полученного коэффициента Цу/Х по критерию Стьюдента

t =

Т1

k = n—2 и принятого уровня

— для числа степеней свободы

Щ

значимости Р. Выборочная ошибка (mrj) корреляционного отно­ шения определяется по следующей формуле:

1 — и2

>«4 = — = - •

( і о э у

 

Коэффициенты корреляционного отношения можно вычислять разными способами. Рассмотрим их на примере корреляции меж­

201