Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Лакин Г.Ф. Биометрия учеб. пособие

.pdf
Скачиваний:
54
Добавлен:
25.10.2023
Размер:
16.09 Mб
Скачать

где п\ и п2— объемы сравниваемых распределений; рі и р2— час­ тоты соответствующих классов или классовых вариант.

Рассмотрим следующий пример. Урожай фасоли от посева крупных и мелких семян распределился следующим образом:

125

175

225

275

325

375

4 2 5

4 7 5

5 2 5

1

5

17

45

70

51

10

1

> 0

1

3

7

22

88

69

7

2

1

 

 

 

 

 

 

 

 

 

Т а б л и ц а 40

Классовые

Частоты

 

 

 

 

 

 

(п,рг—пгр,у-

 

 

 

 

Рі+Ра

п,ХРг

«I ХРі

ПіРі—ПгРі

варианты

рі

Рг

 

 

Pi+Ps

м

 

 

 

 

 

 

125

1

1

 

 

2

200

200

0

0

175

5

3

 

 

8

600

1 000

- 4 0 0

2 0 000

225

17

7

 

 

24

1 4 0 0

3 400

- 2 000

166 667

275

45

22

 

 

67

4 4 0 0

9 000

— 4 600

315 821

325

70

88

 

 

158

17 600

14 000

3 600

82 025

375

51

69

 

 

120

13 800

10 200

3 600

108 000

425

10

7

 

 

17

1 4 0 0

2 000

- 6 0 0

21 176

475

1 1

2

1

 

4

600

20 0

40 0

4 0 0 00

 

1

3

525

 

 

0 ]

1 І

 

 

 

 

 

 

 

 

 

 

 

Сумма

200

200

 

75 3 689

В данном случае через х обозначены классовые варианты по весу отдельных семян фасоли, выраженному в мг, а через р\ и р2— распределение урожая, полученного в одних и тех же усло­ виях выращивания растений от посева крупных (рі) и мелких (р2) семян. Сопоставим полученные данные, как того требует формула 73 (табл. 40). Подставляя известные значения в фор­

мулу 73, находим значение критерия хи-квадрат: %2=

,1

X

 

 

 

 

2

0 0 X 200

X 753 689

= 18,84. Для р =

0,95 и &=

8 — 3 =

5 / st =

11,1, а для

р = 0,999

2

2

2

опровергает нуле­

%st = 15,1. Видно,

что хф >

х«<> что

вую гипотезу; расхождение между этими распределениями нель­ зя признать случайным.

Критерий хи-квадрат применим не только к оценке вариаци­ онных рядов, но и к выборкам, группируемым в четырехпольные и многопольные таблицы. Поэтому он находит широкое примене­ ние в генетике, селекции и семеноводстве, а также в фармаколо­ гии при оценке действия лекарственных веществ и во многих дру­ гих областях знания. Соответствующие примеры приводятся ниже.

140

Критерий X (ламбда)

Оценку расхождений между эмпирическими и теоретически­ ми частотами вариационного ряда можно провести и с помощью непараметрического критерия, предложенного А. Н. Колмогоро­ вым и Н. В. Смирновым. Этот критерий, обозначаемый грече­ ской буквой X (ламбда), представляет максимальную разность (dmax) между значениями накопленных частот эмпирического и теоретически вычисленного рядов (без учета знаков разности), отнесенную к корню квадратному из суммы всех вариант сово­ купности:

-

(2 р

2 //)m a x

^max

.

А =

------------- — ----------

= — = —

1/41

 

Уп

Уп

 

В отличие от описанного

выше

критерия

хи-квадрат рас­

сматриваемый критерий ламбда не нуждается в вычислении х и а и не требует специальной таблицы для оценки результатов сравнения эмпирических и вычисленных частот; критические (стандартные) значения критерия ламбда, соответствующие трем порогам доверительной вероятности — Рі = 0,95; ^ 2= 0 ,99 и Р3= 0,999, соответственно равны: 1,36; 1,63 и 1,95 1. Нулевая ги­ потеза не отвергается, и расхождения между сопоставляемыми частотами считаются случайными, если величина критерия ламб­ да не превосходит своего критического значения для принятого порога доверительной вероятности. При использовании крите­ рия ламбда отпадает необходимость в определении числа сте­ пеней свободы. Отмеченная простота конструкции и условий применения критерия ламбда обеспечивают ему широкие воз­ можности использования в самых различных областях биологи­ ческих исследований.

Покажем применение критерия ламбда на примере распреде­ ления кальция (мг%) в сыворотке крови павианов-гамадрилов.

Расчет необходимых значений показан в табл. 41.

Ер —

Из табл. 41 видно, что максимальная величина разности

'Lp' = d = 2 , откуда

2

 

 

 

 

 

X =

0,2.

 

 

 

 

—= =

 

 

 

 

 

ую о

 

 

 

Полученная величина не достигает даже первого порога

дове­

рительной

вероятности (Р = 0,95),

которому

соответствует Х=

= 1,36.

На

этом основании

различия между

эмпирическими и

1 Предельное значение

 

 

Р — соответствующий

уровень

значимости. Если

 

 

= 1,36. При

Р2 = 0,Ѳ1

А=1,63

и при Р3 Х= 1,95.

 

 

 

 

1 4 1

 

 

 

 

 

Т а б л и ц а 41

К:ассовые

Частоты

Накопленные частоты

Разница

 

теоретич.

 

теоретич.

варианты (л:)

эмпир. (р )

эмпир. (Ър)

( H p - ^ ' ) =d

 

ІР')

№ ')

 

8,9

2

1

2

1

1

9,6

3

4

5

5

0

10,3

9

10

14

15

1

11,0

17

18

31

33

2

11,7

25

23

56

56

0

12,4

23

21

79

77

12

13,1

10

14

89

91

2

13,8

7

7

96

98

2

14,5

4

2

100

100

0

вычисленными по нормальному закону частотами данного рас­ пределения следует считать случайными.

Критерий ламбда применяется и для оценки расхождений, наблюдаемых между частотами двух эмпирических распределе­ ний. Продемонстрируем это на примере урожая фасоли от посе­ ва крупными и мелкими семенами, который рассматривался вы­ ше. Расчет üfmax показан в табл. 42.

Т а б л и ц а 42

Классовые

Частоты

Накопленные частоты

Разница

первого ряда

второго ряда

 

 

варианты (л:)

S/;,

2

(ѴРі—\'>z)=d

 

<Рі)

<Рг)

 

 

125

1

1

1

1

0

 

175

5

3

6

4

2

 

225

17

■ 7

23

11

12

 

275

45

22

68

33

|35|

 

325

70

88

138

121

17

375

51

69

189

190

1

425

10

7

199

197

2

 

475

1

2

200

199

1

 

525

0

1

200

200

0

 

Сумма . . .

200

200

 

Подставляя найденное значение dmax= 35 в формулу, получаем:

35

2,5.

К = -------

]/200

 

142

Эта величина превосходит даже третий критический уровень ламбда (1,95), что не оставляет сомнений в достоверности на­ блюдаемых различий.

Когда сравниваемые эмпирические распределения имеют раз­ ные объемы, для оценки различий между ними применяется сле­ дующая формула:

2 ц і _

\

т/ Пі Х п 2

(74a)

Пі

«2 max

' t il + tl2

 

где pi и p2 — частоты первого и второго ряда, а п{ и /г2 — объемы этих рядов.

Чтобы не затруднять себя извлечением квадратного корня, формулу 74а можно использовать в виде следующего выраже­ ния:

X2 = dmax X n ' ^ r h - .

(746)

пі + п2

Продемонстрируем применение этой формулы на следующем примере. При изучении внутривидовой изменчивости очанки В. Д. Беляевым (1925) были получены следующие распределе­ ния основной формы и одной из ее разновидностей:

из какого узла зацвела (х):

6

7

8

9

10

11

12

13

14

15

основная форма (/л):

1

8

23

30

38

12

7

4

1

0

разновидность (р2) :

0

0

1

11

18

14

3

4

1

1

Оценим достоверность расхождения между этими распределе­

ниями. Расчет максимальной разности

(dmax) показан в табл. 43.

 

 

 

 

 

 

 

Т а б л и ц а 43

 

Частоты

Накопленные частоты

 

Яр2

 

Ър2

Варианты

 

 

 

 

 

 

(*)

Pt

{Рг)

 

 

п1

пг

пі

П2

6

1

0

1

0

0,008

0,000

 

0,008

7

8

0

9

0

0,073

0,000

 

0,073

8

23

1

32

1

0,258

0,019

 

0,239

9

30

11

62

12

0,500

0,226

 

10,274.

10

38

18

100

30

0,806

0,566

 

0,24э

И

12

14

112

44

0,903

0,830

 

0,073

12

7

3

119

47

0,960

0,887

 

0,073

13

4

4

123

51

0,992

0,962

 

0,033

14

1

1

124

52

1,000

0,981

 

0,019

15

0

1

124

53

1,000

1,000

 

0,009

Сумма

124

53

 

143

Максимальная разность между кумулированными отноше­ ниями частот к объемам выборок составила dmax= 0,274, откуда находим величину критерия ламбда:

Я2 =

124 V 53

0,075 X 37 = 2,77

(0,274)2 X —

=

 

124 + 53

 

и

Х =

І 2,77 =

1,66.

Здесь удалось избежать извлечения корня из большого чис­ ла, что облегчило расчет критерия ламбда.

Найденная величина ^=1,66 превосходит второй порог дове­ рительной вероятности, для которого X =1,63. Следовательно, с вероятностью Р 0,99 можно утверждать, что сравниваемые вы­ борки принадлежат к разным генеральным совокупностям.

Критерий ламбда дает достаточно точные результаты только на больших выборках (я^ІОО). На малочисленных выборках его применение не гарантирует достаточную точность оценки.

Измерение трансгрессии

При распределении независимых выборок в вариационные ряды нередко приходится наблюдать, что часть вариант 'этих выборок распределяется по одним и тем же классам, хотя меж­ ду средними арифметическими этих рядов существует статисти­ чески достоверная разница. Ряды, у которых часть классов ока­ зывается общей, а между средними арифметическими обнару­ живается статистически достоверная разница, называются транс­ грессирующими рядами. Самый же факт неполного разграниче­ ния вариационных рядов носит название т р а н с г р е с с и и . Графики трансгрессирующих рядов выглядят следующим обра­ зом: правая сторона одной кривой и левая сторона другой вариа­ ционной кривой взаимно проникают друг в друга и под ними образуется часть общей площади, показывающая величину трансгрессии (см. рис. 19).

Степень трансгрессии может быть весьма различной, что имеет определенное познавательное значение. В зависимости от того, какие задачи стоят перед исследователем, иногда полезно уменьшить трансгрессию распределений, тогда как в других слу­ чаях ее нужно увеличить. Измерение величины трансгрессии яв­ ляется важным элементом биометрического анализа распреде­ лений.

В табл. 44 приведены ряды распределения кальция (мг%) в сыворотке крови, взятой у страдающих припадками тетании и у клинически здоровых (нормальных) обезьян. Обращает на себя внимание тот факт, что в классах от четвертого до восьмого включительно встречаются варианты как первого, так и второго вариационных рядов. В то же время разница между средними

144

 

 

 

 

Т а б л и ц а 44

Классы по уровню

 

 

Частоты распределений

Срединные значения

 

 

кальция в сыворотке

 

классов (лг)

припадочные (рх)

нормальные (р2)

крови (мг%)

 

 

6,45 -7,14

 

6,8

2

 

7 ,1 5 -7 ,8 4

 

7,5

6

 

7,8 5 -8 ,5 4

 

8,2

7

2

8,55 -9,24

 

8,9

12

9 ,2 5 -9 ,9 4

 

9,6

9

3

9,95—10,64

 

10,3

2

9

10,65-11,34

 

11,0

3

17

11,35-12,04

 

11,7

1

25

12,05-12,74

 

12,4

 

23

12,75—13,44

 

13,1

 

10

13,45-14,14

 

13,8

 

7

14,15-14,84

 

14,5

 

4

Сумма . . .

 

42

100

Характеристики

рядов:

8,92

11,90

 

 

X =

 

 

а =

1,13

1,20

арифметическими

 

этих распределений, равная

11,90—8,92 =

= 2,98±0,21 мг%, оказывается

статистически достоверной. Сле­

довательно, перед нами трансгрессирующие ряды двух незави­ симых выборок, генеральные параметры которых характеризу­ ют различное физиологическое состояние организма сравнивае­ мых групп. Вместе с тем наличие трансгрессии убеждает в том, что по одним лишь средним показателям нельзя составить вер­ ное представление о роли гипокальцемии в возникновении тетанических припадков у животных данного вида. Этот пример по­ казывает, а подобных примеров можно привести немало, что наряду с другими биометрическими показателями во многих случаях очень важно учитывать и величину трансгрессии рас­ пределений.

Как же измерить эту величину? Грубо приближенное пред­ ставление о размерах трансгрессии можно получить, выразив сумму трансгрессирующих вариант в процентах от их общей численности в двух смежных распределениях. Так, из общего числа 100+ 42=142 вариант трансгрессирующих рядов, приве­ денных в табл. 44, в первом ряду трансгрессирует 12+9 + 2 + 3 + + 1=27 вариант, а во втором ряду 2 + 3+ 9+17 + 25 = 56; всего 27 + 56 = 83 варианты, что составляет 58,5% от общего их числа (142). Это довольно большая трансгрессия: больше половины вариант этих рядов распределяются по одним и тем же классам.

145

Разумеется, этот способ неточный и может служить лишь для предварительной ориентации в этом вопросе. Более точно вели­ чина трансгрессии определяется по следующей формуле:

 

 

 

 

 

Пірі + П2р2

 

 

 

(75)

 

 

 

 

 

Пі + nZ

 

 

 

 

 

 

 

 

 

 

 

 

Здесь

T — показатель трансгрессии, выражаемый в

долях еди­

ницы

или в

процентах; п х и /г2— объемы

сравниваемых

рас­

пределений,

 

 

 

 

 

 

 

 

 

 

 

 

Р =

0,5 +

0,5ФДі)

и

р = 0,5 + 0,5Ф(/2),

где

ty =

=

min2 Xi

и

t2=

maxi — X2

а

mm2 =

X2 3 (T2

и

maxi =

-------------

-------- -----,

 

 

01

 

 

0 2

 

 

 

 

 

 

=

Xi + 3oi.

 

 

 

 

 

 

 

 

 

Рис. 19. Трансгрессия рядов распределе­ ния кальция (мг %) в сыворотке коови

припадочных (х\) и нормальных (x2) па- вианов-гамадрилов:

на оси абсцисс — кальций в сыворотке крови в мг %, на оси ординат — абсолютные частоты

Значения rnin2, т а х ь Ф (^) и ФЦ2) легче уяснить из рис. 19, на котором изображены выравненные кривые распределения каль­

ция

(мг%) в сыворотке крови у подверженных припадкам тета­

нии и нормальных обезьян.

 

 

I приложений;

причем эти

Значения 0(t)

находят в табл.

значения

следует

брать

с

отрицательным

знаком,

когда

тіп 2> хі

и т а х і< х 2, т. е. исходить из разности Р = 0,5—0,50(і).

Применим формулу 75 к оценке величины трансгрессии ря­

дов, приведенных в табл. 44. Характеристики этих

рядов:

х\ =

= 8,92; Х2

=11,90; 0і=,1,13;

о2=1,20;

П] = 42 и «2=100. Определя­

ем

min2= ll,9 0 —3X1,20=8,30

и maxi = 8,92 + ЗХ 1,13= 12,31. За­

тем

находим

= (8,30—8,92) : 1,13= —0,55

и

^2= (12,31—

—11,90) : 1,20=0,34. Далее вычисляем значения рх и р2:

146

 

 

 

Т а б л и ц а 45

 

 

 

Частоты

Классы по весу

Срединные значения

 

 

б бив фасоли (мг)

классов (х)

урожай (/>,)

семена (р2)

 

 

100-149,9

125

1

 

150-199,9

175

5

 

200—249,9

225

17

 

250-299,9

275

45

 

300-349,9

325

70

 

' 350-399,9

375

51

1

400-449,9

425

10

450—499,9

475

1

. 9

500-549,9

525

 

29

550-599,9

575

 

26

600 - 649,9

625

 

25

650-699,9

675

 

8

700-749,9

725

 

2

Сумма . . .

200

100

Характеристики рядов:

319,0

573,5

 

X =

 

с =

58,3

59,3

pi = 0,5 + 0,5Ф(— 0,55) = 0,5 + 0,20885 = 0,70885;

рг = 0,5 + 0,5Ф (0,34) = 0,5 -h 0,13305 = 0,63305.

Подставляя найденные значения р\ и р2 в формулу 75, находим:

42 X 0,70885 +

100 X 0,63305

93,08

Т =

100

0,655, или 65,5%.

4 2 +

142

Возьмем еще пример. В табл. 45

приводятся распределения

двух выборок: одна показывает варьирование фасоли по весу бобов, отобранных для посева (рг), а другая характеризует варьирование того же признака в урожае (рі). Видно, что транс­ грессия этих рядов невелика: из общего числа 300 вариант трансгрессируют всего лишь 21, или 7%. Вычислим показатель

трансгрессии для этих

распределений.

Находим:

min2= 573,5—■

—3X59,3 = 395,6;

шахі = 319,0+ 3x58,3 = 493,9;

/j = (395,6—

—319,0) : 58,3= 1,31

и

t2= (493,9—573,5) : 59,3 = —1,34, откуда

P1= 0,5 -

0,5Ф(1,31) = 0,5 -

0,5 X 0,8098 =

 

=

0,5 - 0,4049 =

0,095;

 

147

Р2 = 0,5 — 0,5Ф (— 1,34) = 0,5 — 0,5 X 0,8198 = 0,090».

Подставляем значения рі и р2 в формулу 75:

200X 0,095+ 100 X0,090

— 0,093, или 9,3%.

200+ 100

 

Как и следовало ожидать, величина трансгрессии оказалась не­ значительной. Разница между средними этих распределений —

Х2 —£ і = 573,5—319,0 = 254,5±7,2 мг — настолько велика, что ни­ каких сомнений в ее достоверности не возникает. Выборки при­ надлежат к разным генеральным совокупностям; вариационные кривые почти не накладываются друг на друга.

1 Значения 0,5 Ф(б) и 0,5 Ф + ) взяты с отрицательным знаком, так как в данном случае min2>Xi и гпахі<х2.

Г ЛАВА ВОСЬМАЯ

АНАЛИЗ АЛЬТЕРНАТИВНЫХ ПРИЗНАКОВ

СТАТИСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ АЛЬТЕРНАТИВ

Наряду с рядовой изменчивостью исследователю приходится иметь дело с изменчивостью качественных признаков, которые в вариационные ряды не распределяются, а рассматриваются как противопоставляемые друг другу состояния. Например, из общего количества 580 клинически обследованных лиц выявле­ но 85 больных. Анализируя эти данные, мы противопоставляем 85 больных 495 здоровым индивидам, входящим в состав 580 че­ ловек обследованной группы. В такой (альтернативной) форме могут рассматриваться не только качественные, но и количест­ венные признаки, например, высокие противопоставляться низ­ ким, тяжелые — легким и т. д. Отсюда следует, что независимо от того, с какими признаками — качественными или количест­ венными— имеем дело, если они рассматриваются как противо­ поставляемые друг другу' состояния, их можно называть при­ знаками альтернативными.

Альтернативные признаки выражаются в абсолютных значе­ ниях частот, с которыми они встречаются в данной совокупно­ сти, а также в долях единицы, или в процентах от общего числа наблюдений. Например, в отношении обследованных 580 чело­

век можно сказать,

что среди них доля больных составляет

85 : 580 = 0,1466, или

14,66%.

Как и все биологические признаки, альтернативы варьируют по величине, и к ним применимы законы вариации и статистиче­ ские характеристики, которые рассматривались выше. Чтобы уяснить основные характеристики рядового варьирования х и о применительно к характеристике альтернативных признаков, представим некоторую совокупность п наблюдений, которые группируются в два класса. В первый клаес, который обозначим единицей, относятся варианты, обладающие данным признаком, а во второй класс, который обозначим нулем, отнесем все остальные варианты, у которых этого признака нет. Абсолютные частоты первого класса обозначим через т, а частоты второго (нулевого) класса — через п—т = Ь. Приняв эти условия, напи­ шем «распределение» альтернативного признака X :

классы

(х):

1

0

m +

b = п.

частоты

(р):

тп

Ь, где

Найдем параметры этого распределения:

 

 

 

Х,хр

(1 X

X b)

m

Х =

------------п

 

- J

149