книги из ГПНТБ / Лакин Г.Ф. Биометрия учеб. пособие
.pdfгде п\ и п2— объемы сравниваемых распределений; рі и р2— час тоты соответствующих классов или классовых вариант.
Рассмотрим следующий пример. Урожай фасоли от посева крупных и мелких семян распределился следующим образом:
125 |
175 |
225 |
275 |
325 |
375 |
4 2 5 |
4 7 5 |
5 2 5 |
1 |
5 |
17 |
45 |
70 |
51 |
10 |
1 |
> 0 |
1 |
3 |
7 |
22 |
88 |
69 |
7 |
2 |
1 |
|
|
|
|
|
|
|
|
|
Т а б л и ц а 40 |
Классовые |
Частоты |
|
|
|
|
|
|
(п,рг—пгр,у- |
|
|
|
|
|
Рі+Ра |
п,ХРг |
«I ХРі |
ПіРі—ПгРі |
||
варианты |
рі |
Рг |
|
|
Pi+Ps |
||||
м |
|
|
|
|
|
|
|||
125 |
1 |
1 |
|
|
2 |
200 |
200 |
0 |
0 |
175 |
5 |
3 |
|
|
8 |
600 |
1 000 |
- 4 0 0 |
2 0 000 |
225 |
17 |
7 |
|
|
24 |
1 4 0 0 |
3 400 |
- 2 000 |
166 667 |
275 |
45 |
22 |
|
|
67 |
4 4 0 0 |
9 000 |
— 4 600 |
315 821 |
325 |
70 |
88 |
|
|
158 |
17 600 |
14 000 |
3 600 |
82 025 |
375 |
51 |
69 |
|
|
120 |
13 800 |
10 200 |
3 600 |
108 000 |
425 |
10 |
7 |
|
|
17 |
1 4 0 0 |
2 000 |
- 6 0 0 |
21 176 |
475 |
1 1 |
2 |
1 |
|
4 |
600 |
20 0 |
40 0 |
4 0 0 00 |
|
1 |
3 |
|||||||
525 |
|
|
|||||||
0 ] |
1 І |
|
|
|
|
|
|||
|
|
|
|
|
|
||||
Сумма |
200 |
200 |
|
— |
— |
— |
— |
75 3 689 |
В данном случае через х обозначены классовые варианты по весу отдельных семян фасоли, выраженному в мг, а через р\ и р2— распределение урожая, полученного в одних и тех же усло виях выращивания растений от посева крупных (рі) и мелких (р2) семян. Сопоставим полученные данные, как того требует формула 73 (табл. 40). Подставляя известные значения в фор
мулу 73, находим значение критерия хи-квадрат: %2= |
,1 |
||||
X |
|||||
|
|
|
|
2 |
0 0 X 200 |
X 753 689 |
= 18,84. Для р = |
0,95 и &= |
8 — 3 = |
5 / st = |
11,1, а для |
р = 0,999 |
2 |
2 |
2 |
опровергает нуле |
|
%st = 15,1. Видно, |
что хф > |
х«<> что |
вую гипотезу; расхождение между этими распределениями нель зя признать случайным.
Критерий хи-квадрат применим не только к оценке вариаци онных рядов, но и к выборкам, группируемым в четырехпольные и многопольные таблицы. Поэтому он находит широкое примене ние в генетике, селекции и семеноводстве, а также в фармаколо гии при оценке действия лекарственных веществ и во многих дру гих областях знания. Соответствующие примеры приводятся ниже.
140
Критерий X (ламбда)
Оценку расхождений между эмпирическими и теоретически ми частотами вариационного ряда можно провести и с помощью непараметрического критерия, предложенного А. Н. Колмогоро вым и Н. В. Смирновым. Этот критерий, обозначаемый грече ской буквой X (ламбда), представляет максимальную разность (dmax) между значениями накопленных частот эмпирического и теоретически вычисленного рядов (без учета знаков разности), отнесенную к корню квадратному из суммы всех вариант сово купности:
- |
(2 р |
2 //)m a x |
^max |
. |
А = |
------------- — ---------- |
= — = — |
1/41 |
|
|
Уп |
Уп |
|
|
В отличие от описанного |
выше |
критерия |
хи-квадрат рас |
сматриваемый критерий ламбда не нуждается в вычислении х и а и не требует специальной таблицы для оценки результатов сравнения эмпирических и вычисленных частот; критические (стандартные) значения критерия ламбда, соответствующие трем порогам доверительной вероятности — Рі = 0,95; ^ 2= 0 ,99 и Р3= 0,999, соответственно равны: 1,36; 1,63 и 1,95 1. Нулевая ги потеза не отвергается, и расхождения между сопоставляемыми частотами считаются случайными, если величина критерия ламб да не превосходит своего критического значения для принятого порога доверительной вероятности. При использовании крите рия ламбда отпадает необходимость в определении числа сте пеней свободы. Отмеченная простота конструкции и условий применения критерия ламбда обеспечивают ему широкие воз можности использования в самых различных областях биологи ческих исследований.
Покажем применение критерия ламбда на примере распреде ления кальция (мг%) в сыворотке крови павианов-гамадрилов.
Расчет необходимых значений показан в табл. 41. |
Ер — |
|||||
Из табл. 41 видно, что максимальная величина разности |
||||||
—'Lp' = d = 2 , откуда |
2 |
|
|
|
||
|
|
X = |
0,2. |
|
|
|
|
|
—= = |
|
|
||
|
|
|
ую о |
|
|
|
Полученная величина не достигает даже первого порога |
дове |
|||||
рительной |
вероятности (Р = 0,95), |
которому |
соответствует Х= |
|||
= 1,36. |
На |
этом основании |
различия между |
эмпирическими и |
||
1 Предельное значение |
|
|
Р — соответствующий |
|||
уровень |
значимости. Если |
|
|
= 1,36. При |
Р2 = 0,Ѳ1 |
|
А=1,63 |
и при Р3 Х= 1,95. |
|
|
|
|
1 4 1
|
|
|
|
|
Т а б л и ц а 41 |
К:ассовые |
Частоты |
Накопленные частоты |
Разница |
||
|
теоретич. |
|
теоретич. |
||
варианты (л:) |
эмпир. (р ) |
эмпир. (Ър) |
( H p - ^ ' ) =d |
||
|
ІР') |
№ ') |
|
||
8,9 |
2 |
1 |
2 |
1 |
1 |
9,6 |
3 |
4 |
5 |
5 |
0 |
10,3 |
9 |
10 |
14 |
15 |
1 |
11,0 |
17 |
18 |
31 |
33 |
2 |
11,7 |
25 |
23 |
56 |
56 |
0 |
12,4 |
23 |
21 |
79 |
77 |
12 |
13,1 |
10 |
14 |
89 |
91 |
2 |
13,8 |
7 |
7 |
96 |
98 |
2 |
14,5 |
4 |
2 |
100 |
100 |
0 |
вычисленными по нормальному закону частотами данного рас пределения следует считать случайными.
Критерий ламбда применяется и для оценки расхождений, наблюдаемых между частотами двух эмпирических распределе ний. Продемонстрируем это на примере урожая фасоли от посе ва крупными и мелкими семенами, который рассматривался вы ше. Расчет üfmax показан в табл. 42.
Т а б л и ц а 42
Классовые |
Частоты |
Накопленные частоты |
Разница |
|||
первого ряда |
второго ряда |
|
|
|||
варианты (л:) |
S/;, |
^Р2 |
(ѴРі—\'>z)=d |
|||
|
<Рі) |
<Рг) |
|
|
||
125 |
1 |
1 |
1 |
1 |
0 |
|
175 |
5 |
3 |
6 |
4 |
2 |
|
225 |
17 |
■ 7 |
23 |
11 |
12 |
|
275 |
45 |
22 |
68 |
33 |
|35| |
|
325 |
70 |
88 |
138 |
121 |
17 |
■ |
375 |
51 |
69 |
189 |
190 |
1 |
|
425 |
10 |
7 |
199 |
197 |
2 |
|
475 |
1 |
2 |
200 |
199 |
1 |
|
525 |
0 |
1 |
200 |
200 |
0 |
|
Сумма . . . |
200 |
200 |
— |
— |
— |
|
Подставляя найденное значение dmax= 35 в формулу, получаем:
35 |
2,5. |
К = ------- |
|
]/200 |
|
142
Эта величина превосходит даже третий критический уровень ламбда (1,95), что не оставляет сомнений в достоверности на блюдаемых различий.
Когда сравниваемые эмпирические распределения имеют раз ные объемы, для оценки различий между ними применяется сле дующая формула:
2 ц і _ |
\ |
т/ Пі Х п 2 |
(74a) |
|
Пі |
«2 max |
' t il + tl2 |
||
|
где pi и p2 — частоты первого и второго ряда, а п{ и /г2 — объемы этих рядов.
Чтобы не затруднять себя извлечением квадратного корня, формулу 74а можно использовать в виде следующего выраже ния:
X2 = dmax X n ' ^ r h - . |
(746) |
пі + п2
Продемонстрируем применение этой формулы на следующем примере. При изучении внутривидовой изменчивости очанки В. Д. Беляевым (1925) были получены следующие распределе ния основной формы и одной из ее разновидностей:
из какого узла зацвела (х): |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
основная форма (/л): |
1 |
8 |
23 |
30 |
38 |
12 |
7 |
4 |
1 |
0 |
разновидность (р2) : |
0 |
0 |
1 |
11 |
18 |
14 |
3 |
4 |
1 |
1 |
Оценим достоверность расхождения между этими распределе
ниями. Расчет максимальной разности |
(dmax) показан в табл. 43. |
|||||||
|
|
|
|
|
|
|
Т а б л и ц а 43 |
|
|
Частоты |
Накопленные частоты |
|
Яр2 |
|
Ър2 |
||
Варианты |
|
|
|
|
|
|
||
(*) |
Pt |
{Рг) |
|
|
п1 |
пг |
пі |
П2 |
6 |
1 |
0 |
1 |
0 |
0,008 |
0,000 |
|
0,008 |
7 |
8 |
0 |
9 |
0 |
0,073 |
0,000 |
|
0,073 |
8 |
23 |
1 |
32 |
1 |
0,258 |
0,019 |
|
0,239 |
9 |
30 |
11 |
62 |
12 |
0,500 |
0,226 |
|
10,274. |
10 |
38 |
18 |
100 |
30 |
0,806 |
0,566 |
|
0,24э |
И |
12 |
14 |
112 |
44 |
0,903 |
0,830 |
|
0,073 |
12 |
7 |
3 |
119 |
47 |
0,960 |
0,887 |
|
0,073 |
13 |
4 |
4 |
123 |
51 |
0,992 |
0,962 |
|
0,033 |
14 |
1 |
1 |
124 |
52 |
1,000 |
0,981 |
|
0,019 |
15 |
0 |
1 |
124 |
53 |
1,000 |
1,000 |
|
0,009 |
Сумма |
124 |
53 |
— |
— |
— |
— |
|
— |
143
Максимальная разность между кумулированными отноше ниями частот к объемам выборок составила dmax= 0,274, откуда находим величину критерия ламбда:
Я2 = |
124 V 53 |
0,075 X 37 = 2,77 |
|
(0,274)2 X — |
= |
||
|
124 + 53 |
|
|
и |
Х = |
І 2,77 = |
1,66. |
Здесь удалось избежать извлечения корня из большого чис ла, что облегчило расчет критерия ламбда.
Найденная величина ^=1,66 превосходит второй порог дове рительной вероятности, для которого X =1,63. Следовательно, с вероятностью Р —0,99 можно утверждать, что сравниваемые вы борки принадлежат к разным генеральным совокупностям.
Критерий ламбда дает достаточно точные результаты только на больших выборках (я^ІОО). На малочисленных выборках его применение не гарантирует достаточную точность оценки.
Измерение трансгрессии
При распределении независимых выборок в вариационные ряды нередко приходится наблюдать, что часть вариант 'этих выборок распределяется по одним и тем же классам, хотя меж ду средними арифметическими этих рядов существует статисти чески достоверная разница. Ряды, у которых часть классов ока зывается общей, а между средними арифметическими обнару живается статистически достоверная разница, называются транс грессирующими рядами. Самый же факт неполного разграниче ния вариационных рядов носит название т р а н с г р е с с и и . Графики трансгрессирующих рядов выглядят следующим обра зом: правая сторона одной кривой и левая сторона другой вариа ционной кривой взаимно проникают друг в друга и под ними образуется часть общей площади, показывающая величину трансгрессии (см. рис. 19).
Степень трансгрессии может быть весьма различной, что имеет определенное познавательное значение. В зависимости от того, какие задачи стоят перед исследователем, иногда полезно уменьшить трансгрессию распределений, тогда как в других слу чаях ее нужно увеличить. Измерение величины трансгрессии яв ляется важным элементом биометрического анализа распреде лений.
В табл. 44 приведены ряды распределения кальция (мг%) в сыворотке крови, взятой у страдающих припадками тетании и у клинически здоровых (нормальных) обезьян. Обращает на себя внимание тот факт, что в классах от четвертого до восьмого включительно встречаются варианты как первого, так и второго вариационных рядов. В то же время разница между средними
144
|
|
|
|
Т а б л и ц а 44 |
Классы по уровню |
|
|
Частоты распределений |
|
Срединные значения |
|
|
||
кальция в сыворотке |
|
классов (лг) |
припадочные (рх) |
нормальные (р2) |
крови (мг%) |
|
|
||
6,45 -7,14 |
|
6,8 |
2 |
|
7 ,1 5 -7 ,8 4 |
|
7,5 |
6 |
|
7,8 5 -8 ,5 4 |
|
8,2 |
7 |
2 |
8,55 -9,24 |
|
8,9 |
12 |
|
9 ,2 5 -9 ,9 4 |
|
9,6 |
9 |
3 |
9,95—10,64 |
|
10,3 |
2 |
9 |
10,65-11,34 |
|
11,0 |
3 |
17 |
11,35-12,04 |
|
11,7 |
1 |
25 |
12,05-12,74 |
|
12,4 |
|
23 |
12,75—13,44 |
|
13,1 |
|
10 |
13,45-14,14 |
|
13,8 |
|
7 |
14,15-14,84 |
|
14,5 |
|
4 |
Сумма . . . |
|
— |
42 |
100 |
Характеристики |
рядов: |
8,92 |
11,90 |
|
|
|
X = |
||
|
|
а = |
1,13 |
1,20 |
арифметическими |
|
этих распределений, равная |
11,90—8,92 = |
|
= 2,98±0,21 мг%, оказывается |
статистически достоверной. Сле |
довательно, перед нами трансгрессирующие ряды двух незави симых выборок, генеральные параметры которых характеризу ют различное физиологическое состояние организма сравнивае мых групп. Вместе с тем наличие трансгрессии убеждает в том, что по одним лишь средним показателям нельзя составить вер ное представление о роли гипокальцемии в возникновении тетанических припадков у животных данного вида. Этот пример по казывает, а подобных примеров можно привести немало, что наряду с другими биометрическими показателями во многих случаях очень важно учитывать и величину трансгрессии рас пределений.
Как же измерить эту величину? Грубо приближенное пред ставление о размерах трансгрессии можно получить, выразив сумму трансгрессирующих вариант в процентах от их общей численности в двух смежных распределениях. Так, из общего числа 100+ 42=142 вариант трансгрессирующих рядов, приве денных в табл. 44, в первом ряду трансгрессирует 12+9 + 2 + 3 + + 1=27 вариант, а во втором ряду 2 + 3+ 9+17 + 25 = 56; всего 27 + 56 = 83 варианты, что составляет 58,5% от общего их числа (142). Это довольно большая трансгрессия: больше половины вариант этих рядов распределяются по одним и тем же классам.
145
Разумеется, этот способ неточный и может служить лишь для предварительной ориентации в этом вопросе. Более точно вели чина трансгрессии определяется по следующей формуле:
|
|
|
|
|
Пірі + П2р2 |
|
|
|
(75) |
||
|
|
|
|
|
Пі + nZ |
|
|
|
|||
|
|
|
|
|
|
|
|
|
|||
Здесь |
T — показатель трансгрессии, выражаемый в |
долях еди |
|||||||||
ницы |
или в |
процентах; п х и /г2— объемы |
сравниваемых |
рас |
|||||||
пределений, |
|
|
|
|
|
|
|
|
|
||
|
|
|
Р = |
0,5 + |
0,5ФДі) |
и |
р = 0,5 + 0,5Ф(/2), |
где |
ty = |
||
= |
min2 — Xi |
и |
t2= |
maxi — X2 |
а |
mm2 = |
X2 — 3 (T2 |
и |
maxi = |
||
------------- |
-------- -----, |
||||||||||
|
|
01 |
|
|
0 2 |
|
|
|
|
|
|
= |
Xi + 3oi. |
|
|
|
|
|
|
|
|
|
Рис. 19. Трансгрессия рядов распределе ния кальция (мг %) в сыворотке коови
припадочных (х\) и нормальных (x2) па- вианов-гамадрилов:
на оси абсцисс — кальций в сыворотке крови в мг %, на оси ординат — абсолютные частоты
Значения rnin2, т а х ь Ф (^) и ФЦ2) легче уяснить из рис. 19, на котором изображены выравненные кривые распределения каль
ция |
(мг%) в сыворотке крови у подверженных припадкам тета |
||||||||
нии и нормальных обезьян. |
|
|
I приложений; |
причем эти |
|||||
Значения 0(t) |
находят в табл. |
||||||||
значения |
следует |
брать |
с |
отрицательным |
знаком, |
когда |
|||
тіп 2> хі |
и т а х і< х 2, т. е. исходить из разности Р = 0,5—0,50(і). |
||||||||
Применим формулу 75 к оценке величины трансгрессии ря |
|||||||||
дов, приведенных в табл. 44. Характеристики этих |
рядов: |
х\ = |
|||||||
= 8,92; Х2 |
=11,90; 0і=,1,13; |
о2=1,20; |
П] = 42 и «2=100. Определя |
||||||
ем |
min2= ll,9 0 —3X1,20=8,30 |
и maxi = 8,92 + ЗХ 1,13= 12,31. За |
|||||||
тем |
находим |
= (8,30—8,92) : 1,13= —0,55 |
и |
^2= (12,31— |
—11,90) : 1,20=0,34. Далее вычисляем значения рх и р2:
146
|
|
|
Т а б л и ц а 45 |
|
|
|
Частоты |
Классы по весу |
Срединные значения |
|
|
б бив фасоли (мг) |
классов (х) |
урожай (/>,) |
семена (р2) |
|
|
||
100-149,9 |
125 |
1 |
|
150-199,9 |
175 |
5 |
|
200—249,9 |
225 |
17 |
|
250-299,9 |
275 |
45 |
|
300-349,9 |
325 |
70 |
|
' 350-399,9 |
375 |
51 |
1 |
400-449,9 |
425 |
10 |
|
450—499,9 |
475 |
1 |
. 9 |
500-549,9 |
525 |
|
29 |
550-599,9 |
575 |
|
26 |
600 - 649,9 |
625 |
|
25 |
650-699,9 |
675 |
|
8 |
700-749,9 |
725 |
|
2 |
Сумма . . . |
— |
200 |
100 |
Характеристики рядов: |
319,0 |
573,5 |
|
|
X = |
||
|
с = |
58,3 |
59,3 |
pi = 0,5 + 0,5Ф(— 0,55) = 0,5 + 0,20885 = 0,70885;
рг = 0,5 + 0,5Ф (0,34) = 0,5 -h 0,13305 = 0,63305.
Подставляя найденные значения р\ и р2 в формулу 75, находим:
42 X 0,70885 + |
100 X 0,63305 |
93,08 |
Т = |
100 |
0,655, или 65,5%. |
4 2 + |
142 |
|
Возьмем еще пример. В табл. 45 |
приводятся распределения |
двух выборок: одна показывает варьирование фасоли по весу бобов, отобранных для посева (рг), а другая характеризует варьирование того же признака в урожае (рі). Видно, что транс грессия этих рядов невелика: из общего числа 300 вариант трансгрессируют всего лишь 21, или 7%. Вычислим показатель
трансгрессии для этих |
распределений. |
Находим: |
min2= 573,5—■ |
|
—3X59,3 = 395,6; |
шахі = 319,0+ 3x58,3 = 493,9; |
/j = (395,6— |
||
—319,0) : 58,3= 1,31 |
и |
t2= (493,9—573,5) : 59,3 = —1,34, откуда |
||
P1= 0,5 - |
0,5Ф(1,31) = 0,5 - |
0,5 X 0,8098 = |
||
|
= |
0,5 - 0,4049 = |
0,095; |
|
147
Р2 = 0,5 — 0,5Ф (— 1,34) = 0,5 — 0,5 X 0,8198 = 0,090».
Подставляем значения рі и р2 в формулу 75:
200X 0,095+ 100 X0,090 |
— 0,093, или 9,3%. |
|
200+ 100 |
||
|
Как и следовало ожидать, величина трансгрессии оказалась не значительной. Разница между средними этих распределений —
Х2 —£ і = 573,5—319,0 = 254,5±7,2 мг — настолько велика, что ни каких сомнений в ее достоверности не возникает. Выборки при надлежат к разным генеральным совокупностям; вариационные кривые почти не накладываются друг на друга.
1 Значения 0,5 Ф(б) и 0,5 Ф + ) взяты с отрицательным знаком, так как в данном случае min2>Xi и гпахі<х2.
Г ЛАВА ВОСЬМАЯ
АНАЛИЗ АЛЬТЕРНАТИВНЫХ ПРИЗНАКОВ
СТАТИСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ АЛЬТЕРНАТИВ
Наряду с рядовой изменчивостью исследователю приходится иметь дело с изменчивостью качественных признаков, которые в вариационные ряды не распределяются, а рассматриваются как противопоставляемые друг другу состояния. Например, из общего количества 580 клинически обследованных лиц выявле но 85 больных. Анализируя эти данные, мы противопоставляем 85 больных 495 здоровым индивидам, входящим в состав 580 че ловек обследованной группы. В такой (альтернативной) форме могут рассматриваться не только качественные, но и количест венные признаки, например, высокие противопоставляться низ ким, тяжелые — легким и т. д. Отсюда следует, что независимо от того, с какими признаками — качественными или количест венными— имеем дело, если они рассматриваются как противо поставляемые друг другу' состояния, их можно называть при знаками альтернативными.
Альтернативные признаки выражаются в абсолютных значе ниях частот, с которыми они встречаются в данной совокупно сти, а также в долях единицы, или в процентах от общего числа наблюдений. Например, в отношении обследованных 580 чело
век можно сказать, |
что среди них доля больных составляет |
85 : 580 = 0,1466, или |
14,66%. |
Как и все биологические признаки, альтернативы варьируют по величине, и к ним применимы законы вариации и статистиче ские характеристики, которые рассматривались выше. Чтобы уяснить основные характеристики рядового варьирования х и о применительно к характеристике альтернативных признаков, представим некоторую совокупность п наблюдений, которые группируются в два класса. В первый клаес, который обозначим единицей, относятся варианты, обладающие данным признаком, а во второй класс, который обозначим нулем, отнесем все остальные варианты, у которых этого признака нет. Абсолютные частоты первого класса обозначим через т, а частоты второго (нулевого) класса — через п—т = Ь. Приняв эти условия, напи шем «распределение» альтернативного признака X :
классы |
(х): |
1 |
0 |
m + |
b = п. |
частоты |
(р): |
тп |
Ь, где |
||
Найдем параметры этого распределения: |
|
|
|||
|
Х,хр |
(1 X |
X b) |
m |
|
Х = |
------------п |
|
- J |
’ |
149