Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Лакин Г.Ф. Биометрия учеб. пособие

.pdf
Скачиваний:
55
Добавлен:
25.10.2023
Размер:
16.09 Mб
Скачать

0,01

0,01

0,05

0,05

У 6/16з

< 3 и te

У24/105

— < 3

0,24

0,35

Нулевая гипотеза остается; данное распределение следует счи­ тать нормальным.

Если тем же способом оценить достоверность выборочного коэффициента асимметрии ряда распределения фасоли по весу

семян, который равен +0,57, получается

следующий результат:

,

0,57

=

0,57

0,57

_

lAs —

■ -

— -----=

------- - =

3,4 > 3.

В данном случае

 

У6 /2 0 0 +

3

У0,029

0,17

 

 

 

нулевая гипотеза не сохраняется; это распределение имеет пра­ востороннюю асимметрию.

Минуя вычисление средних квадратических отклонений пока­ зателей асимметрии и эксцесса, последние можно оценить по спе­ циальным таблицам, которые приводятся в приложениях под N° XI и XII. Если выборочные показатели асимметрии и эксцесса превосходят критические (стандартные) значения, приведенные в таблицах или равны им — для принятого уровня значимости и

соответствующего объема выборки, — нулевая

гипотеза

отверга­

ется. В противном случае отвергнуть нулевую

гипотезу

нельзя.

Так, для /4s = 0,01 при п = 100 и 7’ = 0,01 критический

уровень

/ls = 0,567 (см. табл. XI приложений). Так как Лхф<Лх5г, нулевая гипотеза остается. Что касается /Is = 0,57 распределения фасоли по весу семян, то в этом случае критический уровень для п = 200 и Р = 0,01 равняется 0,403. Видно, что + ^ > / ls st— что опроверга­ ет нулевую гипотезу и подтверждает вывод о наличии положи­ тельной асимметрии у этого распределения. Таким же образом оценивается и Ех = —0,05 распределения кальция (мг%) в сыво­ ротке крови обезьян. В табл. XII приложений для я=100 и Р = = 0,05 находим Ел+;=0,834. Поскольку ЕХф<Ел+, нулевая гипо­ теза сохраняется.

Опричинах асимметричных распределений

Внормальном законе находит свое выражение одна из форм проявления симметрии в живой природе, рассматриваемой на по­ пуляционном уровне. Поэтому отклонения от этого закона могут указывать на постоянно или временно действующие причины, вы­ зывающие отклонения от «естественной нормы». Кетле и Гальтон

полагали, что биологические признаки распределяются по нор­ мальному закону. Многочисленные наблюдения как будто бы подтверждали это. Но вскоре Пирсон показал, что существует не один, а несколько типов распределения биологических призна­ ков. Возникла необходимость выяснения причин асимметричных и эксцессивных распределений.

Первая попытка дать научно обоснованный ответ на этот во­ прос принадлежит датскому ученому В. Иогансену (1903).

130

В классических опытах по отбору крупных и мелких семян в «чистых линиях» и в популяции фасоли он установил, что гене­ тически однородные чистые линии распределяются нормально. Отбор плюс и минус вариант, проводимый на генетически одно­ родном материале, т. е. в чистых линиях, не изменяет среднюю величину селектируемого признака или изменяет ее очень незна­ чительно. Асимметрия, по его мнению, возникает от причин дво­ якого рода: во-первых, чисто технических — вследствие группи­ ровки выборочного материала в вариационные ряды (ложная асимметрия) и, во-вторых, биологических, связанных главным образом с перемешиванием генетически константных чистых ли­ ний в процессе их скрещивания друг с другом, т. е. следствием гетерогенности выборочного материала (истинная асимметрия).

На ряде убедительных примеров Иогансен показал, что иног­ да достаточно изменить ширину классового интервала, т. е. пере­ группировать варианты по классам вариационного ряда как от казавшейся первоначально асимметрии не остается и следа. Ра­ зумеется, что может случиться и обратное, когда с виду симмет­ ричный вариационный ряд после перегруппировки вариант по его классам становится асимметричным. Иогансен приводит следую­ щее распределение фасоли по величине семян (сг):

je: 8,75 — 9,75 — 10,75—

11,75—

1 2 ,7 5 -

13,75— 14,75— 15,75 — 15,75

р :

2

43

314

809

316

30

6

2

Видно, что этот ряд симметричный. Его характеристики равны:

х = 12,25 сг и а = 0,77 сг. Но достаточно изменить

границы клас­

сов, как тот же материал распределяется совсем иначе:

классы

(х):

9 - 1

0 - 1 1 -

1 2 - 1 3 -

1 4 -

1

5 - 1 6 - 1 7

частоты

(р):

7

67

468

761

201

15

41

Характеристики

распределения

остались

теми

же, т. е. х =

= 12,25 сг и а = 0,77 сг,

а в распределении

частот

наблюдается

асимметрия.

 

 

 

 

 

 

 

Перегруппировка вариант по классам сильнее сказывается на величине показателей асимметрии и эксцесса. Это можно пока­ зать на следующем примере. Выборка 100 семян из урожая конс­ тантного сорта фасоли, которые варьировали по весу от 320 до 510 мг, была распределена в вариационный ряд в масштабе і — = 50 мг следующим образом:

классы

(х):

300— 350

400 —

450 —500

— 559

частоты

(р):

14

44

34

7

1

Характеристики этого ряда следующие: х = 393,5 мг; о = 42,0 мг; СѴ= 10,7% и A s= +0,32. Затем тот же материал был сгруппиро­

ван в вариационный

ряд в масштабе вдвое

меньше прежнего,

т. е. і = 25 мг:

 

 

 

 

 

 

 

х:

300 -

325350 -

375 -

400

-

425 - 450 -

475

—500 -

523

р :

2

12

21

23

23

11

1

6

1

5*

 

 

 

 

 

 

 

 

131

Характеристики этого распределения оказались: х = 394,0 мг; я=41,6 мг\ С1/ = 10,6% и Лх=+0,56. Видно, что перегруппировка вариант сильнее сказалась на величине коэффициента асиммет­ рии и совсем незначительно на других характеристиках ряда. Из приведенных примеров видно, что асимметрия действительно мо­ жет быть кажущейся, возникающей по чисто техническим причи­ нам как следствие группировки совокупности наблюдений в ва­ риационный ряд. Вместе с тем асимметрия может иметь и не случайный, а систематический характер, являясь следствием гетерогенности выборочного материала. В литературе имеются указания на то, что асимметрия и эксцесс могут возникать не только при смешении генетически неоднородного материала, но и вследствие модифицирующих влияний условий среды, в кото­ рых существует популяция. В частности, асимметрия в распреде­ лении некоторых признаков у сельскохозяйственных растений вызывается такими условиями, как засуха и невыравненность агрофона в отношении питания растений (Иогансен, 1933; Кон­ стантинов, 1952 и др.). В качестве примера приводим данные, по­ казывающие, как при прочих равных условиях изменяются ха­ рактеристики распределения озимой ржи по длине колосьев в за­ висимости от густоты стояния растений в посевах этой культуры |табл. 34).

Т а б л и ц а 34

Количество

Измерено

Средняя

Основное от­

Коэффициент

Коэффициент

растений

колосьев (л)

длина колосьев

клонение (а)

вариации (СѴ)

асимметрии

на 1 м ъ

 

( М М ) (X)

 

 

(A s )

197

132.

64,0

19,0

27,7

+ 0,004

222

115

63,3

18,5

29,2

+ 0,410

364

182

49,3

18,2

36,9

4 0,620

С уплотнением массы растений на единице площади умень­ шается средняя длина колосьев, и параллельно с этим увеличи­ вается значение коэффициента асимметрии.

Итак, отклонения от нормального распределения могут быть вызваны разными причинами. По-видимому, не всегда эти при­ чины носят случайный или временный характер. Многие факты говорят о том, что в отношении ряда изученных признаков асим­ метрия является неотъемлемым атрибутом их варьирования. Та­ кого рода отклонения от кривой нормального распределения мо­ гут служить показателем величины тех изменений, которые признак претерпевает в процессе своего развития. Разумеется, помогая исследователю характеризовать ту или иную форму рас­ пределения, биометрия не претендует на причинный анализ асим­ метрии и других отклонений от нормального закона. Она лишь может указывать, в каком направлении следует вести биологиче­

232

ский анализ для того, чтобы вскрыть биологическую природу асимметричных распределений.

ОЦЕНКА ЭМПИРИЧЕСКИХ РЯДОВ ПО НОРМАЛЬНОМУ ЗАКОНУ

Оценка закона распределения довольно просто и с достаточ­ ной точностью достигается путем нахождения теоретических час­ тот по частотам эмпирического вариационного ряда, с последую­ щим сопоставлением эмпирического и вычисленного рядов друг с другом. Нахождение теоретических частот вариационного ряда по тому или иному закону распределения вероятностей носит на­ звание выравнивания эмпирических распределений. Будучи вы­ ражен в графической форме, эмпирический вариационный ряд выглядит обычно не в виде плавной, а ломаной вариационной кривой. Отсюда возникает необходимость выравнивания таких рядов и кривых распределения с тем, чтобы освободить их от всего случайного, выявить основную тенденцию варьирования и вместе с тем закон распределения.

Для нахождения теоретических частот вариационного ряда по нормальному закону Гаусса — Лапласа служит следующая рабо­ чая формула:

р'

п X і

о

 

где р' — вычисленная или теоретическая частота; п —-сумма всех частот, т. е. объем эмпирического вариационного ряда; і — вели­

чина классового интервала эмпирического ряда;

о — среднее

квадратическое отклонение эмпирического ряда; f(t)

— функция

нормированного отклонения, значения которой (ординаты нор­ мальной кривой) приведены в табл. II приложений.

Таким образом, для нахождения теоретических частот эмпи­ рического вариационного ряда достаточно значения вероятности, соответствующие нормированным отклонениям частот эмпириче­

ского ряда умножить на - ^ 1. Продемонстрируем эту методику

о

на примере распределения 267 датских угрей по числу позвонков. Средняя арифметическая этого ряда 114,74 позвонков, а 0 = 1,35 позвонков. Для получения теоретических частот этого распреде­ ления нормируем его, т. е. находим отклонения вариант от их средней арифметической, выражая каждое отклонение в долях среднего квадратического отклонения (табл. 35).

Затем из табл. II приложений выписываем ординаты нормаль-

X X

ной кривой для каждого значения t = ------- эмпирического рас-

0

пределения. Перемножая значения ординат на величину п Х і»

 

 

 

 

 

Т а б л и ц а 35

 

Эмпири­

 

 

 

Теоретііческие

 

Отклонения

 

Ординаты

частоі ы (p')

Варианты

ческие

І Х~ Х

 

 

нормальной

 

 

(X)

частоты

 

 

 

(л--Т)

<3

фактичес­

 

 

(р )

кривой

округленно

 

 

 

 

 

ки

 

 

 

 

 

 

і и

3

- 3 ,7 4

—2,77

0,0086

1,7

2

112

9

- 2 ,7 4

- 2 ,0 3

0,0508

10,0

10

113

31

- 1 ,7 4

- 1 ,2 9

0,1739

34,3

34

114

71

- 0 ,7 4

- 0 ,5 5

0,3429

67,9

68

115

82

+ 0,26

+0,19

0,3918

77,6

78

116

46

+ 1,26

+0,93

0,2589

51,1

50

117

19

+2,26

+ 1,67

0,0989

19,5

20

118

5

+ 3,26

+2,41

0,0219

4,3

4

119

1

+4,26

+ 3,15

0,0028

0,5

1

Сумма

267

267,2

267

 

 

*

267 V 1

igg, получаем теоретически

равную в данном случае ____ _ _=

 

 

 

1,35

 

 

 

вычисленные частоты данного распределения (см. последнюю гра-

Рис. 17. Эмпирическая и выравненная по нормально­ му закону кривые распределения 267 датских угрей по числу позвонков:

на оси абсцисс — количество позвонков, на оси ординат — частоты

фу табл. 35). Из табл. 35 видно, что вычисленные и эмпирические частоты в общем неплохо согласуются между собой, что более наглядно показано на рис. 17.

Описанный способ применяется и к расчету теоретических частот непрерывно варьирующих признаков, с предварительным превращением интервальных вариационных рядов в ряды дис-

134

кретных распределений. Покажем это на примере распределе­ ния кальция (мг%) в сыворотке крови павианов-гамадрилов с его характеристиками: ж = 11,9 мг% и о=1,2 мг%. В данном слу-

і Х п

0,7 X 100

 

Ход вычислений показан

в

чае ------ = -------—— =58,3 = 58.

о

 

1,2

 

 

 

 

 

 

табл. 36.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Т а б л и ц а

36

 

Эмпири­

 

 

Ординаты

Теоретические час­

Варианты

і Отклонения

Х —Х

тоты (р ’)

 

ческие

(л--7)

<3

нормаль­

 

 

 

(X)

частоты

ной

кри-

фактичес­

округ­

 

ІР)

 

 

вой

1 /(0 1

 

 

 

 

 

 

ки

ленно

 

8,9

2

- 3 ,0

- 2 ,5 0

0,0175

1,0

1

 

9,6

3

- 2 ,3

—1,91

0,0644

3,7

4

 

10,3

9

- 1 ,6

- 1 ,3 3

0,1647

9,6

10

 

11,0

17

—0,9

-0 ,7 5

0,3011

17,6

18

 

11,7

25

- 0 ,2

- 0 ,1 7

0,3932

22,8

23

 

12,4

23

+ 0,5

+0,42

0,3653

21,2

21

 

13,1

10

+ 1,2

-+1,00

0,2420

14,0

14

 

13,8

7

+ 1,9

+ 1,58

0,1145

6,6

7

 

14,5

4

+ 2 ,6

+2,17

0,0379

2,2

2

 

Сумма

100

 

98,6

100

 

В данном случае также обнаруживается довольно хорошее сов­ падение эмпирических частот с вычисленными частотами вариа­ ционного ряда, что служит основанием считать его соответству­ ющим нормальному закону.

ОЦЕНКА ЭМПИРИЧЕСКИХ РЯДОВ ПО ЗАКОНУ ПУАССОНА

В общем по той же методике, что описана выше, но еще более просто, определяются теоретические частоты тех эмпирических распределений, которые следует закону Пуассона. Для этого не­ обходимо воспользоваться таблицей Пуассона (см. приложения

ат

табл. III), в которой помещены значения — е~а ,входящие в co­ rn!

став формулы, определяющей функцию распределения редких событий. Зная среднюю (ж) эмпирического распределения, по указанной таблице находят вероятности, соответствующие значе­ ниям т : 0, 1, 2, 3 и т. д. Затем вероятности умножаются на общее число наблюдений (п) . В результате получаются вычисленные или теоретические частоты (р') для каждого т.

Продемонстрируем эту методику на примере распределения поражаемости клеток альфа-частицами по данным, приведенным в табл. 22 (пятая глава). Средняя арифметическая этого распре­

135

деления я = 1,54. Расчет теоретических частот показан в следую­ щей табл. 37.

Т а б л и ц а 37

 

 

 

Теоретические

частоты

Число клеток

Число случаев

Вероятности

час­

 

(т )

(Р)

тот по формуле

округленно

 

 

Пуассона

фактически

0

112

0,2231

115,34

115

1

168

0,3347

173,04

173

2

130

0,2510

129,77

130

3

68

0,1255

64,88

65

4

32

0,0471

24,35

24

5

5

0,0141

7,29

7

6

1

0,0035

1,81

2

7

1

0,0008

0,41

1

Сумма . .

517

516,90

517

Видно, что вычисленные частоты довольно хорошо согласуются с распределением эмпирических частот этого ряда. Следователь­ но, есть достаточные основания считать, что в данном случае час­ тота поражаемое™ клеток альфа-частицами распределяется по закону Пуассона.

КРИТЕРИИ СООТВЕТСТВИЯ ЭМПИРИЧЕСКИХ И ТЕОРЕТИЧЕСКИХ РАСПРЕДЕЛЕНИЙ

Критерий хи-квадрат (х2)

Статистическая оценка расхождений, наблюдаемых между эмпирическими и теоретическими или ожидаемыми частотами вариационного ряда, производится с помощью особых критериев соответствия, называемых также критериями согласия. Одним из таких критериев, широко используемых в биометрии, является критерий X2 (хи-квадрат), предложенный Пирсоном в 1901 г. Он представляет сумму квадратов отклонений эмпирических частот от частот теоретачееких, отнесенную к теоретическим частотам вариационного ряда, т. е.

(р — р' ) 2

%2 = 2 U- nf L - t (72)

Р

где р — эмпирическая, а р' — соответствующая теоретическая,

т.е. вычисленная, или ожидаемая, частоты, 2 — знак суммы. Обозначив разность между эмпирическими и теоретическими

частотами через d, т„ е. р — p' — d,

формулу 72 можно выразить

в более простом виде:

 

 

d2

L(72a)

Х2 = S

- .

136

Рис. 18. График плотности вероятно­ сти ^-распределения при числе степе­ ней свободы К= 1, 2 и 6 (по Смирно­ ву и Дунину-Барковскому, 1965)

Для нахождения величины критерия хи-квадрат необходимо: 1) по каждому классу вариационного ряда найти разницу между фактическими и вычисленными частотами, т. е. р p' = d; 2 ) возвести разницу в квадрат (d2) и отнести к вычисленным час­ тотам (р') для каждого класса и 3) суммировать полученные от-

/ d 2 \

ношения^__j для всех классов вариационного ряда — это и

будет величина хи-квадрат. Так как отклонения эмпирических частот от частот вычисленных возводятся в квадрат, то величина критерия хи-квадрат всегда положительная. Поэтому при уста­ новлении разности р p' = d знаки можно не учитывать.

Если 2 (р —р') =0, то %2=0, что указывает на полное соот­ ветствие фактических частот вычисленным частотам вариацион­ ного ряда. Если же критерий хи-квадрат не равен нулю, это может указывать на несоответствие фактических частот вычис­ ленным частотам данного вариационного ряда. В таких случаях нужно оценить величину критерия хи-квадрат, которая теорети­ чески может изменяться от 0 до оо. Оценка значимости критерия хи-квадрат производится с помощью специальной таблицы, при­ веденной в приложениях под № VIII. В этой таблице содержат­ ся критические (стандартные) значения критерия хи-квадрат для трех уровней доверительной вероятности и разных чисел степе­ ней свободы, которые берутся по правилам, указанным ниже.

Если % нулевая гипотеза сохраняется, т. е. оправдывается предположение, что расхождение между фактическими и теорети­ ческими или ожидаемыми частотами носит исключительно слу­ чайный, а не систематический характер. В противном случае, т. е. ПРИ Уф2^ :Г) н у л е в а я гипотеза отвергается. Таким образом с помощью критерия хи-квадрат выясняется, соответствует ли эм­ пирическое распределение тому закону, по которому вычислены теоретические частоты ряда.

Распределение вероятных значений случайной величины %2 является непрерывным и ассимметричным (рис. 18); оно зави­ сит от числа степеней свободы (k) и приближается к нормаль­ ному распределению по мере увеличения числа наблюдений

(п). Поэтому применение это­ го критерия для оценки дис­ кретных распределений сопря­ жено с некоторыми погрешно­ стями, которые особенно сильно сказываются на малочислен­ ных выборках В силу отмечен­ ных особенностей показателя­ ми правильного применения

137

критерия хи-квадрат считается наличие в выборке достаточного числа вариант и чтобы в крайних классах сравниваемых распре­ делений имелось минимально допустимое количество теоретиче­ ских частот. Обыкновенно не рекомендуется, чтобы число вари­ ант в крайних классах теоретически рассчитанного ряда было меньше 5. Однако по данным Ван дер Вардена, исследовавшего этот вопрос, количество вариант в крайних классах вариационно­ го ряда следует связывать с числом ступеней свободы следую­ щим образом:

числа степеней свободы (£=я<—3):

1

2

3—6

> 6

минимально допустимые теоретиче­

 

 

 

 

ские частоты (р) крайних классов

4

2

1

0,5.

ряда:

При наличии в крайних классах теоретически вычисленных час­ тот меньше указанного количества следует объединить теоретиче­ ские частоты смежных классов так, чтобы выполнялись требова­ ния Ван дер Вардена. Соответственно объединяются и частоты крайних классов эмпирического вариационного ряда. Число сте­

пеней свободы

равно вторичному числу классов без трех, т. е.

k = tii—3, где

Пі не объем выборки,число классов вариацион­

ного ряда. Чтобы получились достаточно надежные результаты, общее число наблюдений (п), распределяемых в вариационный ряд, должно быть не менее 30.

Так как точность вычисления величины критерия хи-квадрат в значительной мере зависит от точности самих значений р', при установлении разности р p' = d следует пользоваться неокруг­ ленными теоретическими частотами (р' ). Следует также иметь в виду, что критерий хи-квадрат не применим к частотам, выра­ женным в процентах, долях единицы, т. е. в относительных еди­ ницах измерения.

 

 

 

 

Т а б л и ц а 38

 

Частоты

 

 

 

Варианты

 

 

Разница

Кваират раз­

 

(*)

эмпир. (/?)

вычисл. ( p ’)

(P—P'—d)

ницы (d 2)

P'

п і

3

1,7

1,3

1,69

0,99

112

9

10,0

1,0

1,00

0,10

113

31

34,3

3,3

10,89

0,32

114

71

67,9

3,1

9,61

0,01

115

82

77,Q

4,4

19,36

0,25

116

46

51,1

5,1

26,01

0,51

117

19

19,5

0,5

0,25

0,01

118

5 } е

4,3 И 8

 

1,44

0,30

119

0,5 Г ’0

1,2

 

Сумма . . .

267

267,2

2,49

138

Продемонстрируем применение критерия хи-квадрат на при­ мерах. Воспользуемся данными табл. 35 и вычислим критерий хи-квадрат для распределения датских угрей по числу позвонков, имея в виду гипотезу о нормальности этого распределения. Ход

вычисления критерия

хи-квадрат показан в табл. 38. Для

k = 8—3 = 5 степеней

свободы и вероятности Р = 0,95 по табл.

VIII находим Xst2=11,1. Так как фактическая величина критерия

хи-квадрат (2,49)

не превосходит его критического

значения

( 11,1) при данном

пороге доверительной вероятности

и числе

степеней свободы, нулевая гипотеза сохраняется; небольшие рас­ хождения между частотами эмпирическими и вычисленными по нормальному закону следует признать случайными.

Применим тот же критерий к оценке эмпирического ряда рас­ пределения числа клеток, пораженных альфа-частицами. Теоре­ тические значения частот этого ряда приведены в табл. 37. Расчет критерия хи-квадрат показан в следующей табл. 39.

Т а б л и ц а 39

Число клеток

Число слу­

Теоретич.

Разность

d ‘

JLL

(т)

чаев (р )

частоты (p' )

(.P—P' =d)

K P l

p'

0

112

 

115,34

3,34

11,16

0,09

1

168

 

173,04

5,04

25,40

0,15

2

130

 

129,77

0,23

0,05

0,00

3

68

 

64,88

3,12

9,73

0,15

4

32

 

24,35

7,65

58,52

2,40

5

5

 

7,29

2,29

5,24

0,71

6

1

I

1.81 )

0,22

0,05

0,02

 

 

2

2,22

7

1

0,41 J

 

 

 

J

 

 

 

Сумма . . .

517

 

516,90

3,52

2

В данном случае %ф=8,Ъ2. Для Р = 0,95 и числа степеней свобо­ ды k = tii — 2 = 7—2 = 5 по табл. VIII находим %si2= 11,1. Посколь­

ку X(f)<%st >нулевую гипотезу отвергнуть нельзя. На этом осно­ вании следует заключить, что данное распределение следует за­ кону Пуассона.

Критерий хи-квадрат можно использовать и для сравнения друг с другом двух однородных эмпирических распределений, т. е. таких, у которых одни и те же границы классов. Критерий хи-квадрат в таких случаях определяется по формуле

=

-

(73,

ni-nz

Рі + р2

 

139