Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Лакин Г.Ф. Биометрия учеб. пособие

.pdf
Скачиваний:
150
Добавлен:
25.10.2023
Размер:
16.09 Mб
Скачать

щается в уравнение прямой линии:

\ gy =

\ga + b\gx.

(145)

Условием правильного применения этого уравнения служит

требование, чтобы точки lg у

и lg х в системе координат лежали

на одной прямой. Эта особенность отличает уравнения степен­ ной и показательной функций.

Для определения параметров этого уравнения служит следу­

ющая система нормальных уравнений:

 

 

2 lg У =

n \g a + 62 lg x ;

(1)

(146)

 

 

 

2 ( lg * X lg 0 ) =

lg a X 2 1 g x + 6 2 ( lg x ) 2.

(2)

Как и в предыдущем случае, решать эту

систему

можно раз­

ными способами. Удобно

находить параметры по

следующим

формулам:

 

 

 

а _ 2 lg у X 2 (lg х)г — S (lg x X

lgff)S lg X

« 2 ( l g x )2— 2 l g x X 2 l g x

 

и

 

 

 

b__ n 2 ( l g x X lg</)— S l g x X l g j /

 

/22(lgx)2 — 2 lg * X

lg*

 

из которых следует, что предварительно нужно рассчитать 2Igy,

 

 

2 1g*.

 

 

 

 

 

 

 

 

2 (lg* X lg У)

и 2 (lg а:)2.

 

 

 

 

Обратимся к

примеру.

Наблюдения

А.

Д.

Слонима и

О. П. Щербаковой

(1949) показали, что величина основного об­

мена (У), выраженная в килокалориях на

1 кг

веса обезьян за

24 ч, изменяется с возрастом следующим образом:

 

 

 

возраст (мес.) (X ):

2

4

8

9

10

16

19

20

22

28

основной обмен (ккал)

161

117

108

97

116

70

76

69

64

(У):

250

В данном случае обнаруживается гиперболическая зависимость между переменными Х и У. Попытаемся найти эмпирическое уравнение регрессии для этих данных, исходя из общего урав­ нения степенной функции. Предварительно рассчитаем вспомо­ гательные значения (табл. 86).

Подставляя найденные значения в формулы, определяем пара­ метры:

20,12855 X 11,85338 - 20,21996 X 10,33390

10 X 11,85338 — 10,3339 X 10,3339

29,6404

2,5338,

11,7445

9—2802

257

 

 

 

 

 

Т а б л и ц а

86

X

Y

lg .V

lg У

I g - K X l g i /

( i g х ) г

~ « х

 

 

 

 

 

 

2

250

0,30103

2,39794

0,72185

0,09062

240

4

161

0,60206

2,20683

1,32862

0,36248

168

8

117

0,90309

2,06819

1,86776

0,81557

119

9

108

0,95424

2,03342

1,94037

0,91057

113

10

97

1,00000

1,98677

1,98677

1,00000

107

16

116

1,20412

2,06446

2,48586

1,44990

85

19

70

1,27875

1,84510

2,35942

1,63520

78

20

76

1,30103

1,88081

2,44699

1,69268

76

22

69

1,34242

1,83885

2,46849

1,80209

73

28

64

1,44716

1,80618

2,61383

2,09427

64

Сумма . . .

1128

10,33390

20,12855

20,21996

11,85338

1123

10 X 20,21996 - 10,33390 X 20,12855

10X 11,85338 - 10,3339 X 10,3339

-5,8068

= — 0,4944,

11,7445

откуда

lg ух — 2,5238 — 0,4944 lg х.

Рассчитанные по этому уравнению ожидаемые величины основного обмена (ух) приведены в последнем столбце табл. 86 и нанесены на график в виде плавной (выравненной) кривой (см. рис. 27). Видно,, что эмпирический и вычисленный ряды регрессии неплохо согласуются между собой. Следовательно, уравнение регрессии выбрано правильно.

Логистическая зависимость

Ростовые процессы* многих организмов, увеличение числен­ ности популяции во времени, как и некоторые другие ряды ди­ намики, характеризуются дифференциальным уравнением обще­ го вида:

£ - к г , ах

где К — средняя скорость, а л: — время, на протяжении которого совершается процесс. Решение этого уравнения приводит к формуле экспоненциальной функции

У == a e hx,

258

где а — численность особой в начальный момент времени, когда

Х — 0 (или начальная

величина признака в этот

момент). Это

уравнение описывает

рост популяции в условиях

неограничен­

ного пространства и времени; оно эквивалентно геометрической прогрессии размножения в указанных условиях.

Если же численность популяции возрастает в ограниченном пространстве, например, в условиях эксперимента, когда особи размножаются в аквариуме, или в другой замкнутой среде, воз-

Рис. 27. Возрастные изменения основного обмена у обезьян:

на оси абсцисс — возраст животных (мес.), на оси ординат — основной обмен в килокалориях на 1 кг веса за 24 ч

растание численности популяции (как и рост организма, совер­ шающийся при известных ограничивающих условиях) описы­ вается уравнением логистической функции

%L= K Y (A - Y ), dx

или после интегрирования х

А

--------------------1 e—Ak(—x).

Здесь X — время, когда достигается половина окончательной ве­ личины (Л) признака (т. е. верхней асимптоты кривой).

Графически логистическая кривая похожа на Кумуляту — график вариационного ряда нормально распределяющейся со­ вокупности, когда на оси абсцисс откладываются значения клас­ совых вариант, а на оси ординат — накопленные частоты ряда.

9*

259

В более удобной форме эта закономерность выражается урав­ нением Ферхюльста:

А

У = 1 -J-

lQ a+Ьж +

с,

Я

471

где У— учитываемый признак,

например

численность популя­

ции, или вес организма, его размеры

и т. п.; х — время,

про­

шедшее от начала до окончания роста, т. е. максимума Л;

С

начальная величина признака, с которой начато его измерение; а и b — параметры уравнения, определяющие характер логисти­ ческой кривой.

Уравнение логистической кривой выражается в следующей логарифмической форме:

lg ( y - ~ - c— \ ) = a + bx.

Обозначив левую часть этого уравнения через lgz, получим па­ раболу первого порядка lg z = a + bx. Для определения парамет­ ров этого уравнения служит следующая система нормальных уравнений:

S

1g z

п а - \ -

ЬЕх,

Ех X

lg 2

=

йЕ х +

6Ех2.

Определив' значение параметров

а и Ь, нетрудно найти величи­

ны а + Ьх, которые равны теоретическим значениям функции, т. е.

/

А

\

(

А

\

lg

----- £— 1 / ’ отсюда

можно определить

-----1j, что

и приведет

в конечной

инстанции к нахождению

ожидаемых

(теоретических) значений УжТехнику расчетов, связанных с практическим использованием

уравнения логистической функции, легче усвоить из соответст­ вующего конкретного примера. Представим, что в аквариуме, т. е. в искусственно созданной ограниченной среде обитания, со­ держатся инфузории туфельки. Для опыта было взято 5 особей. На протяжении шести суток численность инфузорий возрастала следующим образом:

время в сутках (X):

0

1

2

3

4

5

6

кол. инфузорий в культу­

5

20

100

300

350

380

385

ре (У):

Будучи нанесены па график (рис. 28), эти данные обнаруживают характер логистической кривой. Найдем уравнение этой законо­ мерности, приняв А = 390 и С= 0. Для составления системы нор­ мальных уравнений предварительно рассчитываем величины Ex, Ex2, Slgz и ExX lg 2 (табл. 87).

260'

Рис. 28. Возрастание численности популяции инфузории туфельки в замкнутом пространстве:

на оси абсцисс — время (сут.), на оси ординат — численность популяции

Т а б л и ц а 87

X

У

X*

А

 

lgz

 

X X lg z

У

У

 

 

 

 

 

 

 

0

5

 

19,50000

18,50000

+ 1,2672

+ 1,2672

+ 1,2672

1

20

1

2

100

4

3,90000

2,90000

+0,4624

+0,4624

+0,9248

3

300

9

1,30000

0,30000

-1,4771

—0,5229

-1 ,5687

4

350

16

1,11430

0,11430

—1,0581

—0,9419

-3 ,7 6 7 6

5

380

25

1,02630

0,02630

—2,4200

—1,5790

-7 ,8950

6

385

36

1,01299

0,01299

—2,1136

-1 ,8 8 6 4

-11,3184

 

 

 

 

 

 

 

21

91

-3 ,2006

-22,3577

По итогам табл. 87 составляем систему нормальных уравнений:

6 а +

216 =

— 3,2006,

21а+

916 =

-22,3577.

Решая совместно эти уравнения,

находим: а= 1,6978 и 6 =

= —0,6375. Подставляя в уравнение

147 вместо а и b их значе­

ния, а также и величину Л = 390, имеем:

Ію 1'6978-0'6375*’

По этому уравнению рассчитываем ожидаемые значения ух функции. Расчет показан в следующей табл. 88.

9*—2802

261

Т а б л и ц а 88

X

lg z •= a+bx

lg г

У

2+1

А

х

 

 

 

 

0

+ 1,6978

+1,6978

49,86

50,86

 

7

1

+ 1,0603

+ 1,0603

11,49

12,49

 

31

2

+0,4122

+0,4122

2,58

3,58

 

109

3

—0,2147

1,7853

0,61

1,61

 

242

4

-0 ,8522

1,1478

0,14

1,14

 

342

5

-1 ,4897

2,5103

0,032

1,032

 

378

6

—2,1272

3,8728

0,0075

1,0075

 

387

Сравнивая вычисленные значения (ух) с эмпирическими (у), находим, что они достаточно полно согласуются между собой. Более наглядно это представлено на рис. 28, где на фоне эмпи­ рической кривой пунктиром изображена и кривая вычисленных значений ух-

В заключение изложения регрессионно-корреляционного ана­ лиза следует заметить, что в нашем распоряжении нет такого универсального метода, который определял бы выбор корреля­ ционного уравнения, позволяющего в каждом конкретном случае с максимально возможной точностью выравнивать любой эмпи­ рический ряд регрессии. Поэтому исследователю приходится ре­ шать этот вопрос самостоятельно, выбирая уравнение функции по своему опыту и усмотрению.

Исследователь также должен знать, что сами по себе мето­ ды корреляционного и регрессионного анализа формальны и не способны вскрыть биологическую сущность анализируемых с их помощью массовых явлений. Поэтому непременным условием успешного применения этих методов должен быть правильно поставленный, биологически осмысленный отбор фактов, умелая группировка и статистическая обработка собранного материала. «...Нельзя конструировать связей и вносить их в факты, — гово­ рит Энгельс, — а надо извлекать их из фактов, и, найдя, дока­ зывать их, насколько это возможно, опытным путем» '. Выясне­ ние причин, лежащих в основе корреляционных связей, — дело не математики, а биологии.

Несмотря на формальный характер методов корреляции и регрессии, они играют большую, хотя и вспомогательную, роль в биологических исследованиях. Показатели корреляции и регрессии не только позволяют измерять и анализировать ста­ тистические связи, но и прогнозировать возможные изменения сопряженных признаков, чего нельзя сказать о других биомет­ рических показателях, рассмотренных выше.

■ Э н г е л ь с Ф. Диалектика природы. Госполитиздат, 1950, стр. 26.

262

Корреляционный и регрессионный анализ нашел широкое применение в генетике и селекции. Методы корреляции и регрес­ сии позволяют планировать работу по направленному отбору и подбору животных и растительных организмов, выращиванию потомства с заданными свойствами. Антропологи, врачи, педаго­ ги и психологи используют методы регрессии и корреляции для выработки точных показателей физического развития человека. Немаловажный успех имело применение биометрических мето­ дов для обоснования научных принципов раскроя и стандарти­ зации обуви и одежды, изготовляемой для массового потребле­ ния. Помимо антропологии, генетики, медицины и различных направлений сельскохозяйственной науки, корреляционный и регрессионный анализ находит все более широкое применение в области зоологии, экологии, ботаники, физиологии и во многих других областях теоретической и прикладной биологии.

9**

ГЛАВА ОДИННАДЦАТАЯ

ДИСПЕРСИОННЫЙ АНАЛИЗ

СУЩНОСТЬ МЕТОДА И ЕГО ОСНОВНЫЕ ЗАДАЧИ

Причинно-следственные отношения между явлениями слож­ ны и многообразны. В процессе их изучения возникают самые различные задачи, решение которых требует иногда и особого подхода и соответствующих методов количественного анализа фактов. Так, например, изучая влияние различных доз удобрений или сроков и способов внесения их в почву на урожайность сельскохозяйственных культур, исследователю приходится учи­ тывать целый комплекс факторов — регулируемых и нерегули­ руемых в опыте, от которых зависит конечный результат испы­ таний. В решении такого рода задач методы корреляционного и регрессионного анализа не дают должного эффекта. Неудовлет­ ворительным оказывается и метод парных сравнений средне­ арифметических показателей. При наличии целого комплекса выборочных средних их попарное сравнение становится делом обременительным, требующим большой вычислительной работы.

Впоисках нового более совершенного метода Фишер пришел

кплодотворной идее: оценивать результаты опытов не по сред­ ним арифметическим, а путем сравнения выборочных дисперсий,

вернее их отношений с критическими значениями критерия F. Отсюда и самый метод, разработанный Р. А. Фишером (1925), получил название д и с п ер си о н н о го а н а л и з а . В случаях комплексной оценки результатов наблюдений этот метод оказал­ ся более «экономным» и достаточно эффективным по сравнению с другими биометрическими методами, описанными выше. Так потребность в более совершенной организации сельскохозяйст­ венных опытов привела к созданию не только теории планиро­ вания полевых экспериментов, но и своеобразной методики ана­ лиза экспериментальных данных, которая в настоящее время применяется не только в биологии и смежных с ней областях знания, но и в технике, а также при решении некоторых вопросов психолого-педагогического характера.

Известно, что биологические признаки варьируют под влия­ нием самых различных причин, включая и те факторы, которые учитываются в эксперименте. Величина общей вариации призна­ ка может быть измерена суммой квадратов отклонений отдель­ ных вариант от средней арифметической всего комплекса на­ блюдений. Эту величину, как было показано выше, можно раз­ ложить на части или доли, одна из которых отражает влияние на признак учитываемого в опыте фактора (или факторов), а другая определяется влиянием на тот же признак неучитывае­ мых экспериментатором («случайных») причин. Соотношение

264

между этими источниками варьирования выражается уравне­ нием

где первый

2

і

х ) 2 — І.Пі (х і

— ж )2 + 2 2

(хі

— Жі)2,

 

 

 

 

член, обозначаемый в дальнейшем символом Dy, ха­

рактеризует величину общей вариации признака, т. е. варьиро­ вание его значений вокруг средней арифметической всего ком­ плекса наблюдений; второй член уравнения, обозначаемый сим­ волом Dx, отражает долю общей вариации, относящуюся к варьированию частных или групповых средних (ж*) вокруг общей средней (ж),-и третий член этого уравнения, обозначае­ мый символом Dz, служит объединенной характеристикой варьи­ рования значений признака внутри отдельных групп, т. е. возле частных или групповых средних (жі) данного комплекса. Оче­ видно, в общем комплексе наблюдений будет выполняться равенство Dy— Dx+Dz.

Отнесением сумм квадратов отклонений к числам степеней свободы получаются дисперсии, которые служат оценками влия­ ния различных факторов на признак. Таким образом сущность дисперсионного анализа сводится к разложению общей диспер­ сии некоторого комплекса наблюдений на его составляющие части, из которых и выясняется влияние отдельных факторов на изучаемый признак. О достоверности оценок судят по критерию Е-Фишера. Если результаты дисперсионного анализа оказыва­ ются статистически достоверными, переходят к оценкам расхож­ дений между групповыми средними (по критерию ЕСтьюдента, или критерию Е-Фишера), а также и к измерению силы влияния отдельных факторов на изучаемый признак.

Дисперсионный анализ проводится как на малых, так и на больших выборках, на однородном и биологически неоднород­ ном материале, когда в одном и том же комплексе объединяют­ ся результаты наблюдений, проведенных на особях разного пола, возраста, видовой или расовой принадлежности и т. д. Этот ме­ тод оказывается одним из наиболее мощных и эффективных ме­

тодов биометрического анализа;

он

позволяет

решать

самые

различные задачи, возникающие перед исследователем.

 

ОСНОВНЫЕ ПОНЯТИЯ и ТЕРМИНЫ

 

Признаки, изменяющиеся под

воздействием

тех или

иных

причин, называются р е з у л ь т а т и в н ы м и .

А действующие

на результативные признаки причины

принято

называть

ф а к ­

т о р а м и . Например, вес, рост, физическое состояние организма или целой популяции, все это — признаки. А такие средства воз­ действия, как дозы лекарственных или токсических веществ, дозы вносимых в почву удобрений, рационы кормления животных или нормы питания людей и т. п. относятся к категории факторов. Факторы делятся на контролируемые, в опыте, или организован­

265

ные, и неорганизованные, или неконтролируемые, действие ко­ торых на признак не регулируется.

Организованные факторы принято обозначать большими бук­ вами латинского алфавита — А, В, С и т. д., а результативные признаки — через X, У и т. д. Обычно каждый из факторов и результативный признак представлены некоторым количеством подразделений (групп), называемых г р а д а ц и я м и . Они обо­ значаются теми же буквами, что и факторы — А и А2, А3 ... или В], В2, В3 ... и т. д. Градации факторов определяются степенью их воздействия на результативный признак, например, дозами испытываемых веществ, влиянием на урожайность сельскохозяй­ ственных культур сортовой или видовой принадлежности и т. д. Отдельные подразделения результативного признака, например повторности одного и того же опыта, на которых выясняется дей­ ствие регулируемого фактора (или факторов), составляют гра­ дации результативного признака. В зависимости от цели и содержания эксперимента учитываемые признаки могут рас­ сматриваться и как результативные и как факториальные и вы­ ражаться не только абсолютными единицами меры или счета, но и в баллах, индексах и т. п. показателях.

Выборочная совокупность, организованная определенным образом для изучения эффективности действия организованных факторов на результативный признак, называется статистиче­ ским, или дисперсионным, комплексом. Структура такого ком­ плекса определяется числом градаций, на которые подразделя­ ются организованные факторы и учитываемый в опыте признак. Форма дисперсионного комплекса дается таблицей, в которой число столбцов равно числу градаций одного или нескольких организованных факторов, а по строкам откладываются града­ ции результативного признака (если они имеются). Таблица дисперсионного комплекса может быть построена и иначе, что будет показано ниже на конкретных примерах.

В зависимости от числа учитываемых факторов, по которым

проводится дисперсионный анализ,

различают однофакторные,

двухфакторные и

многофакторные

дисперсионные

комплексы.

А по тому, как результаты наблюдений (варианты)

группируют­

ся по градациям

комплекса — поровну, пропорционально или

неравномерно — различают дисперсионные комплексы равномер­

ные и пропорциональные, объединяемые

под общим названием

о р т о г о н а л ь н ы х комплексов,

и комплексы

неравномерные

или н е о р т о г о н а л ь н ы е . Эти

подразделения обусловлены

тем, что в ортогональных комплексах

имеет

место равенство

между факториальными суммами квадратов отклонений, тогда как в неортогональных комплексах это равенство нарушается (см. ниже).

Дисперсионный анализ проводится по некоторым общим схе­ мам, которые будут рассмотрены ниже. Оценка достоверности влияния организованного фактора на результативный признак

266