книги из ГПНТБ / Лакин Г.Ф. Биометрия учеб. пособие
.pdfПараболичекая зависимость
Нередко эмпирические ряды регрессии изображаются графи чески в виде параболической кривой. Применять к таким кривым уравнение линейной функции нельзя, так как оно не описывает такого вида зависимость между переменными величинами. Наи более подходящим в таких случаях оказывается уравнение па раболы общего вида:
у = о, -j- Ьх -j- сх2-j- dx3 |
(139) |
|
Этот полином представляет развитие |
линейной |
функции у — |
— а + Ьх путем увеличения степени при х. |
Здесь у и х — перемен- |
Рис. 24. Эмпирическая и вычисленная кривые лактации:
ча оси абсцисс — лактация, на оси ординат— удой коров в центнерах
ные величины, буквами а, b, с, d... обозначены параметры урав нения. В зависимости от того, на каком члене полинома оста новимся, будем иметь параболу первого, второго и больших порядков. Система нормальных уравнений для определения па раметров параболы второго порядка у= а + Ьх + сх2, которая обычно применяется в биологии, следующая:
2г/ = ап + ЬПх + сПх2— первое уравнение,
Пух = аНх + ЬПхг + сПх3— второе уравнение, |
(140) |
Пух2 = аПх2+ ЬПх3+ сПхі — третье уравнение.
Следовательно, для составления системы нормальных уравнений по эмпирическим данным необходимо определить значения Пу, Пх, Пух, Их2, Их3, Их4, Пух2.
247
Рассмотрим соответствующий пример. У коров ярославской породы удой, выраженный в центнерах, следующим образом из меняется по месяцам лактации:
лактация: |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
удой (ч) за лактацию: |
18,2 |
20,1 |
23,4 |
24,6 |
25,6 |
25,9 |
23,6 |
|
22,7 19,2 |
Если эти данные изобразить графически в виде лактацион ной кривой (рис. 24), можно убедиться в наличии параболиче ской зависимости между этими переменными. Найдем эмпириче ское уравнение регрессии, выражающее эту зависимость. Обо значим лактацию через X, а удой коров — через Y и рассчитаем величины Ex, 'Ey, Еух, Ex2, Eyx2, Ex3 и 2x4, нужные для состав ления системы нормальных уравнений. Расчет приводится в табл. 81.
Т а б л и ц а 81
X |
У |
X Y |
X 2 |
YX* |
X 2 |
X* |
1 |
18,2 |
18,2 |
1 |
18,2 |
1 |
1 |
2 |
20,1 |
40,2 |
4 |
80,4 |
8 |
16 |
3 |
23,4 |
70,2 |
9 |
210,6 |
27 |
81 |
4 |
24,6 |
98,4 |
16 |
393,6 |
64 |
265 |
5 |
25,6 |
128,0 |
25 |
640,0 |
125 |
625 |
6 |
25,9 |
155,4 |
36 |
932,4 |
216 |
1 296 |
7 |
23,6 |
165,2 |
49 |
П 56,4 |
343 |
2 401 |
8 |
22,7 |
181,6 |
64 |
1452,8 |
512 |
4 096 |
9 |
19,2 |
172,1 |
81 |
1555,2 |
729 |
6 561 |
45 |
203,3 |
1030,0 |
285 |
6439,6 |
2025 |
15 342 |
Составляем систему трех уравнений с тремя неизвестными:
9a -f- 456 + 285с = 203 |
— первое уравнение, |
|
45с + |
2856 + 2025с = 1030 |
— второе уравнение, |
285а + |
20256 + 15 342с = 6440 — третье уравнение. |
Решать такую систему можно разными способами. Рассмотрим обычный в таких случаях способ решения нормальных уравнений. Ужножим первое и второе уравнения на дополнительные множи тели: первое на 31,666 (это число получается от деления 285 : 9), а второе — «а 6,333 (этот множитель получен делением 285 : 45) и вычтем первое уравнение из второго. Так освобождаемся от а:
285а + 14256 + 9025с = 6428
285а + 18056 + 12 824с = 6523
— |
3806 + 3799с = 95 |
(1) |
248
Затем из третьего уравнения системы вычитаем второе:
285а + 2025& + 15 342с = 6440
285а + 18056 + 12 824с = 6523
- |
220Ö + 2518с = - 8 3 |
(2) |
Полученную разность (2) умножим на дополнительный множи тель 380 : 220=1,7273 и вычтем ее из разности (1):
380è + 3799с = |
95 |
_______ 380Ь + 4349с = — 143 - 550с = - 238
откуда с——0,43273.
Подставляя в уравнение (1) вместо с его значение, получим: 380 b + 3799 (—6,43273) =95, откуда 0 = 1739 : 380 = 4,5763.
Далее в первое уравнение системы вместо b и с подставляем их значения: 9а+ 45(4,5763) +285(—0,43273) =203. Решая это уравнение, находим
120,4
а — |
13,378. |
|
9 |
В результате получаем следующее эмпирическое уравнение регрессии:
ух = 13,378 + 4,576л:— 0,43273х2.
Из этого уравнения можно определить средний (ожидаемый) удой (ух) коров данной породы за любую лактацию (X). Именно:
лактация: |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
||
удой |
I |
фактич. |
]8,2 |
20,1 |
23,4 |
24,6 |
25,6 |
25,9 |
23,6 |
22,7 |
19,2 |
(ц) |
1 |
вычисл. |
17,6 |
20,8 |
23,3 |
24,8 |
25,5 |
25,3 |
24,2 |
22,3 |
19,5 |
Если нанести эти данные на график, как показано на рис. 24, можно убедиться в том, что они хорошо согласуются друг с другом.
Когда переменная X, как это видно из взятого нами примера, представлена рядом значений, между которыми соблюдается равный интервал, параметры а, b и с уравнения параболы можно определить упрощенным способом произведений. При этом сна чала вычисляются вспомогательные (неприведенные) величины параметров:
4 _ 2 г /Х 2 а 4 — 2(г/а2)2 а2_ |
_ |
2 (уа) |
~ л2а4— 2а2X 2а2 ’ |
— |
2а2 ’ |
сn'Zya2— 'Ey X 2Д2
—п2а4 — 2а2X 2а2 ’
249 ,
где Y — переменная величина, связанная |
корреляционно |
с |
дру- |
|
_ |
JC— |
членов ряда X |
от |
их |
гой величиной X; а = |
-------— отклонения |
|||
|
і |
|
|
|
средней арифметической, отнесенные к величине интервала меж ду членами ряда. При нечетном числе ряда а выражается чис лами 0, 1, 2, 3... (с учетом знаков), а при четном числе членов ряда — 0,5; 1,5; 2,5... (то же с учетом знаков).
Рассчитанные по указанным формулам величины Л, В и С затем приводятся к величинам параметров уравнения а, b и с. Для этого служат следующие формулы приведения:
- , Сх2 Вх |
В 2Сх |
Л + — |
Ь = - |
г2 |
|
Здесь X — средняя арифметическая членов ряда X, остальные
величины объяснены выше.
Покажем применение этого способа на только что рассмот ренном примере. Расчет необходимых вспомогательных значе
ний приводится в табл. 82.
Т а б л и ц а 82
Лактация |
Удой У |
X—X |
Уа |
а 2 |
Га2 |
а* |
YX |
а --------- |
|||||||
X |
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
18,2 |
—4 |
—72,8 |
16 |
291,2 |
256 |
17,7 |
2 |
20,1 |
—3 |
- 6 0 ,3 |
9 |
180,9 |
81 |
20,9 |
3 |
23,4 |
- 2 |
—46,8 |
4 |
93,6 |
16 |
23,3 |
4 |
24,6 |
—1 |
- 2 4 ,6 |
1 |
24,6 |
1 |
24,8 |
х = 5 |
25,6 |
0 |
0 |
0 |
0 |
0 |
25,5 |
6 |
25,9 |
+1 |
+25,9 |
1 |
25,9 |
1 |
25,3 |
7 |
23,6 |
+ 2 |
+47,2 |
4 |
94,4 |
16 |
24,2 |
8 |
22,7 |
+ 3 |
+68,1 |
9 |
204,3 |
81 |
22,2 |
9 |
19,2 |
+ 4 |
+76,8 |
16 |
307,2 |
256 |
19,4 |
45 |
203,3 |
— |
+ 13,5 |
60 |
1222,1 |
708 |
203,3 |
Используя итоговые данные этой таблицы, определяем неприве денные значения параметров:
А = |
203,3 X 708 — 1222,1X 60 |
70610,4 |
== 25,4728; |
|
9 X 708 — 60 X 60 |
2772,0 |
|
|
13,5 |
0,225. |
|
|
В |
|
|
|
60 |
|
|
„ |
9 X 1222,1 — 203,3 X 60 _ |
1199,1 |
_ |
С ~ |
9 X 7 0 8 - 6 0 X 6 0 |
2772,0 |
|
250
Приводим найденные величины к значениям параметров урав нения а, b и с:
а = 25,4728 + (— 0,43257 X 25) - 0,225 X 5 = 13,533,
Ь = 0,225 — 2(— 0,43257 X 5) = 0,225 + 4,3257 = 4,5507,
с = — 0,43257.
Отсюда уравнение регрессии удоя коров по срокам их лактации
ух = 13,533 + 4,55л: — 0,4326л;2.
Рассчитанные по этому уравнению ожидаемые величины удоя коров за каждую лактацию приведены в последнем столбце табл. 82. Видно, что они хорошо согласуются с фактическими
данными.
Рассчитать параметры корреляционного уравнения параболы второго порядка можно также по способу суммирования. Для этого, как и в предыдущем случае, берутся отклонения от сред-
X |
зс |
|
|
|
|
|
|
ней а = -------и вычисляются неприведенные значения парамет- |
|||||||
і |
|
|
|
|
|
|
|
ров, которые равны: |
|
|
|
|
|
|
|
|
А = і-(2г/ X 2а4 - |
Sz/a2 X 2fl2) ; |
|
|
|||
|
в ^ ^ у а _ |
и |
c |
= _L(„2 ^a2- 2 ^ x 2 2 / ) . |
|
||
|
2а2 |
|
|
D |
|
|
|
Здесь D — |
n2(n2— 1) (п2 — 4) |
|
|
|
|||
—--------- —------------- определитель уравнения. |
|
||||||
|
180 |
|
|
|
|
параметров а, |
|
Продемонстрируем |
этот |
способ |
определения |
||||
Ь, и с на том же примере |
корреляционной зависимости |
между |
|||||
сроками лактации и удоем |
коров ярославской |
породы. |
Расчет |
вспомогательных значений приводится в табл. 83.
По данным этой таблицы выпишем нужные нам значения:
2У = 203,3; |
= |
= |
+ 13,5; 2ya2 = |
|
2S2- S ! = |
|
= 2 X 399,8 - |
425,5 = |
1222,1; |
2а2 = 60 |
и 2а4 = 708. |
||
Определяем значение Di |
|
|
|
|
|
|
D - - 92(92 — 1) (92 — 4) |
498 960 |
- |
2772. |
|||
|
180 |
|
|
180 |
|
|
Затем находим неприведенные величины параметров: |
||||||
(203,3 X 708 - |
1222,1 X 60) = |
25,4728; |
||||
2772 |
|
|
|
|
|
|
251
|
13,5 |
|
0,225; С |
|
1 (9 X |
1222,1 -6 0 X 2 0 3 ,3 ) = |
|||||
|
60 |
|
|
|
2772 |
|
|
|
|
|
|
|
|
|
|
=- |
0,43257. |
|
|
|
|
||
Переходим |
к |
определению |
значений |
параметров: |
|
а= Л + |
|||||
+ Сх2 ■— Вх = 13,533; |
Ь = В — 2Сх = 4,551 и |
с = —0,43257, |
откуда |
||||||||
|
|
|
ух = 13,533 + |
4,55а: — 0,4326л:2. |
|
|
|||||
Как и следовало ожидать, |
получился |
тот же |
результат, |
что и |
|||||||
выше. |
|
|
|
|
|
|
|
|
Т а б л и ц а 83 |
||
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
Неполные суммы накопленных значений У |
|
|
|||||
Лакта |
Удой У |
а |
Х~ Х |
|
|
|
|
|
|
а 2 |
а ‘ |
ция X |
с о |
|
(2) |
(3) |
|
(4) |
|||||
|
|
|
і |
|
|
|
|
||||
1 |
1 8 ,2 |
|
- 4 |
1 8 ,2 |
|
1 8 ,2 |
1 8 ,2 |
|
1 8 ,2 |
іб |
256 |
2 |
2 0 ,1 |
|
- 3 |
3 8 ,3 |
|
5 6 , 5 |
7 4 ,7 |
|
— |
9 |
81 |
3 |
2 3 , 4 |
|
- 2 |
6 1 ,7 |
|
1 1 8 ,2 |
— |
|
— |
4 |
16 |
4 |
2 4 , 6 |
|
— 1 |
8 6 ,3 |
|
— |
— |
|
— |
1 |
1 |
|
|
|
|
|
|
|
|
|
|
||
5 |
2 5 , 6 |
|
0 |
0 |
|
0 |
0 |
|
0 |
0 |
0 |
6 |
2 5 , 9 |
|
+ 1 |
9 1 , 4 |
|
— |
|
|
— |
1 |
1 |
7 |
2 3 , 6 |
|
+ 2 |
6 5 ,5 |
|
1 2 6 ,6 |
— |
|
— |
4 |
16 |
8 |
2 2 ,7 |
|
+ 3 |
4 1 , 9 |
|
6 1 ,1 |
8 0 , 3 |
|
— |
9 |
81 |
9 |
1 9 ,2 |
|
+ 4 |
1 9 ,2 |
|
1 9 ,2 |
1 9 ,2 |
|
1 9 ,2 |
16 |
256 |
45 |
2 0 3 ,3 |
|
|
- 2 0 4 , 5 |
- 1 9 2 , 9 |
- 9 2 , 9 |
- 1 8 , 2 |
|
|
||
|
|
|
|
+ 2 1 8 , 0 |
|
+ 2 0 6 , 9 |
+ 9 9 , 5 |
+ 1 9 ,2 |
|
|
|
|
Р а з н и З а ( d ) |
+ 1 3 ,5 |
|
+ 1 4 ,0 |
+ 6 , 6 |
|
+ 1 ,0 |
|
|
||
|
Сум ма (S) |
4 2 2 ,5 |
|
3 9 9 ,8 |
1 9 2 ,4 |
3 7 , 4 |
60 |
708 |
При нелинейных связях характеристикой относительных при бавок величины одного признака (У) при изменении на единицу меры другого (X) служит корреляционное отношение. Этот по казатель можно вычислить по формуле 107а (см. предыдущую главу). Ошибка криволинейной регрессии определяется по фор
муле оу;х— ОуѴ 1 —rj2. Для рассмотренного примера
V , = ^ {^х ~ — = 0,96 и Gy = 2,80
%Ъ ( у і - у ) 2
(читателю предлагается рассчитать эти величины). Откуда ошибка линии регрессии удоя коров по лактации выразится ве личиной
0у,х = 2,8 уі - 0,96 = 2,8 X 0,2 = 0,56 ц.
252
Гиперболическая зависимость
В исследовательской практике встречаются случаи, когда за висимость между переменными X и У носит характер гипербо лической функции. В качестве примера приводим данные А. Д. Слонима и О. П. Щербаковой (1949) о зависимости вели чины основного обмена от веса обезьян (гамадрилов):
вес обезьян |
(кг)(Х): |
1,4 |
2,2 |
2,3 |
2,6 |
3,6 |
4,1 |
4,4 |
5,8 |
осн. обмен |
(ккал |
на |
|
|
|
|
|
|
|
1 кг веса тела за 24 ч) |
117 |
108 |
97 |
116 |
76 |
69 |
64 |
||
(У): |
|
161 |
На| графике этот ряд выглядит в виде гиперболической кривой
Рис. 25. Зависимость величины основ ного обмена от живого веса обезьян:
на |
оси абсцисс — живой вес обезъян (кг), |
на |
оси ординат — килокалорий на I кг ве |
|
са за 24 ч |
(рис. 25), которую можно выразить уравнением общего вида:
У = — + Ь . |
• |
(141) |
X |
|
|
Для определения параметров а и 6 этого уравнения служит сле дующая система нормальных уравнений:
|
Ну — аН |
---- |
Ьп — первое уравнение, |
|
„ |
. |
* |
. |
< 1 4 2 > |
2 — = аХ — |
+ |
62 —— |
второе уравнение. |
Очевидно, чтобы составить систему уравнений, нужно вычислить
значения Ху, |
У |
1 |
1 |
2 — , 2 — и 2 — . Расчет этих значений при- |
|||
|
X |
X |
х^ |
водится в табл. 84.
Пользуясь итоговыми данными табл. 84, составляем систему нор мальных уравнений:
808 = 2,9165а + 86 — первое уравнение,
329,95 = 1,27178а + 2,91656 — второе уравнение.
253
|
|
|
|
|
Т а б л и ц а 84 |
Вес |
Обмен |
л:2 |
V |
1 |
1 |
( к г ) ( X ) |
( к ка л) (у) |
X |
X |
X z |
|
|
|
|
|||
1,4 |
161 |
1,96 |
115,00 |
0,7150 |
0,51020 |
2,2 |
117 |
4,84 |
53,18 |
0,4545 |
0,20660 |
2,3 |
108 |
5,29 |
47,00 |
0,4348 |
0,18903 |
2,6 |
97 |
6,76 |
37,31 |
0,3846 |
0,14792 |
3,6 |
116 |
12,96 |
32,22 |
0,2778 |
0,07716 |
4,1 |
76 |
16,81 |
18,54 |
0,2439 |
0,05949 |
4,4 |
69 |
19,36 |
15,67 |
0,2273 |
0,05165 |
5,8 |
64 |
33,64 |
11,03 |
0,1786 |
0,02973 |
Сумма . . . |
808 |
— |
329,95 |
2,9165 |
1,27178 |
Решая совместно эти уравнения, находим значения параметров:
а = |
808 — 8Ь |
----------- = 277,1 — 2,74fr; Ь = + 3 9 ,5 4 4 0 ; а = 168, |
|
|
2,9165 |
откуда уравнение регрессии Y по X оказывается следующим:
168 ,
Ух — —— Ь 40.
Подставляя в это уравнение вместо X его значения, т. е. вес жи вотных (гамадрилов), выраженный в кг, находим теоретические величины основного обмена в килокалориях на 1 кг веса живот ного за 24 ч:
живой вес |
(кг) (X): |
1,5 |
2 |
4 |
6 |
8 |
10 |
12 |
14 |
16 |
оси. обмен |
(ккал). ( Y x) |
152 |
124 |
82 |
68 |
61 |
57 |
54 |
52 |
51 |
На рис. 25 этот выравненный ряд регрессии выглядит в виде плавной линии, хорошо согласуясь с общей тенденцией эмпири ческой кривой.
Зависимость, выражаемая уравнением показательной функции
Если в развитии признака основная тенденция отличается от линейной регрессии и плохо согласуется с уравнением параболы, она может быть выражена другим подходящим уравнением. В тех случаях, когда эмпирический ряд регрессии следует или близок закону геометрической прогрессии, его удается описать уравнением показательной функции:
у — abx или у == аехЬ. |
(143) |
254
Использование такого вида уравнений связано с их логариф мированием, чем достигается превращение экспоненциальной, т. е. показательной, функции в уравнение прямой линии: lg y = \ g a + x lg b. Это значит, что точки х и lg у располагаются в системе координат на одной прямой. Такое преобразование исходного уравнения облегчает вычислительную работу по опре делению параметров а и b и одновременно служит указанием на то, что выбранное уравнение применяется правильно.
Система нормальных уравнений для определения параметров а и b в данном случае следующая:
2 lg У — п lg а + |
lg b~Zx — первое уравнение, |
2x1 g y = lg а2х + |
(144) |
lg &2х2 — второе уравнение. |
Решать эту систему можно способом подстановки, а также спо собом сложения или вычитания. Однако удобней и быстрее по лучить результат при использовании готовых общих формул:
2lg г/2х2 — 2 (х lg у) 2х
а= -------------------------------- и п2х2 — 2х2
ъ_ nS(xlgff)— 2x2 lg у /г2х2 — 2х2
Очевидно, первым шагом к определению параметров а и b должно быть вычисление 2х, 2х2, 21g у и 2(x-Igt/). Рассмот рим следующий пример. Наблюдения над развитием самцов павианов-гамадрилов в период полового созревания показали, что их вес, выраженный в кг, изменяется с возрастом следующим образом:
возраст |
(мес.) (X): |
20 |
26 |
32 |
38 |
42 |
48 |
52 |
вес (кг) |
(У): |
4,6 |
4,5 |
6,4 |
6,1 |
7,5 |
8,0 |
11,0 |
Графический анализ этих данных показал, что они в общем со ответствуют экспоненциальной кривой. Найдем эмпирическое уравнение регрессии, выражающее эту закономерность. Расчет вспомогательных значений приводится в табл. 85.
Для удобства расчетов фактический возраст животных в этой таблице обозначен числами натурального ряда. Подставляя най денные значения в формулы, получаем значения параметров уравнения:
5,72702 X НО - 24,61801 X 28 |
112,47852 |
|
7 X 140 — 28X 28 |
= 196 |
= 0,57387, |
|
||
7 X 24,61801 — 28 X 5,72702 |
11,96951 |
_ |
7 X 140 — 28X 28 |
196 |
0,0610689, |
~ |
откуда lg ух = 0,061х + 0,574.
255
Т а б л и ц а 85
Возраст я-сивотных |
|
|
|
|
|
|
фактический |
выраженный |
Вес (кг) |
ig г/ |
x \ g y |
X2 |
Ух |
(Ю |
||||||
(X) |
порялк. |
|
|
|
|
|
|
числами (х) |
|
|
|
|
|
20 |
1 |
4,6 |
0,66276 |
,0,66276 |
1 |
4,3 |
26 |
2 |
4,5 |
0,65321 |
1,30642 |
4 |
5,0 |
32 |
3 |
6,4 |
0,80618 |
2,41854 |
9 |
5,7 |
38 |
4 |
6,1 |
0,78533 |
3,14132 |
16 |
6,6 |
42 |
5 |
7,5 |
0,87506 |
5,37530 |
25 |
7,6 |
48 |
6 |
8,0 |
0,90399 |
5,42394 |
36 |
8,7 |
52 |
7 |
11,0 |
1,04139 |
7,28973 |
49 |
10,0 |
Сумма . . |
28 |
48,1 |
5,72702 |
24,61801 |
140 |
47,9 |
Рассчитанные по этому уравнению ожидаемые значения (ух) веса самцов-гамадрилов, соответствующие их возрасту, выра женному в месяцах, приведены в последнем столбце табл. 85 и в виде плавной линии изображены на рис. 26. Видно, что они хорошо отображают описываемую закономерность.
Рис. 26. Эмпирическая и вычисленная по уравнению 143 кривые возрастных изменений живого веса у самцов павиановгамадрилов в период полового созревания:
на оси абсцисс — возраст животных (мес.), на оси ординат — живой вес (кг)
Зависимость, выражаемая уравнением степенной функции
Зависимость между переменными X и У, следующая в общем гиперболической кривой, может выражаться и уравнением сте пенной функции у = ахь, которое логарифмированием превра-
256