книги из ГПНТБ / Лакин Г.Ф. Биометрия учеб. пособие
.pdfЗдесь 2 — знак суммирования; щ — численность |
или |
«вес» |
от |
дельных групп; V — число групп, входящих в состав |
данной |
со |
|
вокупности; п = І1пі — общее число наблюдений; |
хі — частные |
или групповые средние арифметические; х — общая средняя объ единенных групп; o f — частные, или групповые,-дисперсии.
Эта формула показывает, что объединенный средний квадрат (а*2) суммарной совокупности равен средней из групповых дис персий плюс дисперсия групповых средних. Применим эту фор мулу к анализу следующих данных (табл. 16).
Т а б л и ц а 16
|
|
|
|
|
|
Беременность |
|
|
|
|
|
Вариации |
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
Сумма |
|
|
|
|
|
||||||||
Число |
наблюдений |
|
|
|
|
|
|
|
|
|
|
( « » ) ........................ |
.1 . |
17 |
20 |
16 |
17 |
14 |
9 |
5 |
5 |
103 |
|
Срок |
беременности |
170 |
171 |
172 |
173 |
175 |
172 |
177 |
174 |
_ |
|
В ДНЯХ |
(Хі) . . . . |
||||||||||
Дисперсия of |
, . |
63,3 |
26,1 |
19,7 |
27,9 |
14,7 |
18,0 |
14,0 |
55,5 |
— |
В табл. 16 паказано варьирование продолжительности беремен ности у павианов-гамадрилов в зависимости от числа родов. Общая средняя продолжительности плодоношения, вычисленная по этим данным, х = 172,39 дня. Рассчитаем величину общей дис персии и среднее квадратическое отклонение по срокам плодоно шения у павианов-гамадрилов. Расчет необходимых значений показан в табл. 17, Подставляя эти значения в формулу 39, нахо дим:
2 |
2863,7 |
360,4 |
1 = 30>144 + 3>533 = 33.68 дня или |
Gs= 103 — 8 |
юз — |
Os = У33,68 = 5,80 дней
В аналогичном значении формул 38 и 39 нетрудно убедиться, если рассчитать объединенный средний квадрат для этих данных по формуле 38. Так, средний квадрат из отклонений групповых средних от общей средней с учетом «весов» отдельных групп (Пі), т. е. межгрупповая дисперсия:
2 Ъщ {хі — х )2
° х = |
2 ^ |
= |
17X5,71 + 20X1,93 + 16X0,15 + 17X0,37 + ,. + 5X2,59301*
103
364,4 _
3,538.
103
70
|
|
|
|
|
|
|
Т а б л и ц а 17 |
Беремен |
Число |
|
а? |
|
|
|
|
наблюде |
*і |
(п .- 1)хо2[ |
ѵх . - х |
(х.—хУ |
|||
ность |
ний (п^) |
1 |
|||||
1 |
17 |
170 |
63,3 |
1012,8 |
2,39 |
5,71 |
97,1 |
2 |
20 |
171 |
26,1 |
495,9 |
1,39 |
1,93 |
38,6 |
3 |
16 |
172 |
19,7 |
295,5 |
0,39 |
0,15 |
2,4 |
4 |
17 |
173 |
27,9 |
446,4 |
0,61 |
0,37 |
6,3 |
5 |
14 |
175 |
14,7 |
191,1 |
2,61 |
6,81 |
95,3 |
6 |
9 |
172 |
18,0 |
144,0 |
0,39 |
0,15 |
1,4 |
7 |
5 |
177 |
14,0 |
56,0 |
4,61 |
21,25 |
106,3 |
8 |
5 |
174 |
55,5 |
222,0 |
1,61 |
2,59 |
13,0 |
Сумма |
103 |
— |
— |
2863,7 |
— |
— |
360,4 |
Взвешенная средняя из групповых дисперсий:
—2 2 (ttiGi ) ^ Gz==Z Srti ~
= 17 X 63,3 -f- 20 X 26, Г + ... + 5 X 55,5_ 3102,9 =
103 |
103 |
’ |
’ |
откуда общая дисперсия комплекса —
Оу = 3,538 + 30,125 = 33,66 дня или о = У33,63 = 5,80 дней.
Аналогичные, но несколько заниженные результаты получа ются при вычислении дисперсии суммарной совокупности по сле дующей приближенной формуле:
Os2 2 (пі — l)Oj + Ипі(хі — х)2 |
(40) |
ііПі — 1 |
|
Еще более низкие результаты дает формула, нередко встречаю щаяся в биометрических руководствах:
2 2 («г— \)Оі |
(41) |
Os — —-------------- |
П — V
СПОСОБЫ ВЫЧИСЛЕНИЯ СРЕДНЕГО КВАДРАТИЧЕСКОГО ОТКЛОНЕНИЯ
Способ произведений
Для небольшого числа наблюдений, не сгруппированных в вариационный ряд, среднее квадратическое отклонение можно
71
вычислить по общей формуле 35. В таких случаях сначала нахо дят отклонения каждой варианты от средней арифметической, т. е. значения хі—х = аи х2—х = а2, х3—х — а3 и т. д., а затем каж дое отклонение возводится в квадрат, и если варианты повторя ются, то квадраты отклонений от средней умножаются на их час тоты и результаты суммируются. Полученная величина 2р(хг—
—х ) 2 относится к общему числу наблюдений, которое берется числом степеней свободы (п—1), и из частного извлекается квад ратный корень.
Для примера возьмем небольшую группу наблюдений и рас считаем указанным способом среднее квадратическое отклоне ние. У девяти лиц одного пола и возраста определялось содержа ние гемоглобина в крови. Анализы (по Сали) дали следующие результаты: 74 70 77 72 79 88 76 80 86. Средняя арифметическая * = (74 + 70+ 77+ 72 + 79 + 88 + 76 + 80 + 86) : 9= 702 : 9 = 78. Нахо дим отклонения вариант от средней арифметической:
Хі — X = |
74 — 78 = |
— 4 |
х2— X = |
70 — 78 = |
— 8 |
Хз — X — 77 — 78 = |
— 1 |
|
*4 — X = 72 — 78 = |
— 6 |
|
Хъ— X = 79 — 78 = |
+ 1 |
|
Хв — X = 88 — 78 = |
-j- 10 и т. д. |
|
Затем каждое отклонение возводим |
в квадрат: —42= 16, —82 = |
= 64, —І2=1 и т. д. Суммируя квадраты отклонений, получаем Е(хі—х )2 = 290. Подставляя нужные значения в формулу 35, оп ределяем величину среднего квадратического отклонения:
290 |
_____ |
У — |
= 1/36,25 = 6,02. |
Поскольку 2 ( хі—х ) 2 выражается различными тождествами, формулу среднего квадратического отклонения можно модифи цировать. В частности, среднее квадратическое отклонение опре деляется по следующим аналогичным формулам:
Применим эти формулы к только что рассмотренному при меру:
E x 2 = 7 4 2 _j_ 7 Q2 _|_ 7 7 2 _|_ 722 + 7 9 2 |
8 8 2 7 5 2 _)_ |
72
|
2л; |
+ 802 + |
862 = |
55 046; |
|
|
|
X |
702/9 = |
78 |
и |
X2 = 782 = 6084. |
|
|
|
п |
|
|
|||||
|
|
|
|
|
|
|
|
Подставляем эти значения в формулу 42: |
|
|
|||||
1 / |
„ |
7022 \ |
|
1 |
|
36,25 |
|
^55 046 - —g—I = |
— (55 046 - 54 756) = |
||||||
и |
|
а = У36,25 = |
6,02. |
|
|
||
Или же а2 = |
9 / |
55 046 |
|
\ |
9 , |
|
|
— |
--------------782) = |
— (6116,22 — 6084,0) |
' |
||||
|
8 \ |
9 |
|
! |
8 ѵ |
|
При вычислении паказателей вариации на многозначных числах последние можно преобразовать в простые, что значитель но облегчит работу. Это достигается уменьшением каждой вари анты на какую-то постоянную величину или делением значений признака на одно и то же положительное число. Основанием слу жат теоремы о средней и дисперсии, которые рассматривались выше: величина дисперсии и среднего квадратического отклоне ния от этого не изменится. Так, варианты рассматриваемой сово купности можно уменьшить на 70, получится следующий ряд значений: 4 0 7 2 9 18 6 10 16. Находим: 2х = 72, 2х2= 16+ 49 + + 4+ ... +236 = 866. Подставляя эти значения в формулу, имеем;
Получился тот же результат, что и выше, а вычисления ока зались проще.
В тех случаях, когда среднее квадратическое отклонение вы числяется на совокупности, сгруппированной в интервальный ва риационный ряд, отклонения а — (Хі—х) берутся как отклонения классовых вариант от средней арифметической. Покажем приме
нение этого способа на примере распределения кальция |
{мг%) |
в сыворотке крови павианов-гамадрилов. Напомним, что |
сред |
няя этого распределения ж = 11,9 мг°]о. Расчет нужных значений для подстановки в формулу среднего квадратического отклоне-« ния показан в табл. 18.
Подставля найденные значения в формулу, получаем:
73
|
|
|
|
|
|
Т а б л и ц а 18 |
Классовые |
Частоты |
Отклонения |
о* |
р а 2 |
р а г |
р а 4 |
варианты |
(Р) |
а=Х}—X |
||||
(X) |
|
|
|
|
||
|
|
|
|
|
|
|
8,9 |
2 |
- 3 , 0 |
9,00 |
18,00 |
— 54,000 |
162,0000 |
9 ,6 |
3 |
- 2 , 3 |
5,29 |
15,87 |
-3 6 ,5 0 1 |
83,9523 |
10,3 |
9 |
- 1 , 6 |
2,56 |
23,04 |
— 36,864 |
58,9824 |
11,0 |
17 |
- 0 , 9 |
0,81 |
13,77 |
- 1 2 ,3 9 3 |
11,1537 |
11,7 |
25 |
- 0 , 2 |
0,04 |
1,00 |
- 0 ,2 0 0 |
0,0400 |
12,4 |
23 |
+ 0 ,5 |
0,25 |
5,75 |
+ 2 ,8 7 5 |
1,4375 |
13,1 |
10 |
+ 1,2 |
1,44 |
14,40 |
+ 17,280 |
20,7360 |
13,8 |
7 |
+ 1 ,9 |
3,61 |
25,27 |
+48,013 |
91,2247 |
14,5 |
4 |
+ 2 ,6 |
6,76 |
27,04 |
+ 70,304 |
182,7904 |
Сумма |
100 |
— |
- |
144,14 |
- 1 ,4 8 6 |
612,3170 |
|
|
|
|
|
|
|
П р и м е ч а н и е . |
Графы ра3 ира* понадобятся |
в дальнейшем. |
Способ условной средней
Среднее квадратическое отклонение можно вычислить упро щенным способом, приняв условно вместо средней (х) одну из вариант, для которой х—Л =0. При этом способе отклонения ва риант (или классов) берутся не от истинной средней х, а от ус ловной А. Формула среднего квадратического отклонения при этом способе расчета приобретает следующий вид:
1 * п |
п |
где а ~ х —А '.
Покажем применение этой формулы на примере распределе ния кальция (мг%) в сыворотке крови павианов-гамадрилов (табл.19).
Подставляем найденные значения в формулу 43:
|
147,98 |
У1,48 —0,04 |
у 1,44 = |
1,20 мг% |
Если отклонения |
||||
а — Ѵі |
100 |
|
||
|
|
классовых вариант от условной |
средней А |
отнести к величине классового интервала, т. е. вместо а = (х{—А) взять а = (Xj—А)/і, то расчеты значительно упрощаются. В таких случаях отклонения классовых вариант (или классов) от услов ной средней А, где отклонение а= 0, принимают значения чисел
1 Конструкция данной формулы станет понятной, если вспомнить, что цент ральный момент второго порядка связан с условным моментом того же поряд-
ка равенством |
2 |
Ъ р ( Х і — Х)2 |
_ |
Ъ р ( Х [ — А )2 |
|
Р2 =&2—Ь \ |
, где рг= |
h ■ |
И |
||
|
Ир (Хі —А) |
п |
|
п |
|
Н |
|
|
|
||
I |
• |
|
|
|
74
|
|
|
|
Т а б л и ц а 19 |
||
Классовые |
Частоты (р) |
Отклонения классовых |
Произведение откло |
р а 2 |
||
варианты |
вариантов от условной |
нений на частоты |
||||
( х) |
|
средней ( а —х ~ А ) |
|
(ра ) |
|
|
8 , 9 |
2 |
-2,8 |
- 5 , 6 |
1 5 |
,6 8 |
|
9 , 6 |
3 |
-2,1 |
- 6 , 3 |
1 3 |
, 2 3 |
|
1 0 , 3 |
9 |
- 1 , 4 |
-12,6 |
1 7 |
, 6 4 |
|
11,0 |
17 |
- 0 , 7 |
- 1 1 , 9 |
8 , 3 3 |
||
И т о г о . . . |
— |
— |
- 3 6 , 4 |
— |
|
|
А = 1 1 ,7 |
25 |
0 |
|
0 |
0 |
|
1 2 ,4 |
23 |
+ 0 , 7 |
+ 1 6 , 1 ' |
1 1 ,2 7 |
||
1 3 ,1 |
10 |
+ 1 ,4 |
+ |
1 4 ,0 |
1 9 |
,6 0 |
1 3 ,8 |
7 |
+2,1 |
+ |
1 4 ,7 |
3 0 ,8 7 |
|
1 4 ,5 |
4 |
+2,8 |
+ 11,2 |
3 1 ,3 6 |
||
И т о г о . . . |
— |
— |
+ 5 6 , 0 |
— |
|
|
С у м м а . . . |
100 |
— |
+ 1 9 , 6 |
1 4 7 |
,9 8 |
натурального ряда, т. е. обозначаются как 1, 2, 3, 4, 5 и т. д. При этом отклонения классов или вариант от условной средней в сто
рону меньших значений, чем А, берутся с отрицательным |
(—), а |
в сторону больших значений — о положительным ( + ) |
знаком. |
Среднее квадратическое отклонение в таких случаях должно ум ножаться на величину классового интервала, формула 43 приоб ретает следующий вид:
|
|
|
|
<«■ >. |
Применим эту формулу |
к тому же примеру распределения |
|||
кальция (мг%) |
в |
сыворотке крови павианов-гамадрилов |
||
(табл. 20). |
|
|
|
|
У ОАО |
/ |
OQ |
\2 |
0,7У2,94 = 0,7 X 1,715 = 1,20 мг%. |
— - |
( — |
) = |
Сравнивая этот способ с предыдущим, нельзя не видеть преиму щества последнего, позволящего просто и быстро рассчитывать среднее квадратическое отклонение.
75
|
|
|
|
|
|
Т а б л и ц а 20 |
Классовые |
Частоты |
т —А |
ра |
р а 2 |
р а ъ |
р а 1 |
а = : |
||||||
варианты (*) |
(Р) |
1 |
і |
|
|
|
|
|
|
|
|
|
|
8 , 9 |
2 |
- 4 |
- 8 |
32 |
- 1 2 8 |
512 |
9 , 6 |
3 |
- 3 |
- 9 |
27 |
- 8 1 |
243 |
1 0 ,3 |
9 |
- 2 |
- 1 8 |
36 |
- 7 2 |
144 |
1 1 ,0 |
17 |
— 1 |
- 1 7 |
17 |
- 1 7 |
17 |
Итого . . . |
— |
— |
- 5 2 |
— |
- 2 9 8 |
— |
А = 1 1 ,7 |
25 |
0 |
0 |
0 |
0 |
0 |
1 2 ,4 |
2 3 |
-f-1 |
+ 2 3 |
2 3 |
+ 2 3 |
23 |
13,1 |
10 |
+ 2 |
+ 2 0 |
40 |
+ 8 0 |
160 |
1 3 ,8 |
7 |
+ 3 |
+ 2 1 |
63 |
+ 189 |
56 7 |
1 4 ,5 |
4 |
+ 4 |
+ 16 |
64 |
+ 2 5 6 |
1024 |
Итого , . . |
— |
— |
+ 8 0 |
— |
+ 548 |
— |
Сумма . . |
100 |
— |
+ 2 8 |
302 |
+ 2 5 0 |
2690 |
На выборках небольшого объема, особенно когда они не сгруппированы в вариационный ряд, среднее квадратическое от клонение вычисляется тем же способом по следующей формуле:
•j/ |
п Г 2а2 |
er = |
(44) |
' |
п — 1 *- п |
Здесь а — отклонение варианты от условной средней, в качестве которой может быть взята любая варианта; п — общее число ва риант, на которых вычисляется среднее квадратическое отклоне ние.
Покажем применение этой формулы на примере содержания гемоглобина в крови у девяти одновозрастных лиц, который рас сматривался выше.
х: |
74 |
70 |
77 |
72 |
79 |
88 |
76 |
80 |
86 |
а: |
0 |
—4 |
+3 |
- 2 |
+ 5 |
+ 14 |
+2 |
+ 6 |
+12; |
а* |
0 |
16 |
9 |
4 |
25 |
196 |
4 |
36 |
144 |
откуда |
|
|
|
|
Іа = |
+36 |
|
2а2 = 434, |
|
9 |
Г 434 |
/ 36 \ 21 |
|
|
|
|
|
||
|
-9(32,22) = |
36,25 |
и а == 6,02. |
||||||
|
|
|
|
|
76
Получился такой же результат, какой был получен при вычисле нии среднего квадратического отклонения прямым способом.
Приближенное значение среднего квадратического отклоне ния можно получить, разделив размах вариации на 2, если число наблюдений (п) равно примерно 5, или на 3, когда п= 10; на 4 при п = 25 или на 5 при п= 100 (по Снедекору, 1961). Так, размах вариации по содержанию гемоглобина в крови у девяти лиц ра
вен |
88—70=18, |
откуда о = 18/3 = 6. Размах распределения |
каль |
ция |
(мг°/о) в |
сыворотке крови павианов-гамадрилов |
равен: |
14,70—8,99 = 5,71^6 мг%. При п= 100 среднее квадратическое отклонение должно равняться: 6/5 = 1,2 мг%. Видно, что этот рас чет достаточно хорошо согласуется с полученными выше величи нами.
Способ суммирования
Среднее квадратическое отклонение можно вычислить и спо собом суммирования, который рассматривался выше примени тельно к расчету средней арифметической. Поскольку этот способ имеет два варианта, среднее квадратическое отклонение опреде ляется по следующим аналогичным формулам:
|
(45) |
Здесь S = 2 I + 22 + 223+ 2 2 4, где |
2і и 2 2— суммы первого и |
2 3 и 2 4 — суммы второго неполных |
рядов накопленных частот, |
образуемых кумуляцией частот с противоположных концов ва риационного ряда в направлении условной средней А; d —2 і—2 2 (из большей суммы вычитается меньшая); і — величина классо вого интервала; п — общее число вариант, на которых вычисля ется среднее квадратическое отклонение.
(46)
В этой формуле Si — сумма первого полного ряда накопленных частот, получаемого кумуляцией частот в направлении от макси мальной классовой варианты (или класса) до конца вариацион
ного ряда; S2 — сумма второго полного |
ряда накопленных час |
тот, образуемого кумуляцией значений |
первого ряда в том же |
направлении. |
|
Покажем применение этого способа на известном нам приме ре распределения кальция (мг%) в сыворотке крови павиановгамадрилов. Расчет необходимых вспомогательных величин по казан в табл. 21. Пользуясь итоговыми данными этой таблицы, находим: d = 80—52 = 28, S = 52 + 80+ (2x30) + (2X55) =302. Подставляем эти величины в формулу 45:
77
Классовые
варианты
<*)
8,9
9,6
10,3
11,0
Итого . . .
А= 11,7
12,4
13,1
13,8
14,5
Итого . . .
Сумма . . .
Частоты
(р)
2
3
9
17
—
25
23
10
7
4
—
О о
|
|
|
Т а б л и ц а 21 |
|
Неполные ряды накопленных |
Полные ряды накопленных |
|||
частот |
|
частот |
||
первый |
второй |
первый |
второй |
|
2 |
2 |
|
100 |
528 |
5 |
7 |
|
98 |
428 |
14 |
21 |
|
95 |
330 |
32 |
|
|
86 |
235 |
- S j = 52 |
н w |
О |
— |
— |
|
со |
со |
|
|
1 |
! |
|
|
149 |
0 |
0 |
|
69 |
|
44 |
36 |
|
44 |
80 |
21 |
|
21 |
36 |
|
11 |
15 |
|
11 |
15 |
4 |
4 |
|
4 |
4 |
со II |
24 = 55 |
- |
— |
|
О |
|
|
|
|
Cu II to 00 |
— |
|
S x = 528 |
S2 = 1805 |
Таким же образом используется и формула 46:
о = 0,7 у ^ х Ш І 5 |
528 |
528 |
0,7 У2,94 =
100НЮ 1 + І Г о ) “
=0,7 X 1,715 = .1,20 мг %.
КОЭФФИЦИЕНТ ВАРИАЦИИ
Среднее квадратическое отклонение является основным мери лом вариабильности признаков. Этот показатель не зависит от числа наблюдений, и потому может использоваться для сравни тельной оценки варьирования однородных признаков. Вместе с тем широкому использованию среднего квадратического откло нения в качестве меры сравнения вариабильности признаков ме шает то, что этот показатель является величиной именованной. В самом деле, выше было' показано, что среднее квадратическое отклонение ряда распределения кальция (мг%) в сыворотке кро ви павианов-гамадрилов равно 1,20 мг%, а варьирование дат ских угрей по числу позвонков характеризуется средним квадра-
78
тическим отклонением равным 1,35 позвонка. Можно ли на этом основании сказать, что датские угри более изменчивы по числу позвонков, чем гамадрилы по уровню кальция в сыворотке кро ви? Нет, этого нельзя сказать, потому что признаки выражены разными единицами измерения.
Чтобы среднее квадратическое отклонение могло быть исполь зовано в качестве меры сравнения вариабильности признаков не зависимо от того, какими единицами измерения они выражены, его принято выражать в процентах от средней арифметической. Полученный таким образом показатель оказывается числом от носительным, выражающим изменчивость признаков в процен
тах его называют ко э ф фи ц и е нт о м в а р и а ц и и |
и обозна |
|
чают символом СѴ, т. е. |
|
|
СѴ = 100 4- |
%• |
(47) |
X |
|
|
Например, коэффициент вариации |
уровня кальция |
в сыво |
ротке крови павианов-гамадрилов равен:
СѴі = ЮО-уууг — Ю,1%.
тогда как коэффициент вариации датских угрей по числу позвон ков
Из сопоставления этих показателей видно, что первый признак варьирует сильнее, чем второй.
Величина коэффициента вариации определяется отношением абсолютных значений двух основных характеристик вариацион ного ряда — средней арифметической и среднего квадратическо го отклонения. При нормальном распределении коэффициент ва риации обычно не превышает 45—50% и часто бывает гораздо ниже этого уровня. В случаях же асимметричных распределений он может быть довольно высоким, достигающим иногда 100% и выше. Особенно высоким коэффициентом вариации характеризу ются признаки, распределяемые по закону Пуассона. Покажем это на следующем примере. Изучалась поражаемость клеток при облучении ткани животного организма альфа-частицами. Было проведено 517 испытаний; результаты распределились следую щим образом:
число пораженных |
клеток (х): |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
частота поражений |
(р): |
112 |
168 |
130 |
68 |
32 |
5 |
1 |
1 |
1 Коэффициент вариации можно выразить не только в процентах, но и в
а
долях единицы, т. е. в виде отношения“
X
79