книги из ГПНТБ / Лакин Г.Ф. Биометрия учеб. пособие
.pdfкие случайные события наблюдаются в области микробиологии, радиобиологии, биофизики и в других отраслях биологической науки. Сэджер и Райн (1964) показали, что спонтанный мутаци онный процесс у кишечной палочки (Escherichia coli) описыва ется формулой Пуассона
рп(т)
ат
Рие. 9. График функции Рп(т) = — е-“ для раз
ных значений а
ПАРАМЕТРЫ РАСПРЕДЕЛЕНИЯ ПУАССОНА
Закон распределения редких событий, описываемый форму лой Пуассона, является частным случаем биномиального распре деления и характеризуется теми же параметрами, что и биномиальное распределение. Но в отличие от последнего для распределения Пуассона характерно совпадение по абсолютной величине математического ожидания и дисперсии случайной ве личины. Иначе говоря, дисперсия случайной величины, распре деляемой по закону Пуассона, равна наивероятнейшей частоте этой величины или ее математическому ожиданию: D(m)=a.
* *
Рассмотренные законы распределения выведены путем мате матической индукции на основании известных фактов. Они про диктованы конкретными задачами и служат математическими моделями эмпирических распределений. Значение описанных те оретических законов распределения в исследовательской работе исключительно велико: они составляют логическую основу био метрии, на них опирается статистический анализ массовых явлений.
' С э д ж е р |
Р. и Р а й н Ф. Цитологические и химические основы на |
следственности. |
«Мир», М., 1964, стр. 62—68. |
40
ГЛАВА ЧЕТВЕРТАЯ
СРЕДНИЕ ВЕЛИЧИНЫ
ВИДЫ СРЕДНИХ И ИХ ЗНАЧЕНИЕ
Одной из важнейших обобщающих характеристик варьирую
щих признаков является |
с р е д н я я в ел и ч и н а. Характеризуя |
ту или иную популяцию, |
говорят, например, о средней продук |
тивности животных или растительных организмов, средней успе ваемости учащихся, о средней скорости биохимических реакций и о многих других средних величинах. Значение средних заклю чается в их свойстве нивелировать индивидуальные различия, в результате чего выступает более или менее устойчивая числовая характеристика признака — не отдельных представителей, а це лой группы статистических единиц.
Средняя величина характеризует групповые свойства. В ней, как в фокусе лучи, сходятся все силовые линии тех многочислен ных влияний, под воздействием которых происходит развитие признака и определяется размах его вариации. В средней нахо дит свое выражение внутренняя связь, существующая между от дельными вариантами и всей их совокупностью в целом. Средняя величина — это центр распределения: она занимает центральное положение в общей массе варьирующих значений признака.
Существует несколько видов средних. Применяемые в биоло гии средние делятся на степенные, или параметрические, и сред ние порядковые, или непараметрические. Параметрические сред ние функционально связаны с распределением варьирующих признаков, тогда как порядковые средние функциональной связи с распределением признаков не имеют, характеризуя лишь струк турные особенности вариации, поэтому и относятся к группе структурных средних. К ним принадлежат медиана, мода и неко торые другие средние показатели.
Параметрические, или степенные, средние получаются из
общей формулы:
h
|
|
(17) |
где X — средняя величина; х — варианта; |
2 — знак суммирова |
|
ния; п — объем совокупности, на котором |
вычисляется |
средняя; |
k— величина, определяющая вид средней. Так, при &=1 |
получа |
ется средняя арифметическая (х), при k ——1 — средняя гармо ническая (хи), при k = 2 — средняя квадратическая и т. д.
Наряду с общими средними, характеризующими всю совокуп ность наблюдений, различают частные, или групповые, средние (хі ), вычисляемые на отдельных (частных) группах вариант,
41
входящих в состав общей совокупности или данного комплекса (в дисперсионном анализе).
Критерием правильного выбора средней служат ее свойства, которые должны соответствовать содержанию описываемого яв ления и согласоваться с задачами и характером исследования. Если эти условия не выполняются, средняя не может служить точной обобщающей характеристикой массовых явлений.
СРЕДНЯЯ АРИФМЕТИЧЕСКАЯ
Простая средняя арифметическая
Из всех параметрических средних наиболее часто применяет ся средняя арифметическая (х ), представляющая частное от де ления суммы всех вариант совокупности на их общее число:
Хі -{- Х2 -f- Х3 -f- . . . -f- Хп 2Xt
(17)
п |
п |
Например, в помете каждой из шести свиноматок было получено следующее количество поросят:
№ животных по порядку: |
4 |
5 |
6 |
число поросят в помете: |
5 |
8 |
10 |
В данном случае численность отдельных вариант повторяется всего один раз. В этом легко убедиться, распределив эти данные в вариационный ряд:
число поросят в помете
(* ): |
4 |
|
5 |
6 |
8 |
9 |
10 |
количество пометов |
(ча |
1 |
1 |
1 |
|
1 |
1 |
стота, р) : |
1 |
|
Средняя арифметическая, вычисленная для такого рода сово купности-, называется п р о с т о й , или невзвешенной средней. В данном случае:
1 |
( 4 + |
42 |
X = — |
5 + 6 + 8 + Э _|_ 10) = —■= 7 поросят. |
|
6 |
|
R |
Средняя арифметическая — величина именованная, она выра жается теми же единицами измерения, что и характеризуемый ею признак.
Взвешенная средняя
Если же в совокупности наблюдений отдельные варианты пов торяются р раз, то средняя вычисляется с учетом повторяемости вариант по следующей формуле:
ХіРі + Х2р2 “Ь • • • + Хпр п |
2 Хірі |
p i + Pz + . • • + Рп |
( 18) |
2 Pi |
42
где X — значения вариант, а р — их частоты или «веса». Средняя, вычисляемая с учетом частот или «весов» отдельных вариант, на зывается в з в е ш е н н о й средней. Само собой понятно, что варианта, которая встречается в совокупности наиболее часто, окажет и большее влияние на среднюю величину по сравнению с другими вариантами, входящими в ее состав. Отсюда и возника ет понятие статистического веса, совпадающее с понятием часто ты отдельных вариант изучаемой совокупности. Например, ре зультаты подсчета количества зерен, содержавшихся в 18 наугад отобранных колосьях озимой ржи, распределились следующим образом:
количество зерен |
в ко |
8 |
9 |
10 |
11 |
12 |
13 |
лосьях (X): |
7 |
||||||
число колосьев |
(часто |
1 |
2 |
7 |
3 |
3 |
1 |
та, р ) : |
1 |
Сумма частот составляет 2р=18. Видно, что разные колосья содержат разное количество зерен, но не все имеют одинаковый «вес»: большее число колосьев содержит по десять зерен, тогда как другие колосья имеют одни меньше, другие больше зерен. Средняя арифметическая в этом случае определяется так:
* = і 8 ( 7 Х 1 + 8 Х 1 + 9 Х 2 + 1 0 Х 7 + П Х 3 +
+ 1 2 X3 + 13Х 1) = ——■= 10,28 зерен. 18
Аналогичным способом рассчитывается и общая средняя (х) из суммы частных средних (#,), полученных на однородных группах наблюдений. Только весами в таких случаях служат не частоты вариант, а объемы групп, на которых вычислены частные средние. Формула 18 применительно к такого рода случаям при обретает следующий вид:
ХіПі + хгп2+ ... + |
xhtih |
ЪхіШ |
( 1У) |
СС— -------1 I... |
Пъ. |
— ----------' |
|
П\-{- П2~\~ . . |
|
|
Например, на одновозрастной группе одного и того же пола в составе 30 человек определялось количество гемоглобина в крови. Средняя арифметическая оказалась равной 69,8%. В то же время на другой аналогичной группе, насчитывавшей 20 человек, тот же показатель оказался равным 64,9%- Нужно определить среднее содержание гемоглобина в крови по суммарным данным для всех 50 человек.
Если бы число наблюдений в первом и во втором случаях было одинаковым, задача решалась довольно просто — путем отнесения суммы частных средних арифметических к их числу, т. е. в данном случае взяли бы полусумму групповых средних:
<3
х = (69,8 + 64,9) : 2 = 67,35%. Но при разных объемах групп этот суммарный показатель будет неточным, так как он не учитыва ет веса частных средних, входящих в обобщенную среднюю вели чину. Поэтому более точный результат получится, если общая средняя рассчитывается по формуле 19:
30 X 69,8 + 20 X 64,9
67,84%.
30 + 20
Сокращенный способ вычисления средней арифметической (способ условной средней)
Вычисление средней арифметической описанным выше спо собом взвешенных вариант не всегда удобно, особенно на сово купностях большого объема и при наличии многозначных чисел, когда вычислительная работа становится особенно трудоемкой. В таких случаях проще рассчитать среднеарифметическую упро щенным способом, описываемом в разных руководствах под раз ными названиями: способ условного начала, условной средней, условного нуля, условного интервала и т. д. Сущность этого спо соба, для которого здесь сохраняется название условной средней, заключается в следующем. Одну из вариант, все равно какую, условно принимают за среднюю величину, обозначив ее через А. Обычно в качестве условной средней, или условного начала, бе
рется варианта (или класс) с наибольшей |
или близкой к |
ней |
||
частотой, хотя это не обязательно. |
найти |
величину |
той |
|
Выбрав |
условную среднюю, остается |
|||
поправки, |
которую следует прибавить или |
отнять |
от условной |
средней, чтобы получить истинное значение средней арифметиче ской (X). Такой поправкой служит взвешенная сумма отклонений вариант от условной средней, отнесенная к числу всех вариант данной совокупности и называемая условным моментом первого
порядка (by): |
2(Хі — А)р _ |
Spa |
_ |
||
1 |
2р |
п |
Под моментами распределения понимаются средние величи ны, представляющие отклонения вариант от какого-нибудь чис ла — средней арифметической, условной средней или нуля, воз веденные в ту или иную степень и отнесенные к общему числу наблюдений. При этом отклонением называется разность между
любой вариантой |
и ее средней арифметической |
(ж), условной |
|||
средней (А) или |
нулем |
(0), |
которую принято |
писать |
в виде |
X—X, х —А или X—0, но |
не |
как х —х, А —х или |
0—х |
на том |
основании, чтобы отклонения вариант меньше средней величины
имели отрицательный (—), а отклонения |
вариант, которые по |
своей величине больше средней, имели |
бы положительный |
знак ( + ). |
|
44
Если отклонения берутся от среднеарифметической, моменты называются ц е н т р а л ь н ы м и ; их обыкновенно обозначают греческой буквой ц (ми). Если же отклонения берутся от произ вольно выбранного числа А, моменты называются у с л о в н ы -
м и. Когда же отклонения берутся от нуля, моменты называются
на ч а л ь н ы м и . В зависимости от степени отклонений моменты распределения могут быть первого, второго и больших порядков (табл. 8).
|
|
|
|
|
|
|
Т а б л и ц а 8 |
|
Моменты распределения |
Начальные |
Центральные |
|
Условные |
||||
1-го |
порядка |
|
Ир ( X — 0) |
|
Ир (х — х) |
, |
= |
Н р ( х —А) |
|
|
|
|
|
п |
ь 1 |
п |
|
|
|
|
|
|
|
|
||
|
|
|
Ирх |
|
|
|
|
|
|
|
|
п |
|
|
|
|
|
2-го |
порядка |
/И2 — |
Ир (х — 0)2 |
— f*2 — |
Ир (х — х)2 |
ъ2 = |
|
Ир (х — А)2 |
|
|
п |
п |
|
п |
|||
|
|
|
|
|
|
Ирх2
п
3-го порядка
4-го порядка
/Из — |
Ир( х — 0)3 |
|
Ир (X — x ) s |
, |
|
'Ир (-* — Д ) 3 |
— |
и* — |
п |
bз = |
п |
||
|
п |
|
|
|
||
|
Ирх 3 |
|
|
|
|
|
|
п |
|
|
|
|
|
|
Ир (X — 0)4 |
|
Ир (X — х)4 |
, |
_ |
Н р ( х - А ) 4 |
4 |
п |
|
п |
й4 |
|
|
|
|
|
|
Ирх4
п
Можно сказать, что средняя арифметическая (ж) является на чальным моментом первого порядка (mi). Центральные моменты нормального распределения связаны с условными моментами следующими формулами, которые используются при вычислении характеристик вариационного ряда:
М2 = |
Ьг — Ьі |
|
М з :==:; Ьз — 3 è i& 2 |
2 & 1 |
|
М4 = |
Ьі —• іЬфз + |
66?bz — 3bi. |
45
Используя условный момент первого порядка в качестве по правки к условной средней А, получим формулу средней ариф метической:
X = А |
hpa |
( 20) |
|
п |
|||
|
|
Покажем применение этой формулы на рассмотренном выше, примере; определим среднее число зерен в 10 колосьях озимой ржи:
значения |
вариант (х): |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
частоты |
(р) : |
1 |
1 |
2 |
7 |
3 |
3 |
1 |
отклонения а = х - - А: |
- 4 |
- 3 |
—2 |
—1 |
4 0 |
+ 1 |
+ 2 |
|
произведения ра: |
—4 |
- 3 |
- 4 |
—7 |
0 |
+ 3 |
+ 2 |
Сумма произведений частот на отклонения: —18+ 5= —13, откуда
X — 11 Н |
— 13 |
= 11 — 0,72 = 10,28 зерен. |
18V
Вкачестве условной средней взята варианта «11». Но можно взять любую другую варианту и результат получится тот же самый:
варианты (х): |
7 |
8 9 |
10 |
11 |
12 |
13 |
частоты (р) : |
1 |
1 |
2 7 |
3 |
3 |
1 |
отклонения а: |
—2 |
—1 |
0 + 1 |
+ 2 |
+ 3 |
+ 4 |
произведения ра: |
—2 |
—1 |
0 + 7 |
+ 6 |
+ 9 |
+ 4 |
|
— — 3 + 26 — 23, |
|
|
|
||
откуда |
|
|
|
|
|
|
X = 9 |
|
10,28 зерен.' |
|
|
Преимущество этого способа особенно заметно при вычисле нии средней арифметической на больших совокупностях и при наличии многозначных чисел. Покажем это на следующем при мере. По данным Л. С. Берга (1924), 267 датских угрей распре делились по числу позвонков следующим образом:
варианты (х): |
111 |
112 |
113 |
114 |
115 |
116 |
117 |
118 |
119 |
частоты (р): |
3 |
9 |
31 |
71 |
82 |
46 |
19 |
5 |
1 |
Перемножив варианты на их частоты и просуммировав результа
ты, получим: |
2х/? = |
111 X 3 + 112 X 9 + 113 X 31 + |
114 X 71 + |
|
+ 1 1 5 X 8 2 + |
1 1 6 X 4 6 + 117 X 1 9 + 118X 5 + П 9 Х |
1 = 30636, |
||
2хр |
30 636 |
1ІЛГ7/І |
|
|
откуда X — ------ = ----------= |
114,74 позвонка. |
|
||
|
п |
267 |
|
|
46
Теперь рассчитаем среднюю арифметическую этого распре деления по упрощенному способу. В качестве условной средней
ізьмем варианту 115, т. е. А = 115:
варианты (х): |
111 |
1.12 |
113 |
114 |
115 |
116 |
117 |
118 |
119 |
частоты (р): |
3 |
9 |
31 |
71 |
82 |
46 |
19 |
5 |
1 |
отклонения а: |
- 4 |
- 3 |
- 2 |
--1 |
0 |
+1 |
+ 2 |
+ 3 |
+ 4 |
ра: |
- 1 2 |
- 2 7 |
- 6 2 |
--71 |
0 |
+ 46 |
+38 |
+ 15 |
+ 4 |
|
|
-1 7 2 |
|
|
|
+103 |
|
||
^ р а = |
— 172 + 103 = |
— 69. |
|
|
|
|
|
||
Подставляем найденное значение в формулу: |
|
|
|
||||||
Ира |
|
— 69 |
115 — 0,26 = 114,74 позвонка. |
||||||
X = А -1-------- = |
115 -|--------- = |
п267
Получился тот же результат, что и выше, но при меньшей вычислительной работе, так как удалось избежать перемноже ния многозначных чисел.
Описываемый способ еще больше упрощается, если отклоне ния классовых вариант от условной средней относить к величи не классового интервала, т. е. вместо а = х — А выражать откло-
нения в виде а = |
JC ■ |
______. Тогда отклонения от условной средней, |
|
|
і |
где а = 0, выражаются числами натурального ряда, т. |
е. как 1, 2, |
3, 4 и т. д. (обязательно с учетом знаков!). При этом |
в формулу |
20 вносится |
поправка: условный момент первого |
порядка |
— Ьх — ------ |
что входит в состав формулы, умножается на вели- |
|
п |
|
|
чину классового интервала і: |
|
|
|
-х= а + і {1Е1). |
(Si) |
Эта формула настолько упрощает расчеты средней арифметиче ской, что, кажется, предпочесть этому способу какой-нибудь дру гой просто невозможно.
Применим эту формулу, а для сравнения и предыдущую фор мулу 20 к расчету средней арифметической ряда распределения по уровню кальция (мг%) в сыворотке крови лавианов-гамадри-
лов (табл. 9).
Подставляя из табл. 9 в формулы 20 и 21 соответствующие
значения, находим: |
|
X = Л + - ^ |
= 11,7 + 4 ^ - = 11,896 = 11,90 мг %; |
* п |
100* |
*= А+І (^г) =и ’7+ °’7© =
= 11,7 + 0,196 = 11,90 мг%.
47
Срединные |
Частоты |
Отклонения |
значения классов |
классовых вариант |
|
или классовые |
(Р) |
от условий |
варианты |
средней |
|
(X) |
|
(а = X — А ) |
|
|
8,9 |
2 |
- 2 ,8 |
9,6 |
3 |
- 2 ,1 |
10,3 |
9 |
— 1,4 |
11,0 |
17 |
- 0 ,7 |
Итого . . . |
— |
— |
А = 11,7 |
25 |
0 |
12,4 |
23 |
+ 0 ,7 |
13,1 |
10 |
+ 1,4 |
13,8 |
7 |
+2,1 |
14,5 |
4 |
+ 2 ,8 |
Итого . . . |
— |
— |
С ум м а. . . |
100 |
— |
|
Т а б л и ц а |
9 |
|
Произведения |
X — А |
|
|
отклонений |
|
|
|
а = -------- |
ра |
|
|
на частоты |
і |
|
|
(ра) |
|
|
|
—5,6 |
- 4 |
- 8 |
|
- 6 ,3 |
- 3 |
- 9 |
|
- 1 2 ,6 |
- 2 |
- 1 8 |
|
— 11,9 |
— 1 |
- 1 7 |
|
- 3 6 ,4 |
— |
- 5 2 |
|
0 |
0 |
Ѳ |
|
+ 16,1 |
+ 1 |
+23 |
|
+ 14,0 |
+ 2 |
+20 |
|
+ 14,7 |
+ 3 |
+21 |
|
+ 11,2 |
+ 4 |
+ 16 |
|
+56,0 |
— |
+80 |
' |
+ 19,6 |
— |
+28 |
|
Сравнивая тот и другой способы расчета средней, нельзя не отдать второму способу преимущество перед первым.
Способ суммирования
Существует еще один довольно простой и оригинальный спо соб определения средней арифметической, основанный на пред варительной кумуляции частот вариационного ряда, который на зывается способом суммирования. Кумуляция, или последова тельное суммирование (интеграция) частот, производится с противоположных концов к центру ряда — до условной средней А либо в направлении от максимальной варианты до конца ва риационного ряда. Отметим два варианта определения средней
(х) этим способом. |
ариф |
Первый вариант. На безынтервальных рядах, средняя |
|
метическая легко вычисляется по следующей формуле: |
|
d |
(22) |
х = Л + — , |
|
п |
|
48
где А — условная средняя; п — общее число вариант в данной совокупности; d — разность между суммами первого и второго неполных рядов накопленных частот, получаемых кумуляцией частот с противоположных концов вариационного ряда до услов
ной средней А, где а = х—А =0. |
|
|
|
|
|
|
|
|||
Покажем применение этой |
формулы на примере распределе |
|||||||||
ния датских угрей по числу позвонков: |
|
|
|
|
|
|
||||
число позвонков |
( X ) : |
111 |
112 |
113 |
114 |
115 |
116 |
117 |
118 |
119 |
частоты (р): |
часто |
3 |
9 |
31 |
71 |
82 |
46 |
19 |
5 |
1 |
накопленные |
3 |
12 |
43 |
114 |
0 |
71 |
25 |
6 |
1 |
|
ты (Ps): |
|
Ряды накопленных частот получены следующим образом: первый ряд 3 + 9 = 12+ 31 =43 + 71 == 114, второй ряд 1+5 = 6+19 = 25 + + 46 = 71. Далее накопленные частоты суммируются, причем пер вая сумма берется с отрицательным, а вторая с положительным знаками 3+12 + 43 + 114= —172 и 1+6 + 25 + 71 = +103. Находим разницу между суммами накопленных частот d = —172+103 = = —69. Подставляя найденное значение d в формулу, находим
—69
X — 115-4------= 115 — 0 ,5 6 = 114,74 позвонка. 267
Если варианты относятся к классам вариационного ряда, т. е. в случаях интервального построения ряда, при определении сред ней арифметической этим способом в формулу 22 вносится по правка— второй член правой части формулы умножается на ве личину классового интервала и формула приобретает следующий вид:
ж = Л + / ( — ). |
(23) |
' п ' |
|
Применим эту формулу к расчету средней арифметической распределения кальция (мг%) в сыворотке крови павианов-га- мадрилов. Вычислим сначала величину d (табл. 10).
Подставляя найденную величину d в формулу 23, получим:
( 28 \
— ) = 11,90 жг%.
Второй вариант. Вместо условной средней А можно взять разность между минимальной вариантой (хт т) и величиной клас сового интервала (г), на которую отличаются соседние вариан ты. К полученной разности (xmjn—г) прибавляется сумма первого полного ряда накопленных частот (Si), отнесенная к числу всех вариант (п) и умноженная на величину классового интервала. Получается следующая формула:
X = (хтіп — і) + і( )• |
(24) |
49