Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Лакин Г.Ф. Биометрия учеб. пособие

.pdf
Скачиваний:
51
Добавлен:
25.10.2023
Размер:
16.09 Mб
Скачать

кие случайные события наблюдаются в области микробиологии, радиобиологии, биофизики и в других отраслях биологической науки. Сэджер и Райн (1964) показали, что спонтанный мутаци­ онный процесс у кишечной палочки (Escherichia coli) описыва­ ется формулой Пуассона

рп(т)

ат

Рие. 9. График функции Рп(т) = е-“ для раз­

ных значений а

ПАРАМЕТРЫ РАСПРЕДЕЛЕНИЯ ПУАССОНА

Закон распределения редких событий, описываемый форму­ лой Пуассона, является частным случаем биномиального распре­ деления и характеризуется теми же параметрами, что и биномиальное распределение. Но в отличие от последнего для распределения Пуассона характерно совпадение по абсолютной величине математического ожидания и дисперсии случайной ве­ личины. Иначе говоря, дисперсия случайной величины, распре­ деляемой по закону Пуассона, равна наивероятнейшей частоте этой величины или ее математическому ожиданию: D(m)=a.

* *

Рассмотренные законы распределения выведены путем мате­ матической индукции на основании известных фактов. Они про­ диктованы конкретными задачами и служат математическими моделями эмпирических распределений. Значение описанных те­ оретических законов распределения в исследовательской работе исключительно велико: они составляют логическую основу био­ метрии, на них опирается статистический анализ массовых явлений.

' С э д ж е р

Р. и Р а й н Ф. Цитологические и химические основы на­

следственности.

«Мир», М., 1964, стр. 62—68.

40

ГЛАВА ЧЕТВЕРТАЯ

СРЕДНИЕ ВЕЛИЧИНЫ

ВИДЫ СРЕДНИХ И ИХ ЗНАЧЕНИЕ

Одной из важнейших обобщающих характеристик варьирую­

щих признаков является

с р е д н я я в ел и ч и н а. Характеризуя

ту или иную популяцию,

говорят, например, о средней продук­

тивности животных или растительных организмов, средней успе­ ваемости учащихся, о средней скорости биохимических реакций и о многих других средних величинах. Значение средних заклю­ чается в их свойстве нивелировать индивидуальные различия, в результате чего выступает более или менее устойчивая числовая характеристика признака — не отдельных представителей, а це­ лой группы статистических единиц.

Средняя величина характеризует групповые свойства. В ней, как в фокусе лучи, сходятся все силовые линии тех многочислен­ ных влияний, под воздействием которых происходит развитие признака и определяется размах его вариации. В средней нахо­ дит свое выражение внутренняя связь, существующая между от­ дельными вариантами и всей их совокупностью в целом. Средняя величина — это центр распределения: она занимает центральное положение в общей массе варьирующих значений признака.

Существует несколько видов средних. Применяемые в биоло­ гии средние делятся на степенные, или параметрические, и сред­ ние порядковые, или непараметрические. Параметрические сред­ ние функционально связаны с распределением варьирующих признаков, тогда как порядковые средние функциональной связи с распределением признаков не имеют, характеризуя лишь струк­ турные особенности вариации, поэтому и относятся к группе структурных средних. К ним принадлежат медиана, мода и неко­ торые другие средние показатели.

Параметрические, или степенные, средние получаются из

общей формулы:

h

 

 

(17)

где X — средняя величина; х — варианта;

2 — знак суммирова­

ния; п — объем совокупности, на котором

вычисляется

средняя;

k— величина, определяющая вид средней. Так, при &=1

получа­

ется средняя арифметическая (х), при k —1 — средняя гармо­ ническая (хи), при k = 2 — средняя квадратическая и т. д.

Наряду с общими средними, характеризующими всю совокуп­ ность наблюдений, различают частные, или групповые, средние (хі ), вычисляемые на отдельных (частных) группах вариант,

41

входящих в состав общей совокупности или данного комплекса (в дисперсионном анализе).

Критерием правильного выбора средней служат ее свойства, которые должны соответствовать содержанию описываемого яв­ ления и согласоваться с задачами и характером исследования. Если эти условия не выполняются, средняя не может служить точной обобщающей характеристикой массовых явлений.

СРЕДНЯЯ АРИФМЕТИЧЕСКАЯ

Простая средняя арифметическая

Из всех параметрических средних наиболее часто применяет­ ся средняя арифметическая (х ), представляющая частное от де­ ления суммы всех вариант совокупности на их общее число:

Хі -{- Х2 -f- Х3 -f- . . . -f- Хп 2Xt

(17)

п

п

Например, в помете каждой из шести свиноматок было получено следующее количество поросят:

№ животных по порядку:

4

5

6

число поросят в помете:

5

8

10

В данном случае численность отдельных вариант повторяется всего один раз. В этом легко убедиться, распределив эти данные в вариационный ряд:

число поросят в помете

(* ):

4

 

5

6

8

9

10

количество пометов

(ча­

1

1

1

 

1

1

стота, р) :

1

 

Средняя арифметическая, вычисленная для такого рода сово­ купности-, называется п р о с т о й , или невзвешенной средней. В данном случае:

1

( 4 +

42

X =

5 + 6 + 8 + Э _|_ 10) = —■= 7 поросят.

6

 

R

Средняя арифметическая — величина именованная, она выра­ жается теми же единицами измерения, что и характеризуемый ею признак.

Взвешенная средняя

Если же в совокупности наблюдений отдельные варианты пов­ торяются р раз, то средняя вычисляется с учетом повторяемости вариант по следующей формуле:

ХіРі + Х2р2 “Ь • • • + Хпр п

2 Хірі

p i + Pz + . • • + Рп

( 18)

2 Pi

42

где X — значения вариант, а р — их частоты или «веса». Средняя, вычисляемая с учетом частот или «весов» отдельных вариант, на­ зывается в з в е ш е н н о й средней. Само собой понятно, что варианта, которая встречается в совокупности наиболее часто, окажет и большее влияние на среднюю величину по сравнению с другими вариантами, входящими в ее состав. Отсюда и возника­ ет понятие статистического веса, совпадающее с понятием часто­ ты отдельных вариант изучаемой совокупности. Например, ре­ зультаты подсчета количества зерен, содержавшихся в 18 наугад отобранных колосьях озимой ржи, распределились следующим образом:

количество зерен

в ко­

8

9

10

11

12

13

лосьях (X):

7

число колосьев

(часто­

1

2

7

3

3

1

та, р ) :

1

Сумма частот составляет 2р=18. Видно, что разные колосья содержат разное количество зерен, но не все имеют одинаковый «вес»: большее число колосьев содержит по десять зерен, тогда как другие колосья имеют одни меньше, другие больше зерен. Средняя арифметическая в этом случае определяется так:

* = і 8 ( 7 Х 1 + 8 Х 1 + 9 Х 2 + 1 0 Х 7 + П Х 3 +

+ 1 2 X3 + 13Х 1) = ——■= 10,28 зерен. 18

Аналогичным способом рассчитывается и общая средняя (х) из суммы частных средних (#,), полученных на однородных группах наблюдений. Только весами в таких случаях служат не частоты вариант, а объемы групп, на которых вычислены частные средние. Формула 18 применительно к такого рода случаям при­ обретает следующий вид:

ХіПі + хгп2+ ... +

xhtih

ЪхіШ

( 1У)

СС— -------1 I...

Пъ.

— ----------'

П\-{- П2~\~ . .

 

 

Например, на одновозрастной группе одного и того же пола в составе 30 человек определялось количество гемоглобина в крови. Средняя арифметическая оказалась равной 69,8%. В то же время на другой аналогичной группе, насчитывавшей 20 человек, тот же показатель оказался равным 64,9%- Нужно определить среднее содержание гемоглобина в крови по суммарным данным для всех 50 человек.

Если бы число наблюдений в первом и во втором случаях было одинаковым, задача решалась довольно просто — путем отнесения суммы частных средних арифметических к их числу, т. е. в данном случае взяли бы полусумму групповых средних:

<3

х = (69,8 + 64,9) : 2 = 67,35%. Но при разных объемах групп этот суммарный показатель будет неточным, так как он не учитыва­ ет веса частных средних, входящих в обобщенную среднюю вели­ чину. Поэтому более точный результат получится, если общая средняя рассчитывается по формуле 19:

30 X 69,8 + 20 X 64,9

67,84%.

30 + 20

Сокращенный способ вычисления средней арифметической (способ условной средней)

Вычисление средней арифметической описанным выше спо­ собом взвешенных вариант не всегда удобно, особенно на сово­ купностях большого объема и при наличии многозначных чисел, когда вычислительная работа становится особенно трудоемкой. В таких случаях проще рассчитать среднеарифметическую упро­ щенным способом, описываемом в разных руководствах под раз­ ными названиями: способ условного начала, условной средней, условного нуля, условного интервала и т. д. Сущность этого спо­ соба, для которого здесь сохраняется название условной средней, заключается в следующем. Одну из вариант, все равно какую, условно принимают за среднюю величину, обозначив ее через А. Обычно в качестве условной средней, или условного начала, бе­

рется варианта (или класс) с наибольшей

или близкой к

ней

частотой, хотя это не обязательно.

найти

величину

той

Выбрав

условную среднюю, остается

поправки,

которую следует прибавить или

отнять

от условной

средней, чтобы получить истинное значение средней арифметиче­ ской (X). Такой поправкой служит взвешенная сумма отклонений вариант от условной средней, отнесенная к числу всех вариант данной совокупности и называемая условным моментом первого

порядка (by):

2(Хі — А)р _

Spa

_

1

п

Под моментами распределения понимаются средние величи­ ны, представляющие отклонения вариант от какого-нибудь чис­ ла — средней арифметической, условной средней или нуля, воз­ веденные в ту или иную степень и отнесенные к общему числу наблюдений. При этом отклонением называется разность между

любой вариантой

и ее средней арифметической

(ж), условной

средней (А) или

нулем

(0),

которую принято

писать

в виде

XX, х —А или X—0, но

не

как х х, А —х или

0—х

на том

основании, чтобы отклонения вариант меньше средней величины

имели отрицательный (—), а отклонения

вариант, которые по

своей величине больше средней, имели

бы положительный

знак ( + ).

 

44

Если отклонения берутся от среднеарифметической, моменты называются ц е н т р а л ь н ы м и ; их обыкновенно обозначают греческой буквой ц (ми). Если же отклонения берутся от произ­ вольно выбранного числа А, моменты называются у с л о в н ы -

м и. Когда же отклонения берутся от нуля, моменты называются

на ч а л ь н ы м и . В зависимости от степени отклонений моменты распределения могут быть первого, второго и больших порядков (табл. 8).

 

 

 

 

 

 

 

Т а б л и ц а 8

Моменты распределения

Начальные

Центральные

 

Условные

1-го

порядка

 

Ир ( X 0)

 

Ир (х — х)

,

=

Н р ( х —А)

 

 

 

 

 

п

ь 1

п

 

 

 

 

 

 

 

 

 

 

Ирх

 

 

 

 

 

 

 

 

п

 

 

 

 

 

2-го

порядка

2 —

Ир (х — 0)2

— f*2 —

Ир х)2

ъ2 =

 

Ир А)2

 

 

п

п

 

п

 

 

 

 

 

 

Ирх2

п

3-го порядка

4-го порядка

/Из —

Ир( х 0)3

 

Ир (X x ) s

,

 

'Ир (-* — Д ) 3

и* —

п

bз =

п

 

п

 

 

 

 

Ирх 3

 

 

 

 

 

 

п

 

 

 

 

 

 

Ир (X — 0)4

 

Ир (X х)4

,

_

Н р ( х - А ) 4

4

п

 

п

й4

 

 

 

 

 

Ирх4

п

Можно сказать, что средняя арифметическая (ж) является на­ чальным моментом первого порядка (mi). Центральные моменты нормального распределения связаны с условными моментами следующими формулами, которые используются при вычислении характеристик вариационного ряда:

М2 =

Ьг Ьі

 

М з :==:; Ьз — 3 è i& 2

2 & 1

М4 =

Ьі —• іЬфз +

66?bz 3bi.

45

Используя условный момент первого порядка в качестве по­ правки к условной средней А, получим формулу средней ариф­ метической:

X = А

hpa

( 20)

п

 

 

Покажем применение этой формулы на рассмотренном выше, примере; определим среднее число зерен в 10 колосьях озимой ржи:

значения

вариант (х):

7

8

9

10

11

12

13

частоты

) :

1

1

2

7

3

3

1

отклонения а = х - - А:

- 4

- 3

—2

—1

4 0

+ 1

+ 2

произведения ра:

—4

- 3

- 4

—7

0

+ 3

+ 2

Сумма произведений частот на отклонения: —18+ 5= —13, откуда

X — 11 Н

— 13

= 11 — 0,72 = 10,28 зерен.

18V

Вкачестве условной средней взята варианта «11». Но можно взять любую другую варианту и результат получится тот же самый:

варианты (х):

7

8 9

10

11

12

13

частоты ) :

1

1

2 7

3

3

1

отклонения а:

—2

—1

0 + 1

+ 2

+ 3

+ 4

произведения ра:

—2

—1

0 + 7

+ 6

+ 9

+ 4

 

— — 3 + 26 — 23,

 

 

 

откуда

 

 

 

 

 

 

X = 9

 

10,28 зерен.'

 

 

Преимущество этого способа особенно заметно при вычисле­ нии средней арифметической на больших совокупностях и при наличии многозначных чисел. Покажем это на следующем при­ мере. По данным Л. С. Берга (1924), 267 датских угрей распре­ делились по числу позвонков следующим образом:

варианты (х):

111

112

113

114

115

116

117

118

119

частоты (р):

3

9

31

71

82

46

19

5

1

Перемножив варианты на их частоты и просуммировав результа­

ты, получим:

2х/? =

111 X 3 + 112 X 9 + 113 X 31 +

114 X 71 +

+ 1 1 5 X 8 2 +

1 1 6 X 4 6 + 117 X 1 9 + 118X 5 + П 9 Х

1 = 30636,

2хр

30 636

1ІЛГ7/І

 

откуда X — ------ = ----------=

114,74 позвонка.

 

 

п

267

 

 

46

Теперь рассчитаем среднюю арифметическую этого распре­ деления по упрощенному способу. В качестве условной средней

ізьмем варианту 115, т. е. А = 115:

варианты (х):

111

1.12

113

114

115

116

117

118

119

частоты (р):

3

9

31

71

82

46

19

5

1

отклонения а:

- 4

- 3

- 2

--1

0

+1

+ 2

+ 3

+ 4

ра:

- 1 2

- 2 7

- 6 2

--71

0

+ 46

+38

+ 15

+ 4

 

 

-1 7 2

 

 

 

+103

 

^ р а =

172 + 103 =

— 69.

 

 

 

 

 

Подставляем найденное значение в формулу:

 

 

 

Ира

 

— 69

115 — 0,26 = 114,74 позвонка.

X = А -1-------- =

115 -|--------- =

п267

Получился тот же результат, что и выше, но при меньшей вычислительной работе, так как удалось избежать перемноже­ ния многозначных чисел.

Описываемый способ еще больше упрощается, если отклоне­ ния классовых вариант от условной средней относить к величи­ не классового интервала, т. е. вместо а = х А выражать откло-

нения в виде а =

JC

______. Тогда отклонения от условной средней,

 

і

где а = 0, выражаются числами натурального ряда, т.

е. как 1, 2,

3, 4 и т. д. (обязательно с учетом знаков!). При этом

в формулу

20 вносится

поправка: условный момент первого

порядка

Ьх — ------

что входит в состав формулы, умножается на вели-

п

 

 

чину классового интервала і:

 

 

-х= а + і {1Е1).

(Si)

Эта формула настолько упрощает расчеты средней арифметиче­ ской, что, кажется, предпочесть этому способу какой-нибудь дру­ гой просто невозможно.

Применим эту формулу, а для сравнения и предыдущую фор­ мулу 20 к расчету средней арифметической ряда распределения по уровню кальция (мг%) в сыворотке крови лавианов-гамадри-

лов (табл. 9).

Подставляя из табл. 9 в формулы 20 и 21 соответствующие

значения, находим:

 

X = Л + - ^

= 11,7 + 4 ^ - = 11,896 = 11,90 мг %;

* п

100*

*= А+І (^г) =и ’7+ °’7© =

= 11,7 + 0,196 = 11,90 мг%.

47

Срединные

Частоты

Отклонения

значения классов

классовых вариант

или классовые

(Р)

от условий

варианты

средней

(X)

 

= X А )

 

 

8,9

2

- 2 ,8

9,6

3

- 2 ,1

10,3

9

1,4

11,0

17

- 0 ,7

Итого . . .

А = 11,7

25

0

12,4

23

+ 0 ,7

13,1

10

+ 1,4

13,8

7

+2,1

14,5

4

+ 2 ,8

Итого . . .

С ум м а. . .

100

 

Т а б л и ц а

9

Произведения

X — А

 

 

отклонений

 

 

а = --------

ра

 

на частоты

і

 

(ра)

 

 

 

—5,6

- 4

- 8

 

- 6 ,3

- 3

- 9

 

- 1 2 ,6

- 2

- 1 8

 

11,9

1

- 1 7

 

- 3 6 ,4

- 5 2

 

0

0

Ѳ

 

+ 16,1

+ 1

+23

 

+ 14,0

+ 2

+20

 

+ 14,7

+ 3

+21

 

+ 11,2

+ 4

+ 16

 

+56,0

+80

'

+ 19,6

+28

 

Сравнивая тот и другой способы расчета средней, нельзя не отдать второму способу преимущество перед первым.

Способ суммирования

Существует еще один довольно простой и оригинальный спо­ соб определения средней арифметической, основанный на пред­ варительной кумуляции частот вариационного ряда, который на­ зывается способом суммирования. Кумуляция, или последова­ тельное суммирование (интеграция) частот, производится с противоположных концов к центру ряда — до условной средней А либо в направлении от максимальной варианты до конца ва­ риационного ряда. Отметим два варианта определения средней

(х) этим способом.

ариф­

Первый вариант. На безынтервальных рядах, средняя

метическая легко вычисляется по следующей формуле:

 

d

(22)

х = Л + — ,

п

 

48

где А — условная средняя; п — общее число вариант в данной совокупности; d — разность между суммами первого и второго неполных рядов накопленных частот, получаемых кумуляцией частот с противоположных концов вариационного ряда до услов­

ной средней А, где а = х—А =0.

 

 

 

 

 

 

 

Покажем применение этой

формулы на примере распределе­

ния датских угрей по числу позвонков:

 

 

 

 

 

 

число позвонков

( X ) :

111

112

113

114

115

116

117

118

119

частоты (р):

часто­

3

9

31

71

82

46

19

5

1

накопленные

3

12

43

114

0

71

25

6

1

ты (Ps):

 

Ряды накопленных частот получены следующим образом: первый ряд 3 + 9 = 12+ 31 =43 + 71 == 114, второй ряд 1+5 = 6+19 = 25 + + 46 = 71. Далее накопленные частоты суммируются, причем пер­ вая сумма берется с отрицательным, а вторая с положительным знаками 3+12 + 43 + 114= —172 и 1+6 + 25 + 71 = +103. Находим разницу между суммами накопленных частот d = —172+103 = = —69. Подставляя найденное значение d в формулу, находим

—69

X — 115-4------= 115 — 0 ,5 6 = 114,74 позвонка. 267

Если варианты относятся к классам вариационного ряда, т. е. в случаях интервального построения ряда, при определении сред­ ней арифметической этим способом в формулу 22 вносится по­ правка— второй член правой части формулы умножается на ве­ личину классового интервала и формула приобретает следующий вид:

ж = Л + / ( — ).

(23)

' п '

 

Применим эту формулу к расчету средней арифметической распределения кальция (мг%) в сыворотке крови павианов-га- мадрилов. Вычислим сначала величину d (табл. 10).

Подставляя найденную величину d в формулу 23, получим:

( 28 \

— ) = 11,90 жг%.

Второй вариант. Вместо условной средней А можно взять разность между минимальной вариантой (хт т) и величиной клас­ сового интервала (г), на которую отличаются соседние вариан­ ты. К полученной разности (xmjn—г) прибавляется сумма первого полного ряда накопленных частот (Si), отнесенная к числу всех вариант (п) и умноженная на величину классового интервала. Получается следующая формула:

X = (хтіп і) + і( )•

(24)

49