Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Лакин Г.Ф. Биометрия учеб. пособие

.pdf
Скачиваний:
54
Добавлен:
25.10.2023
Размер:
16.09 Mб
Скачать

Здесь 2 — знак суммирования; щ — численность

или

«вес»

от­

дельных групп; V — число групп, входящих в состав

данной

со­

вокупности; п = І1пі — общее число наблюдений;

хі частные

или групповые средние арифметические; х — общая средняя объ­ единенных групп; o f — частные, или групповые,-дисперсии.

Эта формула показывает, что объединенный средний квадрат (а*2) суммарной совокупности равен средней из групповых дис­ персий плюс дисперсия групповых средних. Применим эту фор­ мулу к анализу следующих данных (табл. 16).

Т а б л и ц а 16

 

 

 

 

 

 

Беременность

 

 

 

 

Вариации

 

1

2

3

4

5

6

7

8

Сумма

 

 

 

 

Число

наблюдений

 

 

 

 

 

 

 

 

 

( « » ) ........................

.1 .

17

20

16

17

14

9

5

5

103

Срок

беременности

170

171

172

173

175

172

177

174

_

В ДНЯХ

(Хі) . . . .

Дисперсия of

, .

63,3

26,1

19,7

27,9

14,7

18,0

14,0

55,5

В табл. 16 паказано варьирование продолжительности беремен­ ности у павианов-гамадрилов в зависимости от числа родов. Общая средняя продолжительности плодоношения, вычисленная по этим данным, х = 172,39 дня. Рассчитаем величину общей дис­ персии и среднее квадратическое отклонение по срокам плодоно­ шения у павианов-гамадрилов. Расчет необходимых значений показан в табл. 17, Подставляя эти значения в формулу 39, нахо­ дим:

2

2863,7

360,4

1 = 30>144 + 3>533 = 33.68 дня или

Gs= 103 — 8

юз —

Os = У33,68 = 5,80 дней

В аналогичном значении формул 38 и 39 нетрудно убедиться, если рассчитать объединенный средний квадрат для этих данных по формуле 38. Так, средний квадрат из отклонений групповых средних от общей средней с учетом «весов» отдельных групп (Пі), т. е. межгрупповая дисперсия:

2 Ъщ {хі х )2

° х =

2 ^

=

17X5,71 + 20X1,93 + 16X0,15 + 17X0,37 + ,. + 5X2,59301*

103

364,4 _

3,538.

103

70

 

 

 

 

 

 

 

Т а б л и ц а 17

Беремен­

Число

 

а?

 

 

 

 

наблюде­

(п .- 1)хо2[

ѵх . - х

(х.—хУ

ность

ний (п^)

1

1

17

170

63,3

1012,8

2,39

5,71

97,1

2

20

171

26,1

495,9

1,39

1,93

38,6

3

16

172

19,7

295,5

0,39

0,15

2,4

4

17

173

27,9

446,4

0,61

0,37

6,3

5

14

175

14,7

191,1

2,61

6,81

95,3

6

9

172

18,0

144,0

0,39

0,15

1,4

7

5

177

14,0

56,0

4,61

21,25

106,3

8

5

174

55,5

222,0

1,61

2,59

13,0

Сумма

103

2863,7

360,4

Взвешенная средняя из групповых дисперсий:

—2 2 (ttiGi ) ^ Gz==Z Srti ~

= 17 X 63,3 -f- 20 X 26, Г + ... + 5 X 55,5_ 3102,9 =

103

103

откуда общая дисперсия комплекса —

Оу = 3,538 + 30,125 = 33,66 дня или о = У33,63 = 5,80 дней.

Аналогичные, но несколько заниженные результаты получа­ ются при вычислении дисперсии суммарной совокупности по сле­ дующей приближенной формуле:

Os2 2 (пі — l)Oj + Ипі(хі — х)2

(40)

ііПі — 1

 

Еще более низкие результаты дает формула, нередко встречаю­ щаяся в биометрических руководствах:

2 2 («г— \)Оі

(41)

Os — —--------------

П — V

СПОСОБЫ ВЫЧИСЛЕНИЯ СРЕДНЕГО КВАДРАТИЧЕСКОГО ОТКЛОНЕНИЯ

Способ произведений

Для небольшого числа наблюдений, не сгруппированных в вариационный ряд, среднее квадратическое отклонение можно

71

вычислить по общей формуле 35. В таких случаях сначала нахо­ дят отклонения каждой варианты от средней арифметической, т. е. значения хі—х = аи х2—х = а2, х3—х — а3 и т. д., а затем каж­ дое отклонение возводится в квадрат, и если варианты повторя­ ются, то квадраты отклонений от средней умножаются на их час­ тоты и результаты суммируются. Полученная величина 2р(хг—

х ) 2 относится к общему числу наблюдений, которое берется числом степеней свободы (п—1), и из частного извлекается квад­ ратный корень.

Для примера возьмем небольшую группу наблюдений и рас­ считаем указанным способом среднее квадратическое отклоне­ ние. У девяти лиц одного пола и возраста определялось содержа­ ние гемоглобина в крови. Анализы (по Сали) дали следующие результаты: 74 70 77 72 79 88 76 80 86. Средняя арифметическая * = (74 + 70+ 77+ 72 + 79 + 88 + 76 + 80 + 86) : 9= 702 : 9 = 78. Нахо­ дим отклонения вариант от средней арифметической:

Хі X =

74 — 78 =

— 4

х2X =

70 — 78 =

— 8

Хз X — 77 — 78 =

— 1

*4 — X = 72 — 78 =

— 6

ХъX = 79 — 78 =

+ 1

Хв X = 88 — 78 =

-j- 10 и т. д.

Затем каждое отклонение возводим

в квадрат: —42= 16, —82 =

= 64, —І2=1 и т. д. Суммируя квадраты отклонений, получаем Е(хі—х )2 = 290. Подставляя нужные значения в формулу 35, оп­ ределяем величину среднего квадратического отклонения:

290

_____

У

= 1/36,25 = 6,02.

Поскольку 2 ( хіх ) 2 выражается различными тождествами, формулу среднего квадратического отклонения можно модифи­ цировать. В частности, среднее квадратическое отклонение опре­ деляется по следующим аналогичным формулам:

Применим эти формулы к только что рассмотренному при­ меру:

E x 2 = 7 4 2 _j_ 7 Q2 _|_ 7 7 2 _|_ 722 + 7 9 2

8 8 2 7 5 2 _)_

72

 

2л;

+ 802 +

862 =

55 046;

 

 

X

702/9 =

78

и

X2 = 782 = 6084.

 

 

п

 

 

 

 

 

 

 

 

 

Подставляем эти значения в формулу 42:

 

 

1 /

7022 \

 

1

 

36,25

^55 046 - —g—I =

— (55 046 - 54 756) =

и

 

а = У36,25 =

6,02.

 

 

Или же а2 =

9 /

55 046

 

\

9 ,

 

 

--------------782) =

— (6116,22 — 6084,0)

'

 

8 \

9

 

!

8 ѵ

 

При вычислении паказателей вариации на многозначных числах последние можно преобразовать в простые, что значитель­ но облегчит работу. Это достигается уменьшением каждой вари­ анты на какую-то постоянную величину или делением значений признака на одно и то же положительное число. Основанием слу­ жат теоремы о средней и дисперсии, которые рассматривались выше: величина дисперсии и среднего квадратического отклоне­ ния от этого не изменится. Так, варианты рассматриваемой сово­ купности можно уменьшить на 70, получится следующий ряд значений: 4 0 7 2 9 18 6 10 16. Находим: 2х = 72, 2х2= 16+ 49 + + 4+ ... +236 = 866. Подставляя эти значения в формулу, имеем;

Получился тот же результат, что и выше, а вычисления ока­ зались проще.

В тех случаях, когда среднее квадратическое отклонение вы­ числяется на совокупности, сгруппированной в интервальный ва­ риационный ряд, отклонения а — (Хіх) берутся как отклонения классовых вариант от средней арифметической. Покажем приме­

нение этого способа на примере распределения кальция

{мг%)

в сыворотке крови павианов-гамадрилов. Напомним, что

сред­

няя этого распределения ж = 11,9 мг°]о. Расчет нужных значений для подстановки в формулу среднего квадратического отклоне-« ния показан в табл. 18.

Подставля найденные значения в формулу, получаем:

73

 

 

 

 

 

 

Т а б л и ц а 18

Классовые

Частоты

Отклонения

о*

р а 2

р а г

р а 4

варианты

(Р)

а=Х}—X

(X)

 

 

 

 

 

 

 

 

 

 

8,9

2

- 3 , 0

9,00

18,00

— 54,000

162,0000

9 ,6

3

- 2 , 3

5,29

15,87

-3 6 ,5 0 1

83,9523

10,3

9

- 1 , 6

2,56

23,04

— 36,864

58,9824

11,0

17

- 0 , 9

0,81

13,77

- 1 2 ,3 9 3

11,1537

11,7

25

- 0 , 2

0,04

1,00

- 0 ,2 0 0

0,0400

12,4

23

+ 0 ,5

0,25

5,75

+ 2 ,8 7 5

1,4375

13,1

10

+ 1,2

1,44

14,40

+ 17,280

20,7360

13,8

7

+ 1 ,9

3,61

25,27

+48,013

91,2247

14,5

4

+ 2 ,6

6,76

27,04

+ 70,304

182,7904

Сумма

100

-

144,14

- 1 ,4 8 6

612,3170

 

 

 

 

 

 

П р и м е ч а н и е .

Графы ра3 ира* понадобятся

в дальнейшем.

Способ условной средней

Среднее квадратическое отклонение можно вычислить упро­ щенным способом, приняв условно вместо средней (х) одну из вариант, для которой х—Л =0. При этом способе отклонения ва­ риант (или классов) берутся не от истинной средней х, а от ус­ ловной А. Формула среднего квадратического отклонения при этом способе расчета приобретает следующий вид:

1 * п

п

где а ~ х —А '.

Покажем применение этой формулы на примере распределе­ ния кальция (мг%) в сыворотке крови павианов-гамадрилов (табл.19).

Подставляем найденные значения в формулу 43:

 

147,98

У1,48 —0,04

у 1,44 =

1,20 мг%

Если отклонения

а — Ѵі

100

 

 

 

классовых вариант от условной

средней А

отнести к величине классового интервала, т. е. вместо а = (х{А) взять а = (Xj—А)/і, то расчеты значительно упрощаются. В таких случаях отклонения классовых вариант (или классов) от услов­ ной средней А, где отклонение а= 0, принимают значения чисел

1 Конструкция данной формулы станет понятной, если вспомнить, что цент­ ральный момент второго порядка связан с условным моментом того же поряд-

ка равенством

2

Ъ р ( Х і — Х)2

_

Ъ р ( Х [ — А )2

Р2 =&2—Ь \

, где рг=

h ■

И

 

Ир (Хі —А)

п

 

п

Н

 

 

 

I

 

 

 

74

 

 

 

 

Т а б л и ц а 19

Классовые

Частоты (р)

Отклонения классовых

Произведение откло­

р а 2

варианты

вариантов от условной

нений на частоты

( х)

 

средней ( а —х ~ А )

 

(ра )

 

 

8 , 9

2

-2,8

- 5 , 6

1 5

,6 8

9 , 6

3

-2,1

- 6 , 3

1 3

, 2 3

1 0 , 3

9

- 1 , 4

-12,6

1 7

, 6 4

11,0

17

- 0 , 7

- 1 1 , 9

8 , 3 3

И т о г о . . .

- 3 6 , 4

 

А = 1 1 ,7

25

0

 

0

0

1 2 ,4

23

+ 0 , 7

+ 1 6 , 1 '

1 1 ,2 7

1 3 ,1

10

+ 1 ,4

+

1 4 ,0

1 9

,6 0

1 3 ,8

7

+2,1

+

1 4 ,7

3 0 ,8 7

1 4 ,5

4

+2,8

+ 11,2

3 1 ,3 6

И т о г о . . .

+ 5 6 , 0

 

С у м м а . . .

100

+ 1 9 , 6

1 4 7

,9 8

натурального ряда, т. е. обозначаются как 1, 2, 3, 4, 5 и т. д. При этом отклонения классов или вариант от условной средней в сто­

рону меньших значений, чем А, берутся с отрицательным

(—), а

в сторону больших значений — о положительным ( + )

знаком.

Среднее квадратическое отклонение в таких случаях должно ум­ ножаться на величину классового интервала, формула 43 приоб­ ретает следующий вид:

 

 

 

 

<«■ >.

Применим эту формулу

к тому же примеру распределения

кальция (мг%)

в

сыворотке крови павианов-гамадрилов

(табл. 20).

 

 

 

 

У ОАО

/

OQ

\2

0,7У2,94 = 0,7 X 1,715 = 1,20 мг%.

— -

( —

) =

Сравнивая этот способ с предыдущим, нельзя не видеть преиму­ щества последнего, позволящего просто и быстро рассчитывать среднее квадратическое отклонение.

75

 

 

 

 

 

 

Т а б л и ц а 20

Классовые

Частоты

т —А

ра

р а 2

р а ъ

р а 1

а = :

варианты (*)

(Р)

1

і

 

 

 

 

 

 

 

 

 

8 , 9

2

- 4

- 8

32

- 1 2 8

512

9 , 6

3

- 3

- 9

27

- 8 1

243

1 0 ,3

9

- 2

- 1 8

36

- 7 2

144

1 1 ,0

17

— 1

- 1 7

17

- 1 7

17

Итого . . .

- 5 2

- 2 9 8

А = 1 1 ,7

25

0

0

0

0

0

1 2 ,4

2 3

-f-1

+ 2 3

2 3

+ 2 3

23

13,1

10

+ 2

+ 2 0

40

+ 8 0

160

1 3 ,8

7

+ 3

+ 2 1

63

+ 189

56 7

1 4 ,5

4

+ 4

+ 16

64

+ 2 5 6

1024

Итого , . .

+ 8 0

+ 548

Сумма . .

100

+ 2 8

302

+ 2 5 0

2690

На выборках небольшого объема, особенно когда они не сгруппированы в вариационный ряд, среднее квадратическое от­ клонение вычисляется тем же способом по следующей формуле:

•j/

п Г 2а2

er =

(44)

'

п — 1 *- п

Здесь а — отклонение варианты от условной средней, в качестве которой может быть взята любая варианта; п — общее число ва­ риант, на которых вычисляется среднее квадратическое отклоне­ ние.

Покажем применение этой формулы на примере содержания гемоглобина в крови у девяти одновозрастных лиц, который рас­ сматривался выше.

х:

74

70

77

72

79

88

76

80

86

а:

0

—4

+3

- 2

+ 5

+ 14

+2

+ 6

+12;

а*

0

16

9

4

25

196

4

36

144

откуда

 

 

 

 

Іа =

+36

 

2а2 = 434,

9

Г 434

/ 36 \ 21

 

 

 

 

 

 

-9(32,22) =

36,25

и а == 6,02.

 

 

 

 

 

76

Получился такой же результат, какой был получен при вычисле­ нии среднего квадратического отклонения прямым способом.

Приближенное значение среднего квадратического отклоне­ ния можно получить, разделив размах вариации на 2, если число наблюдений (п) равно примерно 5, или на 3, когда п= 10; на 4 при п = 25 или на 5 при п= 100 (по Снедекору, 1961). Так, размах вариации по содержанию гемоглобина в крови у девяти лиц ра­

вен

88—70=18,

откуда о = 18/3 = 6. Размах распределения

каль­

ция

(мг°/о) в

сыворотке крови павианов-гамадрилов

равен:

14,70—8,99 = 5,71^6 мг%. При п= 100 среднее квадратическое отклонение должно равняться: 6/5 = 1,2 мг%. Видно, что этот рас­ чет достаточно хорошо согласуется с полученными выше величи­ нами.

Способ суммирования

Среднее квадратическое отклонение можно вычислить и спо­ собом суммирования, который рассматривался выше примени­ тельно к расчету средней арифметической. Поскольку этот способ имеет два варианта, среднее квадратическое отклонение опреде­ ляется по следующим аналогичным формулам:

 

(45)

Здесь S = 2 I + 22 + 223+ 2 2 4, где

2і и 2 2— суммы первого и

2 3 и 2 4 — суммы второго неполных

рядов накопленных частот,

образуемых кумуляцией частот с противоположных концов ва­ риационного ряда в направлении условной средней А; d 2 і—2 2 (из большей суммы вычитается меньшая); і — величина классо­ вого интервала; п — общее число вариант, на которых вычисля­ ется среднее квадратическое отклонение.

(46)

В этой формуле Si — сумма первого полного ряда накопленных частот, получаемого кумуляцией частот в направлении от макси­ мальной классовой варианты (или класса) до конца вариацион­

ного ряда; S2 — сумма второго полного

ряда накопленных час­

тот, образуемого кумуляцией значений

первого ряда в том же

направлении.

 

Покажем применение этого способа на известном нам приме­ ре распределения кальция (мг%) в сыворотке крови павиановгамадрилов. Расчет необходимых вспомогательных величин по­ казан в табл. 21. Пользуясь итоговыми данными этой таблицы, находим: d = 80—52 = 28, S = 52 + 80+ (2x30) + (2X55) =302. Подставляем эти величины в формулу 45:

77

Классовые

варианты

<*)

8,9

9,6

10,3

11,0

Итого . . .

А= 11,7

12,4

13,1

13,8

14,5

Итого . . .

Сумма . . .

Частоты

(р)

2

3

9

17

25

23

10

7

4

О о

 

 

 

Т а б л и ц а 21

Неполные ряды накопленных

Полные ряды накопленных

частот

 

частот

первый

второй

первый

второй

2

2

 

100

528

5

7

 

98

428

14

21

 

95

330

32

 

 

86

235

- S j = 52

н w

О

 

со

со

 

 

1

!

 

 

149

0

0

 

69

44

36

 

44

80

21

 

21

36

11

15

 

11

15

4

4

 

4

4

со II

24 = 55

-

О

 

 

 

 

Cu II to 00

 

S x = 528

S2 = 1805

Таким же образом используется и формула 46:

о = 0,7 у ^ х Ш І 5

528

528

0,7 У2,94 =

100НЮ 1 + І Г о ) “

=0,7 X 1,715 = .1,20 мг %.

КОЭФФИЦИЕНТ ВАРИАЦИИ

Среднее квадратическое отклонение является основным мери­ лом вариабильности признаков. Этот показатель не зависит от числа наблюдений, и потому может использоваться для сравни­ тельной оценки варьирования однородных признаков. Вместе с тем широкому использованию среднего квадратического откло­ нения в качестве меры сравнения вариабильности признаков ме­ шает то, что этот показатель является величиной именованной. В самом деле, выше было' показано, что среднее квадратическое отклонение ряда распределения кальция (мг%) в сыворотке кро­ ви павианов-гамадрилов равно 1,20 мг%, а варьирование дат­ ских угрей по числу позвонков характеризуется средним квадра-

78

тическим отклонением равным 1,35 позвонка. Можно ли на этом основании сказать, что датские угри более изменчивы по числу позвонков, чем гамадрилы по уровню кальция в сыворотке кро­ ви? Нет, этого нельзя сказать, потому что признаки выражены разными единицами измерения.

Чтобы среднее квадратическое отклонение могло быть исполь­ зовано в качестве меры сравнения вариабильности признаков не­ зависимо от того, какими единицами измерения они выражены, его принято выражать в процентах от средней арифметической. Полученный таким образом показатель оказывается числом от­ носительным, выражающим изменчивость признаков в процен­

тах его называют ко э ф фи ц и е нт о м в а р и а ц и и

и обозна­

чают символом СѴ, т. е.

 

 

СѴ = 100 4-

%•

(47)

X

 

 

Например, коэффициент вариации

уровня кальция

в сыво­

ротке крови павианов-гамадрилов равен:

СѴі = ЮО-уууг — Ю,1%.

тогда как коэффициент вариации датских угрей по числу позвон­ ков

Из сопоставления этих показателей видно, что первый признак варьирует сильнее, чем второй.

Величина коэффициента вариации определяется отношением абсолютных значений двух основных характеристик вариацион­ ного ряда — средней арифметической и среднего квадратическо­ го отклонения. При нормальном распределении коэффициент ва­ риации обычно не превышает 45—50% и часто бывает гораздо ниже этого уровня. В случаях же асимметричных распределений он может быть довольно высоким, достигающим иногда 100% и выше. Особенно высоким коэффициентом вариации характеризу­ ются признаки, распределяемые по закону Пуассона. Покажем это на следующем примере. Изучалась поражаемость клеток при облучении ткани животного организма альфа-частицами. Было проведено 517 испытаний; результаты распределились следую­ щим образом:

число пораженных

клеток (х):

0

1

2

3

4

5

6

7

частота поражений

(р):

112

168

130

68

32

5

1

1

1 Коэффициент вариации можно выразить не только в процентах, но и в

а

долях единицы, т. е. в виде отношения“

X

79