Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Лакин Г.Ф. Биометрия учеб. пособие

.pdf
Скачиваний:
55
Добавлен:
25.10.2023
Размер:
16.09 Mб
Скачать

В результате находим:

lg x g = — X 0,54618 = 0,13654, откуда

x g = 1,37 см. Эту величину можно получить и по формуле

30:

lg 45,6 — lg 13,0_

0,54502

см.

lg

=0,13626; откуда xg= l,3 7

Если средний показатель относительной величины прироста точно отражает действительность, то последовательное произве­ дение его значений, начиная с начальной (базисной) величины, должно равняться его конечной величине. Проверка этим спосо­

бом точности средней арифметической

показывает:

13,0X 1,41 X

X 1,41 X 14,1 X 1,41 =51,4 см. Результат

значительно

превышает

конечную величину признака, равную 45,6 см. Другой результат получается от проверки тем же способом точности средней геоме­ трической относительного прироста: 13,0Х 1,37Х 1,37Х 1.37Х X 1,37 = 45,8 см. Разница 45,8—45,6 = 0,2 см объясняется прибли­ женными вычислениями коэффициентов годового прироста. Итак, расчет показывает, что средняя геометрическая — более точный показатель величины относительного прироста, чем средняя арифметическая. Из приведенных примеров становится понятным значение средней геометрической.

МАЖОРАНТНОСТЬ ПАРАМЕТРИЧЕСКИХ СРЕДНИХ

Описанные средние показатели позволяют по данным выбо­ рочного наблюдения судить о параметрах генеральной совокуп­ ности, распределяемой по нормальному закону (см. ниже). Так как эти средние получаются из одной и той же общей формулы, между ними существуют определенные отношения, выражаемые следующим рядом мажорантности (неравенства):

Л* Q

•bg а.ц.

НЕПАРАМЕТРИЧЕСКИЕ СРЕДНИЕ

Медиана

Медиана — это такой непараметрический показатель, который характеризует середину вариационного ряда: в обе стороны от медианы располагается одинаковое число вариант. Например, для следующего распределения

х:

3

г 6 7

8

10

12

13

15

17

р:

2

3 4

5

б

5

4

3

2 —

медиана равна 10: в обе стороны от этой величины располагает­ ся по 14 вариант, число 10 занимает центральное положение в этом ряду, является его медианой.

60

Труднее определить медиану, когда варианты распределяют­ ся в вариационном ряду неравномерно. В таких случаях поступа­ ют следующим образом. Сначала аккумулируют частоты вариа­ ционного ряда в направлении от минимальной варианты до вели­ чины несколько большей, чем полусумма всех вариант ряда; по этой величине и определяется класс (при непрерывном варьиро­ вании), в котором находится медиана. Затем из полусуммы всех вариант совокупности вычитается число, после которого заканчи­ вается ряд накопленных частот. Полученный результат относит­ ся к частоте того класса, в котором находится медиана, и резуль­ тат умножается на величину классового интервала. Найденная таким путем величина прибавляется к величине нижней границы класса, содержащего медиану. В результате получается искомое значение медианы, которую принято обозначать через Me (от лат. mediana — средняя).

Определим медиану распределения кальция в сыворотке кро­ ви павианов-гамадрилов. Расчет показан в табл. 14.

 

 

 

 

Т а б л и ц а 14

Классы по уровню кальция

Частоты

1 Накопленные]

Вычисление медианы

в сыворотке крови (мг%)

ср)

частоты /

8 ,5 5 - 9,24

2

2

п

100 „

9,25— 9,94

3

5

2 “

2

9,95—10,64

9

14

50-31 = 19

10,65—11,34

17

31

11,35—12,04

25

56

 

 

12,05—12,74

23

 

— Х 0 ,7 = 0 ,7 6 x 0 ,7=0,532

12,75—13,44

10

 

25

 

13,45—14,14

7

 

М е= 11,35+0,532= 11,88л« %

14,15-14,84

4

 

 

 

 

Медиану можно рассчитать по следующей формуле:

 

/

т - -

5 Л

 

(32)

 

Ме = х к- \ - і \ —-------- /.

 

'

Рк

'

 

 

Здесь Xk — нижняя граница того

класса,

в котором находится

медиана;

і — величина классового

интервала;

— число цосле

которого

заканчивается ряд накопленных

частот; ph— частота

того класса, в котором находится медиана.

 

следующим об­

Для взятого примера медиана

определяется

разом: .

 

 

 

 

 

 

/5 0 — 31

\

11,88 мг%.

 

М е = 11,35 + 0,7^

 

) =

61

Медиана служит вспомогательной характеристикой вариацион­ ного ряда; ее значение выясняется при оценке эмпирических рас­ пределений по нормальному закону (см. ниже).

Мода

Модой называется наиболее часто встречающаяся величина. В непрерывных вариационных рядах мода находится обыкновен­ но в том классе, который имеет наибольшее число вариант. Этот класс с наибольшей частотой называется модальным классом. Например, в распределении количества кальция в сыворотке кро­ ви павианов-гамадрилов модальным является пятый класс с час­ тотой 25; срединное значение этого класса равно 11,7 мг%.

Вариационные ряды могут содержать два и большее число модальных классов. Обычно мода, как и медиана, является вели­ чиной, довольно близкой к средней арифметической и совпадает с ней при полной симметрии распределения. Поэтому для прак­ тически симметричных или слабо скошенных распределений мо­ да определяется приблизительно по следующим формулам К. Пирсона:

Мо = Зх — 2Me, или Мо = х — 3(х — Me) .

Так, для распределения количества кальция в сыворотке крови павианов-гамадрилов мода определяется по этим формулам сле­ дующим образом:

Мо =

3 X 11,90 — 2 X 11,88 = 3570 — 23,76 — 11,94 мг %,или

Мо =

11,90 + 3(11,90 - 11,88) =

11,90 + 0,06 = 11,96 мг%.

Мода может быть вычислена и по следующей приближенной

формуле:

 

 

 

Mo = X Ля X о

(33)

 

 

2

 

где X — средняя арифметическая;

Л з— показатель асимметрии

или скошенности распределения;

о — среднее

квадратическое

отклонение

 

 

Более точные результаты при определении моды получаются

на основании следующей формулы: .

 

 

Л1о = а + і ( — ^ --- ^ — ),

(34)

 

' 2р2— рі Рг'

 

где xk—■нижняя граница модального класса, т. е. класса с наи­ большей частотой; р\ — частота класса, предшествующего мо-

1 Описание указанных показателей см. ниже.

62

дальному; р2— частота модального класса; р3— частота класса, следующего за модальным.

Применение этой формулы к распределению количества каль­ ция в сыворотке крови павианов-гамадрилов дает следующий ре­

зультат:

 

 

 

Мо =

11,35 + 04

2 5 - 17

=

2 X 2 5 — 17 — 23

= 11,35 +

0

11,35 + 0 ,5 6 = 11,91)

мг%.

Мода и медиана, являясь вспомогательными характеристика­ ми вариационного ряда, применяются в биологических исследо­ ваниях сравнительно редко.

ГЛАВА ПЯТАЯ

ПОКАЗАТЕЛИ ВАРИАЦИИ

ЛИМИТЫ И РАЗМАХ ВАРИАЦИИ

Средняя арифметическая — важнейшая статистическая ха­ рактеристика. Но она ничего не говорит о величине варьирования характеризуемого признака. Не содержат такой информации и другие средние показатели, о которых сообщалось в предыдущей главе. Между тем без учета степени варьирования нельзя соста­

вить полную характеристику варьирующего признака.

Отсюда

следует, что наряду с использованием средних величин

нужны

еще и показатели вариации изучаемых признаков.

л и м и-

Одним из таких показателей служат так называемые

ты (от лат. limes — предел, граница), т. е. минимальная

и мак­

симальная варианты совокупности. Лимиты показывают факти­ ческие границы варьирования признака, что имеет определенное значение, например, в метеорологии, где лимиты показывают ми­ нимальную и максимальную температуру, а также в микробио­ логии для характеристики размеров микроорганизмов, в селекции и во многих других областях знания. Значение лимитов в их кон­ кретности. Поэтому в сводных биометрических таблицах, наряду с другими статистическими показателями, приводятся обыкновен­ но и лимиты, обозначаемые символом Пт.

Размеры варьирования признаков оцениваются также по раз­ ности лимитов, т. е. разности между максимальной и минималь­ ной вариантами совокупности. Этот показатель называется р а з ­ м а х о м вариации. Например, если лимиты одной выборки рав­ ны: min =4 и тах= 16, а другой, т іп = 3 и тах= 19, то размах вариации в первом случае равен: 16—4=12, а во втором— 19— —3=16, откуда следует, что вариабильность первого признака меньше, чем второго.

Описываемые показатели вариации конкретны и просты — в этом их положительное значение. Но, в силу присущих им недо­ статков, они не применяются в качестве основного мерила вари­ ации, во-первых, потому что способны сильно менять свое значе­ ние, а во-вторых, в силу их неспособности характеризовать существенные черты варьирования. Иллюстрацией к сказанному могут служить следующие ряды ранжированных значений двух переменных величин х и у.

х:

10

15

20

25

30

35

40

45

50;

1 = 30

у:

10

28

28

30

30

30

32

32

50;

у = 30

Средние арифметические этих рядов одинаковы, одинаковыми являются и лимиты, а следовательно, и размах вариации. А ха­

64

рактер варьирования у них разный, что не отражается на величи­ не этих показателей..

ДИСПЕРСИЯ И СРЕДНЕЕ КВАДРАТИЧЕСКОЕ ОТКЛОНЕНИЕ

Наиболее подходящей мерой варьирования служит централь­ ный момент второго порядка. Этот показатель, обозначаемый символом >о2, называется средним квадратом отклонений, или д и с п е р с и е й , и выражается формулой

E j X j - x ) 2 *

(35)

Al — 1

Учитывая повторяемость отклонений и обозначая ихчерез а, мо­ жем выразить эту формулу в таком виде:

'Ера2

(35а)

о2

1

п

 

Извлекая корень квадратный из дисперсии, получим другой по­

казатель— с р е д н е е

к в а д р а т и ч е с к о е

о т к л о н е н и е :

- | /

Е р ( Х і - х ) 2

Ера2

(36)

 

п 1

Уп

1

'

 

Величина п—1 носит название ч и с л а

с т е п е н е й с в о б о ­

ды, под которым подразумевается число свободно варьирующих членов совокупности. Чтобы уяснить это понятие, с которым при­ дется встречаться в дальнейшем, представим некоторую совокуп­ ность варьирующих значений признака, из которой случайным способом, т. е. наугад, отбираются три варианты с тем условием, чтобы в сумме они дали число 30. Очевидно, первые две вариан­ ты могут принимать различные значения, свобода их вариации ничем не ограничена, тогда как третья варианта может принять только одно значение, определяемое разностью между числом 30 и суммой первых двух вариант. В таких случаях говорят, что в ограниченных условиях одна варианта не имеет степени свободы.

В математической статистике доказывается, что при опреде­ лении средней арифметической никаких ■ограничений свободы варьирования не имеется. При вычислении же показателей вари­ ации один член эмпирической совокупности всегда не имеет сте­ пени свободы. А в некоторых случаях для п членов может быть и большее число ограничений свободы вариации (ѵ). Обозначив число степеней свободы через k, можем выразить этот показатель в виде формулы k = n—ѵ. Так как обычно ѵ = 1, то формула при­ нимает вид k = n—1.

* Некоторые авторы средний квадрат отклонений называют вариансой, а под дисперсией понимают сумму квадратов отклонений вариант от средней

арифметической

(Плохинский, 1970; Рокицкий, 1967 и др.).

3—2802

65

Среднее квадратическое отклонение, называемое также основ­ ным, или стандартным, отклонением (от англ, standard deviati­ on),— величина именованная и выражается в тех же единицах измерения, что и признак. Чем сильнее варьирует признак, тем больше и величина среднего квадратического отклонения, и на­ оборот, при слабом варьировании признака среднее квадратиче­ ское отклонение будет меньше. Так, для приведенного выше ряда ранжированных значений переменной величины X среднее квад­ ратическое отклонение оказывается равным 13,7; это видно из следующего расчета:

X:

а:

10

15

20

25

30

35

40

45

50;

20

15

10

5

0

5

10

15

20;

400

225

100

25

0

25

100

225

400;

1500, откуда

і / 1500

,-------

= 13,7,

Ох = у,

= У 187,5

Тогда как для второго ряда {у) этот показатель (сигма) выража­ ется следующей величиной:

У-

10

28

28

30

30

30

3 2

3 2

50:

у = 30

а:

20

2

2

0

0

0

2

2

20

 

а 2:

400

4

4

0

0

0

4

4

400:

2 а 2 = 816

 

 

 

 

-і/"816

 

 

 

 

 

 

 

 

Оу =

У I T " " 1

УШ2

". 10,1.

 

 

Из этого примера видно, что среднее квадратическое отклонение характеризует не только размах, но и специфику варьирования признаков.

При большом числе наблюдений разница между п и п—1 су­ щественно не сказывается на величине показателей вариации. Поэтому в приведенных формулах 35 и 36 вместо п—1 можно брать п. Если же объем совокупности невелик (д<30), этого де­ лать не надо, так как замена п—1 на п становится ощутимой и заметно сказывается на величине показателей вариации, которые окажутся несколько смещенными относительно их значения в генеральной совокупности (см. ниже).

Средняя арифметическая и среднее квадратическое отклоне­ ние дают полную количественную характеристику любой эмпи­ рической совокупности, распределяемой по нормальному закону. Средняя арифметическая отображает действие на признак основ­ ных причин, определяющих типичный для популяции уровень его развития, тогда как среднее квадратическое отклонение характе­ ризует варьирование значений этого признака вокруг центра рас­ пределения, т. е. средней арифметической, является мерой степе­ ни влияния на признак различных второстепенных причин, вызы­

66

вающих его варьирование. Таким образом, эти показатели хотя и отображают разные стороны варьирующих признаков, тесно связаны между собой.

ОСНОВНЫЕ СВОЙСТВА ПОКАЗАТЕЛЕЙ ВАРИАЦИИ

Показатели вариации — дисперсия и среднее квадратическое отклонение — играют большую роль в статистическом анализе биометрических данных. Поэтому важно указать на их основные свойства, которые могут быть использованы при решении ряда вопросов чисто прикладного значения.

1.Если каждую варианту совокупности увеличить на одну и

ту

же

величину,

то средняя арифметическая (х ) увеличится на

ту

же

величину,

тогда как дисперсия и среднее квадратическое

отклонение от этого не изменятся. Это свойство можно иллюст­ рировать на простом примере. Возьмем следующие семь вариант:

2 4 3 5 4 6 4, для которых х = 4,0 и

о2=1,43. Увеличим каждую

варианту на две единицы и вычислим среднюю

(х)

и дисперсию:

х :

4

6

5

7

6

8

_

Их

42

6;

п

7

а:

- 2 0 1

+ 1

0

+ 2 0

 

10

а2:

4

0

1

1

0

4

ІД2

0;

п

7

 

 

 

 

 

 

 

 

и о =

іЛ ,4 3 =

1,195.

 

 

 

 

 

 

Из этого следует, что средний квадрат отклонений можно вы­ числять не только по значениям признака, но и на их отклонени­ ях от какой-нибудь постоянной величины.

2. При умножении каждой варианты на одно и то же число К средняя (ж) увеличится в то же число раз, тогда как квадраты отклонений увеличатся в К2 раз, а следовательно, и дисперсия увеличится в К2 раз, среднее квадратическое отклонение, как и средняя (х), увеличится только в К раз. Иллюстрируем это пра­ вило на том же примере, увеличив каждую варианту в два раза:

х:

4

8

6

10

8

12

8;

-

56

8 , 0

 

=

а :

— 4

0

- 2

+ 2

0

+ 4

0

 

у

 

 

 

 

ß2;

16

0

4

4

0

16

0;

„ 2 _

j 0 _ =

5 ,7 1

 

 

 

 

 

 

 

 

 

7

 

И 0 = У 5 /7 1 = 2 , 3 9

Из этого правила следует, что при наличии многозначных ва­ риант их можно сократить на общий множитель К и по резуль­ татам вычислить дисперсию, а затем уменьшить ее на квадрат общего множителя (К2) для того, чтобы получилась искомая ве­ личина дисперсии.

3 *

67

3. Дисперсия равна разности между средним квадратом зна­ чений признака и квадратом их средней арифметической, т. е.

Иллюстрируем это правило на том же примере:

х:

2

4

3

5

4

6

4;

X = 4,0 и дг2

*2;

4

16

9

25

16

36

16;

2 x 2 = 1 2 2 ,

отсюда

122 о2 = • 16,0 == 1,43.

7

4. Если некоторая статистическая совокупность разделена на отдельные группы, то общая дисперсия (ау2) равна межгруппо­ вой дисперсии (аж2), представляющей средний квадрат отклоне­ ний групповых средних (х*) от общей средней (х) данной сово­ купности, причем эти средние взвешиваются по численности групп (гіі), плюс средняя из внутригрупповых дисперсий (о22), т. е.

Oy = G x -\-‘oz.

(38)

Это правило носит название правила сложения (разложения) дисперсии. Продемонстрируем его на следующем примере. На четырех разновозрастных группах людей одного и того же пола измерялась скорость кровотока в одну секунду. Результаты ока­ зались следующие (табл. 15):

 

 

 

 

 

Т а б л и ц а 15

 

Варианты опыта

(пробы)

 

Средняя

 

Возрастные группы

 

 

 

Сумма

7?

 

 

 

 

1

2

3

<*і>

1

 

 

 

П ер в ая .................... . .

7

10

12

29

9,67

93,51

Вторая ........................

9

7

14

30

10,00

100,00

Т р е т ь я .........................

11

16

20

47

15,67

245,55

Четвертая....................

15

18

17

50

16,67

277,89

Сумма ..........................

42

51

63

156

716,95

Видно, что эти данные варьируют как внутри групп, так и между группами. Неодинаковыми оказываются и групповые сред-

156 ние (хі) . Средняя арифметическая всего комплекса х = —- =

2

2х2

= 13,0 сек. Находим общую дисперсию: оу =

------- х2 =

 

п

68

=

1

102+

122 +

92 +

. . . + 172) -

(13,0)2 =

2234

169

— (72 +

— -

=

186,15— 169 — 17,15 сек.

Затем рассчитываем

межгрупповую

дисперсию: о* =

— 2 (*t - х

)2 =

— [9,67-13,0) 2+

(10,0-13,0) 2+,

 

 

 

Пі

 

 

 

4

 

 

 

 

 

+ (15,67 -

13,0)2+

(16,67 - 13,0) 2] =

-L (11,09 +

9,00 +

7,13 +

+

13,47) =

40,69

 

10,17 сек. Далее находим частные, или груп­

— — =

повые, дисперсии:

 

 

 

 

 

 

 

 

 

012= - ^ 1

— *2 = [^-(72 +

Ю2+

122) ] — [9,67]2 =

 

 

 

 

=

293

 

 

 

 

 

 

 

 

 

—-----93,51 - 4,16 сек\

 

 

 

 

 

 

 

О

 

 

 

 

 

 

 

 

Г 1

(92 +

?2+

1

 

 

326

 

 

 

°1 = [ Y

142)J - ю

2 = — ------100 =

 

 

 

 

= 108,67— 100 =

8,67 сек;

 

 

 

 

аз =

[ у ( И 2+

162 +

202) ]

- (15,67)2 =

 

= 259,00 - 245,55 = 13,45 сек.

04 = [^-(152+ 182+ 172) ] - (16,67)2 =

= 279,33 — 277,89 = 1,44 сек.

Отсюда определяем среднюю арифметическую из групповых

дисперсий:

 

 

—2

-^(4,16+ 8,67+.13,45+ 1,44) =

27,72

Gz =

= 6,93 сек.

 

 

4

В итоге получилось:

ст* + ^ = Ю,17 + 6,93 = 17,10 сек.

Погрешность, равную 17,15—17,10 = 0,05 сек, следует отнести на ■счет приближенных вычислений; она так мала, что ею вполне можно пренебречь.

Правило сложения дисперсий можно выразить и в виде сле­ дующей рабочей формулы:

2

--

2 (л, — 1) of

Ип.і(хі х )2

(39)

0S

п V

п — 1

 

 

 

69