Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Лакин Г.Ф. Биометрия учеб. пособие

.pdf
Скачиваний:
55
Добавлен:
25.10.2023
Размер:
16.09 Mб
Скачать

шаров, т. е. отобранные варианты возвращаются в ту же сово­ купность, из которой они взяты, так что могут быть отобраны повторно. Если же отбираемые варианты обратно в генеральную совокупность не возвращаются, отбор называется бееповторным или безвозвратным. В первом случае отбор вариант не влияет на состав генеральной совокупности, и вероятность каждой вариан­ ты попасть в выборку не меняется. Во втором случае каждый предшествующий отбор влияет на результаты отбора последую­ щего, изменяя состав генеральной совокупности и вероятность вариант попасть в состав выборки.

Теоретическая схема повторного отбора является более про­ стой, позволяющей легче понять содержание и формулу выбо­ рочной ошибки. В действительности, однако, т. е. на практике, обычным оказывается бесповторный отбор: измеряя, например, рост людей или животных, их вторично уже не принимают в расчет. В силу отмеченных обстоятельств в формулу выбороч­ ной ошибки средней (х ) при бесповторном случайном отборе

вносится поправка

Л

^

п , или

упрощенно "]/ ] __ , на

 

 

 

*

N -

1

 

 

'

N.

которую умножается ошибка:

 

 

 

 

 

тт= - і -

] /

1 - — =

л [ ( 1-

V

(53)

 

 

Ѵп

 

Ѵ

N

V

п \

N )

совокупно­

Здесь п

объем выборки,

а N — объем генеральной

*

 

 

 

 

 

 

 

 

сти. Например, из общего числа 5000 мужчин, подлежащих при­ зыву на военную службу, методом случайного бесповторного отбора измерено 500 человек. Средний рост призывников ока­ зался равным 170 см, выборочная дисперсия о2= 66,3 см. Отсю­ да выборочная ошибка средней арифметической роста призыв­ ников будет равняться:

т 7 =

222 ^ =

119= 0,33 см.

 

5000/

 

Если бы отбор вариант производился из этой совокупности пов­ торным случайным способом, ошибка выборочной средней оказа­ лась бы равной:

т - Ѵ і = Ѵ ш = Ѵ 0 Л З = а -36 « •

Повторный и бесповторный случайный отбор может прово­ диться по-разному, смотря по тому, как организуется наблюде­ ние над изучаемым объектом. Отсюда следуют разновидности отбора: а) типический, или групповой, отбор, называемый также районированным, который в свою очередь может быть пропорци-

90

ональным и непропорциональным; б) серийный, или гнездовой, отбор и в) отбор механический. Все эти виды отбора направле­ ны на повышение репрезентативности выборки, хотя они и нару­ шают принцип рендомизации, так как проводятся по заранее намечаемой схеме.

В случае типического отбора генеральная совокупность пред­ варительно расчленяется на отдельные и притом одинаковые (при пропорциональном отборе) или неодинаковые по составу (в случае непропорционального отбора) группы или районы, из которых случайным способом производится отбор какого-то ко­ личества вариант. Затем отобранные из каждой группы вариан­ ты объединяются в одну выборочную совокупность и подвергают­ ся совместной статистической обработке. Выборочная ошибка средней арифметической в случаях типического пропорциональ­

ного повторного отбора определяется по формуле т —=

а при бееповторном отборен+ =

Если же из

генеральной совокупности производится типический непропорцио­ нальный отбор вариант, выборочная ошибка средней (т) опреде­ ляется по формулам: при случайном повторном отборе

т - = — 1 /

N 2 и при случайном бееповторном отборе

N V

п

В этих формулах о,- — средняя взвешенная из выборочных дис­

персий типических групп; N — численность

типических

групп;

п — численность выборок, взятых из типических групп.

метро­

Рассмотрим следующий пример. Методом

наложения

вок проводился учет урожая пшеницы на корню. Поле было раз­ делено на пять участков, или типических групп, на которых в об­ щей сложности наложено 1000 метровок. Из каждой типической группы случайным бесповторным способом отбиралось пропор­ циональное (по объему групп) количество колосьев с последую­ щим взвешиванием содержавшихся в них зерен. Результаты от­ бора и их первичная обработка приводятся в табл. 24.

Определяем общую среднюю для всех выборочных групп:

2 ( ліХі)

20 X 9,8 + 40 X 8,5 -f 80 X 7,7 + 30 X 12,1 + 30 X 10,202

20 + 40 + 80 + 30 + 30

1821

9,2 a.

200

91

 

 

 

 

Т а б л и ц а 24

 

 

 

Выборочные

Ошибка

Типовые

Численность

Численность

 

 

участки

групп (Л ')

выборки ( л . )

средняя (х-) дисперсия ( о |)

средней ( т ~ ^

(группы)

 

 

 

1

100

20

9 , 8

4 , 6

0 , 4 2

2

200

40

8 , 5

3 , 2

0 , 2 5

3

400

80

7 , 7

3 , 6

0 , 1 9

4

150

30

12,1

4 , 1

0 ,3 3

5

150

30

1 0 ,2

3 , 8

0 , 3 2

Сумма . . .

1000

200

Рассчитываем взвешенную среднюю из

выборочных

дисперсий

отдельных групп. Вычисления вспомогательных значений приво­ дятся в следующей табл. 25.

 

 

 

 

Т а б л и ц а 25

 

 

Типовые группы

 

Показатели

2

3

4

Сумма

1

5

Численность

выборки

 

 

 

 

 

 

 

( П і ) .....................................

20

40

80

30

30

200

Средние групп

(х,-) . .

9 , 8

8 , 5

7 , 7

12,1

1 0 ,2

Дисперсии СГ; . . . .

4 , 6

3 , 2

3 , 6

4 , 1

3 , 8

(Пі— 1)ХСТ; . . .

8 7 , 4

1 2 4 ,8

2 8 4

, 4

1 1 8 ,9

1 1 0 ,2

7 2 5 ,7

(Хі—Х)

 

0 , 6

0 , 7

1

,5

2 , 9

1 , 0

(Х{—X)2

 

0 , 3 6

0 , 4 9

2 , 2 5

8 ,4 1

1 ,0 0

Пі(Хі-Х)2

7 , 2

1 9 ,6

1 8 0 ,0

2 5 2 ,3

3 0 , 0

4 8 9 ,1

Подставляя известные значения в формулу, находим:

2

2 ( r tnj — 1)Сі

ИПі(хі — х ) г

 

п — 1

 

 

Os

= -

— V

 

 

 

 

 

 

 

 

 

725,7

489,1

3,72 + 2,46

- 6,18

а.

 

195

=

 

199

 

 

 

Определяем ошибку общей средней:

 

 

т7 = Л /

200 I

 

= /0 ,0 2 5 =

0,158

г.

* г

1000/

 

 

Выборочные ошибки групповых средних определялись так:

м . =1/0,184=0,42 и т. д.

т т г Ѵ

 

100

 

20

20

 

 

Когда из генеральной совокупности отбираются не варианты, как. при типическом отборе, а целые серии вариант, или гнезда, подвергаемые сплошной обработке, т. е. в случаях серийного от­ бора, выборочная ошибка средней арифметической определяется по тем же формулам, которые используются и при типическом от­ боре вариант, а именно-:

а)

при повторном отборе— ту —

0]_

Ѣ

б)

при бесповторном отборе

 

 

т - =

 

 

Здесь

а? — межсерийная

(межгрупповая) средняя дисперсия;

N — число серий в общей

(генеральной) совокупности; п — число

отобранных серий.

При серийном отборе, как и в случаях типического отбора, ге­ неральная совокупность делится на группы, называемые серия­ ми, или гнездами, которые и отбираются в необходимом (наме­ чаемом исследователем) количестве для совместной обработки. Серии могут быть равночисленными и неодинаковыми по числу составляющих их вариант. Например, при изучении физического развития учащихся сельских школ из 50 равновеликих групп подросткоів в возрасте от 14 до 16 лет обследованию подверглись 6 групп. Признаками наблюдения были взяты: окружность груди

(см), рост стоя

(см) и вес тела

(кг). Результаты

измерения ок­

ружности груди оказались следующие:

 

 

 

№ групп (серии):

1

2

3

4

5

6

средние групп (х ,)

71,9

72,8

73,5

76,1

73,2

74,8;

дисперсии {of):

16,8

18,3

20,8

17,1

23,9

22,6

Чтобы определить ошибку средней (х), сначала надо вычислить среднюю величину межсерийной дисперсии:

—2

2 ( лгі х )2

Оі

= -----------------

=

 

Пі

 

(71,9 — 74,0) 2 + (72,8 - 74,0)2 +

... + (74,8 - 74,0) 2

 

12,98

см,

 

2,16

93

откуда выборочная ошибка средней арифметической

Серийный отбор применяется в медико-биологических, соци­ ально-экономических, санитарно-гигиенических и во многих дру­ гих областях исследований, когда необходимо выяснить, напри­ мер, состояние отдельных коллективов: школ, заводов, воинских частей и т. п. объектов, называемых гнездами. Из них и отбира­ ется необходимое число единиц (серий). Серийный отбор произ­ водятся однократно, а также и периодически, что позволяет учи­ тывать не только состояние, но и динамику популяций по целому ряду признаков — таких, например, как гельминтоносительство, инфекционные и неинфекционные заболевания, физическое раз­ витие населения и т. п.

В отличие от других форм повторного и бесповторного отбо­ ра, так называемый механический отбор производится следую­ щим образом. Генеральная совокупность разбивается на столько групп, сколько намечено отобрать вариант из этой совокупности, так как из каждой группы отбирается только одна варианта. Ес­ ли, например, генеральная совокупность состоит из 500 вариант, из которых намечено отобрать 50, то, очевидно, в выборку долж­ на попасть каждая десятая варианта. Следовательно, генераль­ ная совокупность должна быть разбита на равные десять групп. Средняя арифметическая такой выборки сопровождается ошиб­ кой, которая рассчитывается по формулам 48 и 53.

Ошибки других выборочных показателей

В исследовательской работе может возникнуть необходимость объединить ряд выборочных средних с их ошибками или найти произведение средних, сопровождаемых ошибками и т. д. В та­ ких случаях поступают следующим образом:

1. Когда определяется средняя арифметическая из несколь­ ких независимых средних с их ошибками, то выборочная ошибка такого результата вычисляется по следующей формуле:

т -

= — ѴтІ-^-тІАг . . . -f т\.

(54)

s

Пі

 

Например, на трех равновеликих выборках получены средние: хі = 10,2±0,12; Х2 = 11,5±0,18; х3= 13,1 ±0,09. Определим средний результат из этих показателей: xs= (10,2+11,5+13,1) : 3= 11,6. Находим ошибку этого результата:

тт = — l/0,122 + 0,182 + 0,092 = —

=0,07.

5

3

3

3

94

2. Выборочная ошибка суммы нескольких средних арифмети­ ческих, сопровождаемых их ошибками, равняется

OTi~|-W2~f- . . .

-j-tnn.

(55)

Применительно к тому же примеру обобщенная ошибка трех средних

т7 = іЛ),122 + 0,1824-0,092=0,21.

3. Ошибка произведения двух выборочных средних с их ошибками определяется по формуле

' ' Х і '

' Х 2 '

Например, нужно найти произведение:

хі = 10,3 ±0,11

Х2 = 8,2 ± 0,12

Хі X Х2 = 10,3 X 8,2 = 84,46.

Ошибка произведения этих средних будет равна:

тп = 84,46 У ( ^ і )2 + ( - ^ - ) 2 = 84,46 X 0,18 = 15,2.

4. Ошибка частного от деления средних арифметических с их ошибками определяется по следующей формуле:

 

mch =

Хі

(57)

 

 

 

Х2

 

Разделим — =

.— ’— =

1,26. Ошибка этой

величины — тсн=

Х 2

8 ,2

 

 

=1,26X0,18=0,22.

5.Ошибка разности выборочных средних \—хг = D) двух

независимых и равновеликих

распределений

(т. е. при пі = пг)

равняется:

 

 

 

 

 

 

m0 = l / - +

— =

і /

п

m \+ m l

(58)

г

пх

щ

V

 

 

95

6. Ошибка разности выборочных средних (хі—х 2 — D) двух независимых, но неравновеликих выборок (т. е. при Піфп2) рав­ няется:

 

пі + п2

 

 

(59)

 

mD

 

 

 

 

«1 X «2

 

 

 

 

(til

1) СТі —j—(tl2

1) Ö2

 

 

где öl =

Пі

n2 2

 

 

 

 

 

 

 

2

 

2

2

2

 

_ Hi(«i — l)mi -{- n2

(n2— \)m 2

2 a i-f-2 a 2

 

t i i t i 2 — 2

 

П і -f- n 2 — 2

и

а — (x x).

Tак что

 

m

f

 

j a ' + ^

X gl±ü*. (69a)

 

r tix «2 — 2 \ nx

Щ)

У nx-\-n2 — l

 

7. Выборочная ошибка разности средних {х\—х 2 = D) сопря­ женных распределений, т. е. таких, которые находятся в зависи­ мости друг от друга или от какой-нибудь общей причины, вычис­ ляется по формуле 58 с поправкой на сопряженность т. е.

ті + 2 = у + m2 — 2rm1m2.

(60)

Здесь г —•коэффициент корреляции, показывающий степень со­ пряженности двух рядов распределений (см. ниже).

Выборочную ошибку разности средних арифметических сопря­ женных распределений можно вычислить, не прибегая к исполь­ зованию коэффициента корреляции, по следующим аналогичным формулам:

п/

1

/

2 d2

\

X,(d — d )2

(61)

md = У ------: ( --------- d2)

п(п — 1)

І П

-- 1

\

П

/

 

md

 

 

 

 

2 ß?2— n X d

(61a)

 

 

 

 

n2 — n

 

 

 

 

 

 

Здесь d — разность между соответствующими вариантами сопря­ женных рядов X и Y, т. е. d = xу; d — средняя разность, т. е. 2d

— = d — X — у D\ п — общее число парных наблюдений.

п

Соответствующие примеры по использованию этих формул при­ водятся ниже.

96

Показатель точности оценки параметров

Сама по себе абсолютная величина выборочной ошибки как показатель именованный мало пригодна для случаев сравнитель­ ной оценки точности, с какой определены средние результаты на­ блюдений по отношению их к генеральным параметрам. Напри­ мер, имеются средние: хі = 86,1 ±0,7 см и х2 = 17,4 ±0,2 г. По аб­ солютной величине их ошибок трудно сказать, какая средняя определена более точно, поскольку средние с их ошибками вы­ ражены разными единицами меры.

Чтобы получить определенное представление о точности, с какой определен тот или иной средний результат, принято исполь­ зовать так называемый показатель точности (Cs), представляю­ щий отношение выборочной ошибки к своей средней арифмети­ ческой:

т—

(62)

Cs = —— 100%.

X

Когда известно значение коэффициента вариации (СУ), показа­ тель точности можно определить по следующей формуле:

Cs —

СѴ

(62а)

 

Уп

Под точностью определения выборочной средней понимается степень приближения ее к средней генеральной совокупности. Чем точнее определен средний результат, тем меньше будет Cs, и наоборот, при менее точном среднем результате показатель Cs окажется больше. Точность считается достаточной, если Cs не превышает 3—5%. Так, для приведенных выше средних показа­ тель точности в обоих случаях оказывается очень высоким:

Csi = Ю О -^ - = 0,18%

и Cs2= 1 0 0 - ^ —= 1,15%.

öb,l

17,4

Вместе с тем видно, что первая средняя определена более точно, чем вторая.

С Т А Т И С Т И Ч Е С К А Я П Р О В Е Р К А Г И ПО Т Е З

НУЛЕВАЯ ГИПОТЕЗА і " '"

Почти во всех случаях выборочного наблюдения параметры генеральной совокупности остаются неизвестными. О них прихо­ дится судить по выборочным данным, т. е. гипотетически, так как выборочные показатели являются величинами случайными. Для оценки величины генеральных параметров по выборочным показателям в биологии используется так называемая н у л е в а я

4—2802

97

г и п о т е з а , т. е. предположение о том, что генеральные пара­ метры, о которых судят по выборочным данным, не отличаются друг от друга, и что разница, наблюдаемая между выборочными показателями, носит не систематический, а исключительно слу­ чайный характер. Выдвигая нулевую гипотезу, экспериментатор исходит из предположения, что наблюдаемая изменчивость при­ знака зависит не от действия организованного фактора, а опре­ деляется второстепенными, нерегулируемыми в опыте случайны­ ми причинами.

УРОВНИ ЗНАЧИМОСТИ И ДОВЕРИТЕЛЬНЫЕ ВЕРОЯТНОСТИ

Сформулированная гипотеза нуждается в проверке. Чтобы ее принять или отвергнуть, нужны основания. Их дает теория веро­ ятностей, позволяющая увязывать статистические гипотезы с оп­ ределенной вероятностью. Следуя закону нормального распреде­ ления, можно утверждать, что в 95% случаев выборочная средняя

(х) не отклонится от средней (М) генеральной совокупности

X — .A4

больше, чем на 2t, іде t = -------- . И только 5% случаев, считая

а

отклонения от М в + и — направленных, выйдет за эти границы. Это значит, что вероятность получить в выборке средний резуль­ тат, который отклонится от генерального параметра на 2 t, равна лишь 0,05. Если же речь идет об отклонении от М только в одну сторону, вероятность будет вдвое меньше (Р = 0,025). Процент таких маловероятных случаев, которые противоречат принятой ги­

потезе, ставят ее под

сомнение, называется у р о в н е м з н а ч и ­

м о с т и гипотезы. В

биологических исследованиях обычно при­

нимается 5%-й уровень значимости, которому соответствует ве­ роятность Р = 0,05. В более ответственных случаях, когда выводы должны быть особенно строгими, принимается 1%-й или 0,1 %-й уровни, которым соответствуют ^ 2 = 0,01 и Р 3 = 0,001.

Таким образом, вероятность, которой решено пренебречь при оценке генеральных параметров по данным выборочных наблю­ дений, выражается принятым уровнем значимости. Вероятность же обратных случаев, когда гипотеза заслуживает доверия, на­ зывается д ов е р и т ел ь н о й вероятностью. Обычно в исследо­ вательской практике принимаются три порога доверительной ве­ роятности: Р] = 0,95; Рг = 0,99 и /%=0,999. Из табл. I приложений видно, что каждый порог, или уровень доверительной вероятнос­

ти, связывается с определенной

величиной

нормированного от­

клонения следующим образом:

 

 

вероятности Рі—0,95 соответствует

^ = 1,96

»

Р2 =0,99

»

*= 2,58

»

Р3 = 0,999

»

* = 3,29

Величина доверительной вероятности или уровень значимо­ сти при проверке гипотез устанавливается самим исследовате­

98

лем в зависимости от степени точности, с какой проводится ис­ следование и ответственности выводов, вытекающих из него. При этом уровни значимости и доверительные вероятности обо­

значаются одним и тем

же символом

Р,

который

может сопро­

вождаться

указанием

на принятый

уровень

значимости Р0,о5

и т. д., или порог доверительной вероятности

Р0,95 и т. д. Если

0,05 или

же Р<0,95, то

отвергать

нулевую

гипотезу нет

оснований. Когда же Р < 0,05

или Р ^ 0,95, нулевая гипотеза от­

вергается.

 

 

 

 

 

 

 

ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ И ЕГО ГРАНИЦЫ

Границы, в которых с той или иной вероятностью находится параметр генеральной совокупности, называются доверительны­ ми, а интервал, заключенный между этими границами, носит название доверительного. Опираясь на закон нормального рас­ пределения, который утверждает, что вероятность отклонения любой варианты от центра распределения определяется функ­ цией нормированного отклонения, можно в общей форме следую­ щим образом установить доверительный интервал для неизвест­ ного генерального параметра М\

М

+ і-

Преобразуя это выражение, получаем: х to ^ М ^ х + to. Это и есть доверительный интервал, в котором находится величи­

на генерального параметра М. Здесь л: — to

и x + to — довери­

тельные границы; t — нормированное

отклонение, определяемое

порогом доверительной вероятности.

Так, с вероятностью

Р =

= 0,95, которой соответствует ^ = 1,96,

можно

утверждать,

что

неизвестный генеральный параметр М нормально распределяе­ мой совокупности находится в интервале

X — 1,96а ^ М ^ X + 1,96а.

На рис. 10 изображена нормальная кривая и указаны довери­ тельные границы интервалов, соответствующие трем порогам доверительной вероятности.

Так как выборочная средняя х варьирует вокруг генеральной

средней М в У п — раз меньше, чем любая отдельно взятая вари­ анта данной совокупности, распределяемой по нормальному за­ кону, то нетрудно установить доверительные границы интервала для генерального параметра М по величине выборочной сред­ ней X:

X t —^ ^ М

X + t

у«

у«

4*

99