книги из ГПНТБ / Лакин Г.Ф. Биометрия учеб. пособие
.pdfшаров, т. е. отобранные варианты возвращаются в ту же сово купность, из которой они взяты, так что могут быть отобраны повторно. Если же отбираемые варианты обратно в генеральную совокупность не возвращаются, отбор называется бееповторным или безвозвратным. В первом случае отбор вариант не влияет на состав генеральной совокупности, и вероятность каждой вариан ты попасть в выборку не меняется. Во втором случае каждый предшествующий отбор влияет на результаты отбора последую щего, изменяя состав генеральной совокупности и вероятность вариант попасть в состав выборки.
Теоретическая схема повторного отбора является более про стой, позволяющей легче понять содержание и формулу выбо рочной ошибки. В действительности, однако, т. е. на практике, обычным оказывается бесповторный отбор: измеряя, например, рост людей или животных, их вторично уже не принимают в расчет. В силу отмеченных обстоятельств в формулу выбороч ной ошибки средней (х ) при бесповторном случайном отборе
вносится поправка |
Л |
^ |
п , или |
упрощенно "]/ ] __ , на |
|||||
|
|
|
* |
N - |
1 |
|
|
' |
N. |
которую умножается ошибка: |
|
|
|
|
|||||
|
тт= - і - |
] / |
1 - — = |
л [ — ( 1- |
— V |
(53) |
|||
|
|
Ѵп |
|
Ѵ |
N |
V |
п \ |
N ) |
совокупно |
Здесь п — |
объем выборки, |
а N — объем генеральной |
|||||||
* |
|
|
|
|
|
|
|
|
сти. Например, из общего числа 5000 мужчин, подлежащих при зыву на военную службу, методом случайного бесповторного отбора измерено 500 человек. Средний рост призывников ока зался равным 170 см, выборочная дисперсия о2= 66,3 см. Отсю да выборочная ошибка средней арифметической роста призыв ников будет равняться:
т 7 = |
222 ^ = |
119= 0,33 см. |
|
5000/ |
|
Если бы отбор вариант производился из этой совокупности пов торным случайным способом, ошибка выборочной средней оказа лась бы равной:
т - Ѵ і = Ѵ ш = Ѵ 0 Л З = а -36 « •
Повторный и бесповторный случайный отбор может прово диться по-разному, смотря по тому, как организуется наблюде ние над изучаемым объектом. Отсюда следуют разновидности отбора: а) типический, или групповой, отбор, называемый также районированным, который в свою очередь может быть пропорци-
90
ональным и непропорциональным; б) серийный, или гнездовой, отбор и в) отбор механический. Все эти виды отбора направле ны на повышение репрезентативности выборки, хотя они и нару шают принцип рендомизации, так как проводятся по заранее намечаемой схеме.
В случае типического отбора генеральная совокупность пред варительно расчленяется на отдельные и притом одинаковые (при пропорциональном отборе) или неодинаковые по составу (в случае непропорционального отбора) группы или районы, из которых случайным способом производится отбор какого-то ко личества вариант. Затем отобранные из каждой группы вариан ты объединяются в одну выборочную совокупность и подвергают ся совместной статистической обработке. Выборочная ошибка средней арифметической в случаях типического пропорциональ
ного повторного отбора определяется по формуле т —=
а при бееповторном отборен+ = |
Если же из |
генеральной совокупности производится типический непропорцио нальный отбор вариант, выборочная ошибка средней (т) опреде ляется по формулам: при случайном повторном отборе
т - = — 1 / |
— N 2 и при случайном бееповторном отборе |
N V |
п |
В этих формулах о,- — средняя взвешенная из выборочных дис
персий типических групп; N — численность |
типических |
групп; |
п — численность выборок, взятых из типических групп. |
метро |
|
Рассмотрим следующий пример. Методом |
наложения |
вок проводился учет урожая пшеницы на корню. Поле было раз делено на пять участков, или типических групп, на которых в об щей сложности наложено 1000 метровок. Из каждой типической группы случайным бесповторным способом отбиралось пропор циональное (по объему групп) количество колосьев с последую щим взвешиванием содержавшихся в них зерен. Результаты от бора и их первичная обработка приводятся в табл. 24.
Определяем общую среднюю для всех выборочных групп:
2 ( ліХі)
20 X 9,8 + 40 X 8,5 -f 80 X 7,7 + 30 X 12,1 + 30 X 10,202
20 + 40 + 80 + 30 + 30
1821
9,2 a.
200
91
|
|
|
|
Т а б л и ц а 24 |
|
|
|
|
Выборочные |
Ошибка |
|
Типовые |
Численность |
Численность |
|
|
|
участки |
групп (Л ') |
выборки ( л . ) |
средняя (х-) дисперсия ( о |) |
средней ( т ~ ^ |
|
(группы) |
|
|
|
||
1 |
100 |
20 |
9 , 8 |
4 , 6 |
0 , 4 2 |
2 |
200 |
40 |
8 , 5 |
3 , 2 |
0 , 2 5 |
3 |
400 |
80 |
7 , 7 |
3 , 6 |
0 , 1 9 |
4 |
150 |
30 |
12,1 |
4 , 1 |
0 ,3 3 |
5 |
150 |
30 |
1 0 ,2 |
3 , 8 |
0 , 3 2 |
Сумма . . . |
1000 |
200 |
— |
— |
— |
Рассчитываем взвешенную среднюю из |
выборочных |
дисперсий |
отдельных групп. Вычисления вспомогательных значений приво дятся в следующей табл. 25.
|
|
|
|
Т а б л и ц а 25 |
|
|
Типовые группы |
|
|
Показатели |
2 |
3 |
4 |
Сумма |
1 |
5 |
Численность |
выборки |
|
|
|
|
|
|
|
( П і ) ..................................... |
20 |
40 |
80 |
30 |
30 |
200 |
||
Средние групп |
(х,-) . . |
9 , 8 |
8 , 5 |
7 , 7 |
12,1 |
1 0 ,2 |
— |
|
Дисперсии СГ; . . . . |
4 , 6 |
3 , 2 |
3 , 6 |
4 , 1 |
3 , 8 |
— |
||
(Пі— 1)ХСТ; . . . |
8 7 , 4 |
1 2 4 ,8 |
2 8 4 |
, 4 |
1 1 8 ,9 |
1 1 0 ,2 |
7 2 5 ,7 |
|
(Хі—Х) |
|
0 , 6 |
0 , 7 |
1 |
,5 |
2 , 9 |
1 , 0 |
— |
(Х{—X)2 |
|
0 , 3 6 |
0 , 4 9 |
2 , 2 5 |
8 ,4 1 |
1 ,0 0 |
— |
|
Пі(Хі-Х)2 |
7 , 2 |
1 9 ,6 |
1 8 0 ,0 |
2 5 2 ,3 |
3 0 , 0 |
4 8 9 ,1 |
Подставляя известные значения в формулу, находим:
2 |
2 ( r tnj — 1)Сі |
ИПі(хі — х ) г |
|
||
п — 1 |
|
|
|||
Os |
= - |
— V |
|
|
|
|
|
|
|
|
|
|
725,7 |
489,1 |
3,72 + 2,46 |
- 6,18 |
а. |
|
195 |
= |
|||
|
199 |
|
|
|
|
Определяем ошибку общей средней: |
|
|
|||
т7 = Л / |
200 I |
|
= /0 ,0 2 5 = |
0,158 |
г. |
* г |
1000/ |
|
|
Выборочные ошибки групповых средних определялись так:
м . =1/0,184=0,42 и т. д.
т т г Ѵ |
|
100 |
|
20 |
20 |
|
|
Когда из генеральной совокупности отбираются не варианты, как. при типическом отборе, а целые серии вариант, или гнезда, подвергаемые сплошной обработке, т. е. в случаях серийного от бора, выборочная ошибка средней арифметической определяется по тем же формулам, которые используются и при типическом от боре вариант, а именно-:
а) |
при повторном отборе— ту — |
0]_ |
||
Ѣ |
||||
б) |
при бесповторном отборе |
|||
|
||||
|
т - = |
|
|
|
Здесь |
а? — межсерийная |
(межгрупповая) средняя дисперсия; |
||
N — число серий в общей |
(генеральной) совокупности; п — число |
отобранных серий.
При серийном отборе, как и в случаях типического отбора, ге неральная совокупность делится на группы, называемые серия ми, или гнездами, которые и отбираются в необходимом (наме чаемом исследователем) количестве для совместной обработки. Серии могут быть равночисленными и неодинаковыми по числу составляющих их вариант. Например, при изучении физического развития учащихся сельских школ из 50 равновеликих групп подросткоів в возрасте от 14 до 16 лет обследованию подверглись 6 групп. Признаками наблюдения были взяты: окружность груди
(см), рост стоя |
(см) и вес тела |
(кг). Результаты |
измерения ок |
|||
ружности груди оказались следующие: |
|
|
|
|||
№ групп (серии): |
1 |
2 |
3 |
4 |
5 |
6 |
средние групп (х ,) |
71,9 |
72,8 |
73,5 |
76,1 |
73,2 |
74,8; |
дисперсии {of): |
16,8 |
18,3 |
20,8 |
17,1 |
23,9 |
22,6 |
Чтобы определить ошибку средней (х), сначала надо вычислить среднюю величину межсерийной дисперсии:
—2 |
2 ( лгі — х )2 |
|
Оі |
= ----------------- |
= |
|
Пі |
|
(71,9 — 74,0) 2 + (72,8 - 74,0)2 + |
... + (74,8 - 74,0) 2 |
|
|
12,98 |
см, |
|
2,16 |
93
откуда выборочная ошибка средней арифметической
Серийный отбор применяется в медико-биологических, соци ально-экономических, санитарно-гигиенических и во многих дру гих областях исследований, когда необходимо выяснить, напри мер, состояние отдельных коллективов: школ, заводов, воинских частей и т. п. объектов, называемых гнездами. Из них и отбира ется необходимое число единиц (серий). Серийный отбор произ водятся однократно, а также и периодически, что позволяет учи тывать не только состояние, но и динамику популяций по целому ряду признаков — таких, например, как гельминтоносительство, инфекционные и неинфекционные заболевания, физическое раз витие населения и т. п.
В отличие от других форм повторного и бесповторного отбо ра, так называемый механический отбор производится следую щим образом. Генеральная совокупность разбивается на столько групп, сколько намечено отобрать вариант из этой совокупности, так как из каждой группы отбирается только одна варианта. Ес ли, например, генеральная совокупность состоит из 500 вариант, из которых намечено отобрать 50, то, очевидно, в выборку долж на попасть каждая десятая варианта. Следовательно, генераль ная совокупность должна быть разбита на равные десять групп. Средняя арифметическая такой выборки сопровождается ошиб кой, которая рассчитывается по формулам 48 и 53.
Ошибки других выборочных показателей
В исследовательской работе может возникнуть необходимость объединить ряд выборочных средних с их ошибками или найти произведение средних, сопровождаемых ошибками и т. д. В та ких случаях поступают следующим образом:
1. Когда определяется средняя арифметическая из несколь ких независимых средних с их ошибками, то выборочная ошибка такого результата вычисляется по следующей формуле:
т - |
= — ѴтІ-^-тІАг . . . -f т\. |
(54) |
s |
Пі |
|
Например, на трех равновеликих выборках получены средние: хі = 10,2±0,12; Х2 = 11,5±0,18; х3= 13,1 ±0,09. Определим средний результат из этих показателей: xs= (10,2+11,5+13,1) : 3= 11,6. Находим ошибку этого результата:
тт = — l/0,122 + 0,182 + 0,092 = — |
=0,07. |
||
5 |
3 |
3 |
3 |
94
2. Выборочная ошибка суммы нескольких средних арифмети ческих, сопровождаемых их ошибками, равняется
OTi~|-W2~f- . . . |
-j-tnn. |
(55) |
Применительно к тому же примеру обобщенная ошибка трех средних
т7 = іЛ),122 + 0,1824-0,092=0,21.
3. Ошибка произведения двух выборочных средних с их ошибками определяется по формуле
' ' Х і ' |
' Х 2 ' |
Например, нужно найти произведение:
хі = 10,3 ±0,11
Х2 = 8,2 ± 0,12
Хі X Х2 = 10,3 X 8,2 = 84,46.
Ошибка произведения этих средних будет равна:
тп = 84,46 У ( ^ і )2 + ( - ^ - ) 2 = 84,46 X 0,18 = 15,2.
4. Ошибка частного от деления средних арифметических с их ошибками определяется по следующей формуле:
|
mch = |
Хі |
(57) |
|
— |
||
|
|
Х2 |
|
Разделим — = |
.— ’— = |
1,26. Ошибка этой |
величины — тсн= |
Х 2 |
8 ,2 |
|
|
=1,26X0,18=0,22.
5.Ошибка разности выборочных средних (х\—хг = D) двух
независимых и равновеликих |
распределений |
(т. е. при пі = пг) |
||||
равняется: |
|
|
|
|
|
|
m0 = l / - + |
— = |
і / |
п |
m \+ m l |
(58) |
|
г |
пх |
щ |
V |
|
|
95
6. Ошибка разности выборочных средних (хі—х 2 — D) двух независимых, но неравновеликих выборок (т. е. при Піфп2) рав няется:
|
пі + п2 |
|
|
(59) |
|
|
mD |
|
|
|
|
|
«1 X «2 |
|
|
|
|
|
(til — |
1) СТі —j—(tl2 — |
1) Ö2 |
|
|
|
где öl = |
Пі |
n2 — 2 |
|
|
|
|
|
|
||
|
2 |
|
2 |
2 |
2 |
|
_ Hi(«i — l)mi -{- n2 |
(n2— \)m 2 |
2 a i-f-2 a 2 |
||
|
t i i t i 2 — 2 |
|
П і -f- n 2 — 2 |
||
и |
а — (x — x). |
Tак что |
|
||
m |
f |
|
j a ' + ^ |
X gl±ü*. (69a) |
|
|
r tix «2 — 2 \ nx |
Щ) |
У nx-\-n2 — l |
|
7. Выборочная ошибка разности средних {х\—х 2 = D) сопря женных распределений, т. е. таких, которые находятся в зависи мости друг от друга или от какой-нибудь общей причины, вычис ляется по формуле 58 с поправкой на сопряженность т. е.
ті + 2 = у + m2 — 2rm1m2. |
(60) |
Здесь г —•коэффициент корреляции, показывающий степень со пряженности двух рядов распределений (см. ниже).
Выборочную ошибку разности средних арифметических сопря женных распределений можно вычислить, не прибегая к исполь зованию коэффициента корреляции, по следующим аналогичным формулам:
п/ |
1 |
/ |
2 d2 |
\ |
X,(d — d )2 |
(61) |
md = У ------: ( --------- d2) |
п(п — 1) |
|||||
І П |
-- 1 |
\ |
П |
/ |
|
|
md— |
|
|
|
|
2 ß?2— n X d |
(61a) |
|
|
|
|
n2 — n |
||
|
|
|
|
|
|
Здесь d — разность между соответствующими вариантами сопря женных рядов X и Y, т. е. d = x—у; d — средняя разность, т. е. 2d
— = d — X — у — D\ п — общее число парных наблюдений.
п
Соответствующие примеры по использованию этих формул при водятся ниже.
96
Показатель точности оценки параметров
Сама по себе абсолютная величина выборочной ошибки как показатель именованный мало пригодна для случаев сравнитель ной оценки точности, с какой определены средние результаты на блюдений по отношению их к генеральным параметрам. Напри мер, имеются средние: хі = 86,1 ±0,7 см и х2 = 17,4 ±0,2 г. По аб солютной величине их ошибок трудно сказать, какая средняя определена более точно, поскольку средние с их ошибками вы ражены разными единицами меры.
Чтобы получить определенное представление о точности, с какой определен тот или иной средний результат, принято исполь зовать так называемый показатель точности (Cs), представляю щий отношение выборочной ошибки к своей средней арифмети ческой:
т— |
(62) |
Cs = —— 100%. |
X
Когда известно значение коэффициента вариации (СУ), показа тель точности можно определить по следующей формуле:
Cs — |
СѴ |
(62а) |
|
|
Уп |
Под точностью определения выборочной средней понимается степень приближения ее к средней генеральной совокупности. Чем точнее определен средний результат, тем меньше будет Cs, и наоборот, при менее точном среднем результате показатель Cs окажется больше. Точность считается достаточной, если Cs не превышает 3—5%. Так, для приведенных выше средних показа тель точности в обоих случаях оказывается очень высоким:
Csi = Ю О -^ - = 0,18% |
и Cs2= 1 0 0 - ^ —= 1,15%. |
öb,l |
17,4 |
Вместе с тем видно, что первая средняя определена более точно, чем вторая.
С Т А Т И С Т И Ч Е С К А Я П Р О В Е Р К А Г И ПО Т Е З
НУЛЕВАЯ ГИПОТЕЗА і " '"
Почти во всех случаях выборочного наблюдения параметры генеральной совокупности остаются неизвестными. О них прихо дится судить по выборочным данным, т. е. гипотетически, так как выборочные показатели являются величинами случайными. Для оценки величины генеральных параметров по выборочным показателям в биологии используется так называемая н у л е в а я
4—2802 |
97 |
г и п о т е з а , т. е. предположение о том, что генеральные пара метры, о которых судят по выборочным данным, не отличаются друг от друга, и что разница, наблюдаемая между выборочными показателями, носит не систематический, а исключительно слу чайный характер. Выдвигая нулевую гипотезу, экспериментатор исходит из предположения, что наблюдаемая изменчивость при знака зависит не от действия организованного фактора, а опре деляется второстепенными, нерегулируемыми в опыте случайны ми причинами.
УРОВНИ ЗНАЧИМОСТИ И ДОВЕРИТЕЛЬНЫЕ ВЕРОЯТНОСТИ
Сформулированная гипотеза нуждается в проверке. Чтобы ее принять или отвергнуть, нужны основания. Их дает теория веро ятностей, позволяющая увязывать статистические гипотезы с оп ределенной вероятностью. Следуя закону нормального распреде ления, можно утверждать, что в 95% случаев выборочная средняя
(х) не отклонится от средней (М) генеральной совокупности
X — .A4
больше, чем на 2t, іде t = -------- . И только 5% случаев, считая
а
отклонения от М в + и — направленных, выйдет за эти границы. Это значит, что вероятность получить в выборке средний резуль тат, который отклонится от генерального параметра на 2 t, равна лишь 0,05. Если же речь идет об отклонении от М только в одну сторону, вероятность будет вдвое меньше (Р = 0,025). Процент таких маловероятных случаев, которые противоречат принятой ги
потезе, ставят ее под |
сомнение, называется у р о в н е м з н а ч и |
м о с т и гипотезы. В |
биологических исследованиях обычно при |
нимается 5%-й уровень значимости, которому соответствует ве роятность Р = 0,05. В более ответственных случаях, когда выводы должны быть особенно строгими, принимается 1%-й или 0,1 %-й уровни, которым соответствуют ^ 2 = 0,01 и Р 3 = 0,001.
Таким образом, вероятность, которой решено пренебречь при оценке генеральных параметров по данным выборочных наблю дений, выражается принятым уровнем значимости. Вероятность же обратных случаев, когда гипотеза заслуживает доверия, на зывается д ов е р и т ел ь н о й вероятностью. Обычно в исследо вательской практике принимаются три порога доверительной ве роятности: Р] = 0,95; Рг = 0,99 и /%=0,999. Из табл. I приложений видно, что каждый порог, или уровень доверительной вероятнос
ти, связывается с определенной |
величиной |
нормированного от |
|
клонения следующим образом: |
|
|
|
вероятности Рі—0,95 соответствует |
^ = 1,96 |
||
» |
Р2 =0,99 |
» |
*= 2,58 |
» |
Р3 = 0,999 |
» |
* = 3,29 |
Величина доверительной вероятности или уровень значимо сти при проверке гипотез устанавливается самим исследовате
98
лем в зависимости от степени точности, с какой проводится ис следование и ответственности выводов, вытекающих из него. При этом уровни значимости и доверительные вероятности обо
значаются одним и тем |
же символом |
Р, |
который |
может сопро |
|||
вождаться |
указанием |
на принятый |
уровень |
значимости Р0,о5 |
|||
и т. д., или порог доверительной вероятности |
Р0,95 и т. д. Если |
||||||
0,05 или |
же Р<0,95, то |
отвергать |
нулевую |
гипотезу нет |
|||
оснований. Когда же Р < 0,05 |
или Р ^ 0,95, нулевая гипотеза от |
||||||
вергается. |
|
|
|
|
|
|
|
ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ И ЕГО ГРАНИЦЫ
Границы, в которых с той или иной вероятностью находится параметр генеральной совокупности, называются доверительны ми, а интервал, заключенный между этими границами, носит название доверительного. Опираясь на закон нормального рас пределения, который утверждает, что вероятность отклонения любой варианты от центра распределения определяется функ цией нормированного отклонения, можно в общей форме следую щим образом установить доверительный интервал для неизвест ного генерального параметра М\
М
+ і-
Преобразуя это выражение, получаем: х — to ^ М ^ х + to. Это и есть доверительный интервал, в котором находится величи
на генерального параметра М. Здесь л: — to |
и x + to — довери |
||
тельные границы; t — нормированное |
отклонение, определяемое |
||
порогом доверительной вероятности. |
Так, с вероятностью |
Р = |
|
= 0,95, которой соответствует ^ = 1,96, |
можно |
утверждать, |
что |
неизвестный генеральный параметр М нормально распределяе мой совокупности находится в интервале
X — 1,96а ^ М ^ X + 1,96а.
На рис. 10 изображена нормальная кривая и указаны довери тельные границы интервалов, соответствующие трем порогам доверительной вероятности.
Так как выборочная средняя х варьирует вокруг генеральной
средней М в У п — раз меньше, чем любая отдельно взятая вари анта данной совокупности, распределяемой по нормальному за кону, то нетрудно установить доверительные границы интервала для генерального параметра М по величине выборочной сред ней X:
X — t —^ ^ М |
X + t — |
у« |
у« |
4* |
99 |