книги из ГПНТБ / Лакин Г.Ф. Биометрия учеб. пособие
.pdfЭто значит, что средняя арифметическая при альтернативном варьировании есть не что иное, как относительная частоты или доля одной из альтернатив в их общей совокупности. Обозначив долю вариант, обладающих данным признаком, через р, полу-
чим: р = |
т ~ |
которые этого признака не |
|
— , іогда доля вариант, |
|||
|
п |
|
|
имеют, |
обозначаемая через q, будет |
равна: |
|
|
п — т |
j |
т |
|
п |
|
п |
Очевидно, p + q= l и p = \ —q, а <7—1—р. Например, из общего числа 125 учащихся успевают на хорошо и отлично 80, а осталь ные 45 учатся на удовлетворительно. Средняя арифметическая, или доля успевающих на хорошо и отлично, выразится следую щей величиной:
X
80
= 0,632, или 63,2%.
І25
Так как p-\-q = n=A00%, отсюда доля*учеников, успевающих на удовлетворительно, будет равна: 100—63,2 = 36,8%. Полученный результат можно найти и из пропорции: 125: 100 = 80 : х, откуда
х = 80Х 100 : 125= 63,2%. |
среднее |
квадратическое |
отклонение |
|||||||
Находим дисперсию и |
||||||||||
для альтернативных признаков: |
|
|
|
|
|
|||||
|
|
S p ( X j - x ) 2 _ |
p ( l — p)2+ q ( o — p)2 |
|
|
|||||
|
|
п |
|
|
|
(р + q) |
|
|
|
|
рд2 + др2 |
рд(р + д) |
pq, |
или |
вр = |
ірд = |
~\/р(\ — Р). |
||||
(,р + |
д ) |
{ р + |
д) |
= |
||||||
|
|
|
|
|
|
|
||||
Когда |
альтернативы |
выражаются |
в |
процентах, |
то ар= |
|||||
= ]^p(100—р). |
Так, для |
взятого примера ар= 1^0,632X0,368 = |
||||||||
0,23 = 0,48. |
Эта |
величина, очевидно, |
относится |
к обоим |
||||||
альтернативам. |
|
|
|
|
|
|
|
|
|
Ошибка выборочных долей
Выборочные доли, как и любые выборочные характеристики, являются величинами случайными. А так как они служат оцен ками генеральных долей, то должны вычисляться с поправкой на погрешность оценки, т. е. сопровождаться ошибкой репрезен тативности ГПр.
В случае повторного случайного отбора вариант из генераль ной совокупности и в зависимости от того, в каких — абсолют ных или относительных — частотах выражены альтернативы, их
1 5 0
выборочная ошибка вычисляется по следующим формулам:
|
\ |
от, |
т(п — от) |
(76) |
Здесь от и п—от — абсолютные численности альтернатив, поэто му и ошибка, вычисляемая по этой формуле, называется ошиб
кой абсолютной частоты. |
выражены в долях единицы р = Щ. и |
||||
|
|||||
Если же альтернативы= У |
|
|
|
п |
|
<7= 1—— , их выборочная |
ошибка |
|
находится по следующей |
||
формуле относительной частоты: |
|
|
|
|
|
і / |
p X q |
|
/Р (1 — Р) |
(77) |
|
тр = у --------- |
= |
} |
|
||
1 |
П |
|
|
Когда же альтернативы выражаются в процентах, их выбо рочная ошибка рассчитывается по формуле процентной частоты:
от, = |
I / |
|
|
_ у /7(100- р ) |
|
(78) |
||||
Например, в потомстве от скрещивания золотистых хомячков |
||||||||||
получено 64 рыжих и 20 альбинотических |
особей. Выборочная |
|||||||||
ошибка этих отношений равна: |
|
|
|
|
|
|
||||
|
|
У |
84 |
|
|
|
|
|
|
|
ОТ г |
|
|
64X20 |
|
3,9. |
|
|
|
||
|
|
|
|
У 15,24 = |
|
|
|
|||
Это значит, что в потомстве получено 64±3,9 рыжих |
и |
20±3,9 |
||||||||
альбинотических детенышей. |
|
|
|
|
|
|
64 |
|||
„ |
|
|
|
|
|
долях |
единицы |
о = |
||
Если выразить эти отношения в |
— = |
|||||||||
|
|
|
|
|
|
|
|
|
|
84 |
20 |
|
|
|
|
|
|
|
|
|
|
= 0,76 и <7 = 84 = |
0,24, |
выборочная |
ошибка |
альтернативных |
||||||
признаков выразится следующей величиной: |
|
|
|
|
||||||
|
|
=У- |
|
84 |
|
|
|
|
|
|
|
|
|
|
76 X 0,24 |
|
|
|
|
||
|
от, |
|
|
|
|
= 0,05. |
|
|
|
|
Выражая альтернативы в |
|
процентах — 76% |
рыжих |
и 24% |
альбиносов — находим выборочную ошибку процентной частоты:
У:76X24
ОТт 84 : У21,7 = 4,7%.
151
Если одна из альтернатив равна или близка |
к нулю, т. е. |
т = 0 , или же т = п, то выборочная ошибка доли |
(в процентах) |
определяется по формуле |
|
-.//7(100- р ) |
(79) |
ГПр |
|
п + 3 |
|
где р — показатель относительной доли, определяемой по фор муле Ван дер Вардена (в процентах):
т + |
1 |
(80) |
п + |
X 100. |
|
2 |
|
Например, в лесном массиве при учете певчих птиц из общего числа 23 зарегистрированных видов не оказалось ни одной пе-
0
ночки-веснички. Выборочная доля весничек р = — == 0. Вводя 23
поправку на случайность этого показателя, т. е. рассчитывая до лю пеночек-весничек по формуле 80, находим
0 + 1 |
X 100 |
кю |
4,0%, |
23 + |
2 |
~25 |
|
откуда средняя ошибка этой доли будет равна:
-1/4X96 |
,------- |
тР = |
= У 14,77 = 3,84%. |
Если из генеральной совокупности производится бесповтор ный случайный отбор и выборка составляет довольно значитель ную часть генеральной совокупности (не <25% ), выборочная ошибка альтернатив определяется по следующей формуле:
— |
1+ |
+ - ^ |
) ‘ |
|
<«> |
Здесь р и q — численности долей; n = p + q — объем |
выборки, а |
||||
N — объем генеральной |
совокупности. |
Например, |
из общего |
||
числа 5800 человек, проживающих в населенном пункте, |
мето |
||||
дом случайного бесповторного |
отбора |
обследовано |
1500 |
чело- |
1 Когда необходимо увеличить точность, вместо 1—— следует брать мно-
N — n
житель —---- -; но при большом N разница между этими множителями оказы
вается практически несущественной.
152
век, из которых 200 оказались больными. Доля больных Р =
200 |
= |
0,13, или 13%. Выборочная ошибка доли: |
|||
І500 |
|||||
тр = |
-1/0,13X0,87/ |
1500 \ |
-і/0,006 |
0,08, или 0 ,8 %. |
|
|
* |
1500 |
58СЮ / — ' 100 |
|
|
Нашли, что в населенном пункте |
13 ± 0,8% |
больных. Достовер |
ность этого показателя не вызывает сомнений.
Доверительный интервал доли
По величине выборочной ошибки доли устанавливаются границы интервала, в котором с определенной вероятностью на ходится генеральный параметр доли, именно:
р ± trap,
где tmp= Ap — доверительная |
граница доли, т. е. та максималь |
ная погрешность или ошибка, |
с которой оценивается генераль |
ная доля по данным выборочного наблюдения. Здесь t имеет то же значение, что и в формуле предельной ошибки средней ариф метической рядовой изменчивости, т. е. критерий, по которому с определенной вероятностью устанавливается доверительная граница для генерального параметра. Значения тр, т. е. выбо рочной ошибки доли, показаны выше.
Например, доверительные границы генеральной доли боль ных д л я / = 2,0 будут следующие:
нижняя граница = 13,0—2X0,8= 11,4% верхняя граница = 13,0+2X0,8=14,6%.
А для той же величины t = 2,0 максимальная ошибка доли пе- ночек-весничек равняется ДР = 2x3,84 = 7,68%. Отсюда верхняя граница доверительного интервала генеральной доли пеночек этого вида равняется 4,0 + 7,68=41,68%.
Метод 9 (фи)
Описанный способ обеспечивает точное установление дове рительных границ генеральной доли в тех случаях, когда выбо рочная доля равна 50% наблюдений или близка к этой величи не. Если же доля одной из альтернатив невелика (р<20) и тем более близка к нулю или к единице, этот способ расчета дове рительных границ будет неточным, так как сильное отклонение доли от Р = 0,5 резко сказывается на величине ее выборочной ошибки. Чтобы избежать возможной неточности в таких случаях, следует воспользоваться вспомогательной величиной ф (фи), предложенной Р. А. Фишером: -
Ф = 2 arcsinf/?. |
(82) |
153
Эта величина имеет близкое к нормальному распределение. Ее ошибка репрезентативности довольно просто связана с объемом
выборки (п):
т<t— |
(83) |
|
~\/п |
Для практического использования этого критерия составлена специальная таблица значений ф для разных значений доли,
т
выраженных в процентах, т. е. в виде р = — X ЮО. Эта таблица
приводится в приложениях под № XIII.
Возьмем следующий пример. Из общего числа 80 детей, об следованных в детских учреждениях, 5 оказались косноязычны ми. Найдем доверительные границы для генеральной доли кос-
ноязычных детей. |
Выборочная |
доля |
равна р = |
— =0,063, |
или |
|||
6,3%. Если выборочную ошибку доли |
определить |
по формуле |
||||||
78, она окажется равной |
|
|
|
|
|
|
||
т. - |
I |
6,3 X 93,7 |
= 1/7,38 = 2,71%. |
|
|
|||
V |
|
80 |
|
|
||||
Предельная ошибка для |
Р = 0,95 и соответственно |
/=1,96 |
рав |
|||||
няется Ар = 1,96.x2,71 =5,3%. Отсюда |
границы |
доверительного |
||||||
интервала оказываются следующими: |
|
|
|
|
||||
|
нижняя |
граница=6,3— 5,3= 1,0% |
|
|
|
|||
|
верхняя |
граница = 6,3+5,3 = 11,6% |
|
|
|
Но так как доля косноязычных детей весьма невелика — все го лишь 6,3%, нет уверенности в том, что установленные таким способом доверительные границы точные. Установим их по ме тоду «фи». Для первого порога доверительной вероятности Р = = 0,95 и соответственно /=1,96 предельная ошибка доли, опре деляемая по формуле 83, равняется
_ 1 _ |
1,96 |
ф/г |
0,218. |
ф80 |
По табл. XIII приложений находим, что величине доли р = 6,3% отвечает значение ф= 0,507. Отсюда доверительные границы для Ф будут следующие:
нижняя |
граница |
(ф і) =0,507— 0,218 = 0,289 |
|
|
верхняя |
граница |
(<р2) =0,507+0,218 = 0,725 |
|
|
Затем по значению фі = 0,289 в той же табл. XIII находим ниж |
||||
нюю границу для Р, равную 2,1%, а |
по значению |
ф2= 0,725 — |
||
верхнюю границу генеральной доли, |
равную 12,6%. |
Это и есть |
154
точные границы доверительного интервала доли. Сравнивая первый результат (1,0 % —11,6 %) со вторым (2 ,1 % —12,6 %), видим, что они не совпадают друг с другом.
Оценка разности между долями
Чтобы по разности между выборочными долями оценить ее достоверность в генеральной совокупности, необходимо эту раз ность отнести к ее ошибке и полученное значение сравнить с его критическим значением по критерию ССтьюдента или по крите рию ф Фишера.
Оценка по критерию Т-Стьюдента
Ошибка разности |
выборочных |
долей определяется |
по сле |
||
дующей формуле: |
|
|
|
|
|
_ |
1/ Рі(1 — Рі) |
. |
Р2(1 — р2) |
(84) |
|
ftldp'— |
V |
--------------- п |
) |
||
|
1 |
|
«2 |
|
Если же доли выражены в процентах от общего числа наблюде ний (л), формула 84 приобретает следующее выражение:
УР і (100 p i )
indp =
Пі
/?2 ( 1 0 0 — Pz)
(85)
пг
Приведенные формулы служат надежными оценками разности долей в генеральной совокупности, когда численности выбороч ных групп оказываются равновеликими или не очень сильно от личаются одна от другой. Если же сравниваемые группы весьма различны по своим объемам, ошибки разности, вычисляемые по этим формулам, могут оказаться неточными. В таких случаях более точные результаты получаются при использовании сле дующей формулы:
mdp = ^ |
pq (— + — ) = |
(8 6 ) |
|
1 |
'л і |
п2' |
' |
где П\ и «2 — численности |
выборок, |
на которых определяются |
доли р и q\ причем р определяется как средняя взвешенная из
р1 и р2 долей, т. е.
р і Щ +P z flz
Р = -------:------ . Яі -f- Пг
а q = 1—р или 9 = 1 0 0 —р, если доли выражены в процентах. Так как средняя взвешенная из отношений частот сравни
ваемых выборок равна
155
|
|
Ші |
пі |
|
|
т2 |
п%_ |
|
|
trii + |
т2 |
|
|
|
|
||
|
|
Пі |
X |
|
|
п2 |
|
|
|
|
|
|
|||||
|
р = |
|
|
Н------ X |
|
|
|
Пі -f- п 2 |
|
|
|
|
|
||||
|
|
|
|
Пі~{- П2 |
|
|
|
|
|
|
|
|
|||||
можно написать: |
|
РіПі |
-+j- |
p2n2 |
Шіt l i |
|
|
m2 |
|
|
|
|
(87) |
||||
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
П і |
П 2 |
|
--fj-- n 2 |
|
|
|
|
|
|||||
В развернутом виде формула 86 выглядит так: |
|
|
|
|
|
||||||||||||
mdp = |
-\! РіПі + р2п2! |
|
pirn + |
|
|
р2п2\ |
пх + п2 |
||||||||||
у |
---------:------- |
I |
1 — -------- ;-------- |
) X |
Пі■ |
|
|
|
(8 6 a) |
||||||||
|
|
X «2 |
|||||||||||||||
|
f |
« t |
- { - П 2 |
' |
|
tuПі 4- f - |
|
Пtl2о |
/ |
|
|
|
|
|
|||
Ші |
p2 |
m 2 |
|
|
|
вариант, |
|
имеющих данный приз- |
|||||||||
где pi = —• и |
— ------ доли |
|
|||||||||||||||
Пі |
|
п2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
нак. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Если признак выражен в процентах, то |
|
|
|
|
|
|
|||||||||||
|
-]/ |
ріПі-\-р2П2( |
|
РіПі + |
|
Ріп2^ |
Пі |
-(- |
п2 |
||||||||
тар = |
|
|
|
|
100 |
|
+ |
|
|
|
|
|
( 866) |
||||
У ------- :------\ |
Пі |
п2 |
|
|
|
X |
|||||||||||
|
1 |
«1 + |
«2 |
' |
|
|
|
Пі |
п2 |
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Например, при изучении влияния эндотоксина на выживаемость облученных животных были получены результаты, приведенные в табл. 46. Из этой таблицы видно, что смертность особей в опытной и контрольной группах весьма различна. Нужно оце нить достоверность полученного результата, т. е. разность меж ду числом особей, выживших в опыте и контроле. Можно оце нить эту разность по ее отношению к своей ошибке, рассчитан ной по формуле 84:
|
|
|
Т а б л и ц а 46 |
Группы животных |
Выжило |
Погибло |
Всего |
Контрольная . . . . . . |
3(21,4% ) |
и (78,6%) |
14 |
Опытная ............................ |
23 (63,9%) |
13(36,1%) |
36 |
И т о г о . . . |
26 |
24 |
50 |
т 2 |
т і |
П2 |
Пі |
Р і { \ — Рі) |
j М 1~ Рг) |
Пі |
п2 |
156
2 3 /3 6 -3 /1 4
1 / 3/14X0,786 23/36X0,361
' |
14 |
^ |
36 |
_ |
0,639 — 0,214 |
|
0,425 _ д 1 |
У0 ,0 12 + 0,006 ~~ 0,134 ~
Но такая оценка будет неточной, так как численность контроль ной и опытной групп очень различна; сильно отличаются друг от друга и численности погибших и выживших животных в груп пах (р<25%). Поэтому выборочную ошибку разности между контролем и опытом следует вычислять в этом случае по более точной формуле 8 6 . Средняя взвешенная долей
3 |
= |
|
|
23 |
= 0,639 |
|
|
|
|
Рі = |
0,214 и р 2 = - |
|
|
|
|||||
будет равна: |
0,214 X 14 + |
0,639X36 |
3 + 23 |
|
|
||||
|
|
|
- 0,52. |
||||||
|
|
р — ------ ------------------------- |
50 |
||||||
|
|
|
|
14 + |
36 |
|
|
||
Находим ошибку разности: |
|
|
|
|
|||||
|
mdp = У |
05,2 X 0,48 ( і - + |
= У0,025 = |
0,157, |
|||||
|
|
|
|
|
14 36- |
|
|
|
|
откуда |
t |
0,425 |
= 2,71. По таблице |
Стьюдента |
(табл. V при- |
||||
0,157 |
|||||||||
|
|
|
|
|
|
|
|||
ложений) |
для |
к = П]+п2—2 = 14+ 36—2 = 48 и |
Р = 0,01 находим |
||||||
tst = 2,58. Так |
как |
г“ф = 2,71>г% = 2,58, |
нулевая |
гипотеза отвер |
гается с высокой вероятностью (Р = 0,99); эффективное действие эндотоксина на выживаемость облученных животных нужно признать статистически достоверным.
Оценка по критерию Фишера
Разность между долями, когда они сильно отличаются друг от друга (р<2Ь%), можно с достаточной точностью оценить с
помощью критерия ф («фи»). При этом доли выражаются в про центах и с поправкой Йейтса на непрерывность, равной Ѵг и, которая вычитается из большей и прибавляется к меньшей до ле. Так, для рассматриваемого примера
Р і ( и с т ф . ) = рл + ^7= 2 1 , 4 + ^ |
= |
= 21,4 + 0,036 = 21,436%
157
|
|
1 |
|
1 |
р2(испр.) = |
р2% — 2пг = |
63,9 |
2 X 3 6 |
|
= |
63,9 |
0,014 = |
63,886%. |
|
По табл. XIII приложений |
для |
= 21,436 находим значение |
фі = 0,962 и для р2= 63,886 значение ср2= 1,853. Разность ф2—фі =
= 1,853—0,962 = 0,891 |
можно |
оценить |
по ее отношению к |
своей |
||||
ошибке, равной |
|
УЗб + м = п т |
|
|
|
|||
ftldtp -- |
|
0,315 «0,32. |
||||||
0,89 |
|
|
|
|
||||
= |
2,78. Этому значению |
t отвечает вероят |
||||||
Именно: і ~ |
||||||||
032 |
|
|
|
|
|
|
|
|
ность P( t ) =P ( 2,78) =0,995 |
(см. табл. I приложений). На |
этом |
||||||
основании можно утверждать, что |
разница |
между |
опытом и |
|||||
контролем статистически достоверна. |
сравниваемыми |
группами |
||||||
Достоверность |
разницы |
между |
можно оценить и с помощью критерия Фишера:
П1X «2
р ч>= (фі — ф г ) 2 X Пі + п2'
Если фактическая величина этого критерия превосходит его стандартное значение (/%), указанное в табл. VII приложений для взятого уровня значимости (Р) и чисел степеней свободы ki = 1 (берется по горизонтали таблицы) и &2= ni + n2— 2 (нахо дится в первом столбце той же таблицы), нулевая гипотеза от вергается, разница признается достоверной. В данном случае
14X36 |
504 |
|
|
Рф = (1,853 - 0,962)2 X 14 + 36 = ° ’7 9 3 9 Х 50 |
= 8,0. |
|
|
По табл. VII приложений для &і = 1 |
и &2= 14+ 36—2 = 48 и |
Р — |
|
= 0,01 находим F st — 7,2. Так как / гф = 8,0>/% = 7,2, |
нулевая |
ги |
потеза отвергается; разница между опытом и контролем оказы вается статистически достоверной.
Разницу между сравниваемыми группами можно оценить и путем сопоставления доверительных интервалов, построенных с помощью критерия «фи». В данном случае эта задача решается
следующим образом. Мы уже знаем, |
что |
величине доли рі = |
=21,4% отвечает значение фі = 0,962 |
и |
р2= 63,9% — значение |
ф2= 1,853. Находим максимальные ошибки критерия ср для уров ня значимости Д=0,05, которому соответствует /=1,96:
Ар, = 1,96 X -L = = 0,524 и Др2 = |
1,96 X ~ = 0,325, |
У14 |
У36 |
158
откуда границы доверительных интервалов будут следующие:
для |
фі |
нижняя |
граница=0,962—0,524 = 0,468, или |
5,4% |
|
для |
ф2 |
верхняя |
граница = 0,962 + 0,524= 1,486, |
или |
45,8% |
нижняя |
граница = 1,852—0,325=1,528, |
или |
47,9% |
||
|
|
верхняя |
граница= 1,852+ 0,325=2,178, |
или |
78,5% |
Итак, нашли доверительный интервал для р\ — от 5,4% до 45,8% и для р2— от 47,9% до 78,5%. Видно, что интервалы не накла дываются друг на друга. Следовательно, с вероятностью Р = 0,95 разница между опытом и контролем должна быть признана до стоверной.
Если взять более высокую вероятность Р = 0,99, которой со ответствует / = 2,58, то максимальные ошибки критерия ср ока жутся следующими: Ді = 0,689 и Д2= 0,430. Построенные по этим данным доверительные интервалы оказываются следующими: для р і — от 1,9 до 54,0% и для р2— от 42,6 до 82,7%. Верхний предел р 1 немного выше нижней границы р2. Однако трансгрес сия настолько мала (54,0—42,6=11,4%), что принять нулевую гипотезу нет оснований.
Оценка разности между выборочной и генеральной долями
Когда |
известна доля признака в генеральной совокупности |
||
I |
А \ |
, то разница между генеральной и выборочной долями |
|
уР = |
- - J |
||
(Р—р) |
оценивается отношением этой разности к ее ошибке, ко |
||
торая определяется по генеральной доле, т. е. по формуле |
|||
|
|
/л„ = У Я(1~ Р)- , |
(8 8 ) |
где Р — доля признака в генеральной совокупности; |
п — общее |
число наблюдений или объем выборки. Рассмотрим применение этой формулы на следующем примере. Изучалось влияние воз раста производителей на пол потомства у крупного рогатого ско та. Для спаривания с быками разного возраста подбирались коровы примерно одинакового возраста. Результаты трехлетних испытаний оказались следующие (табл. 47).
Т а б л и ц а 47
|
Родилось телят |
|
|
Ошибка |
Критерий |
|
Возраст быков |
|
В ТОМ |
Доля |
Разность |
||
|
разности |
достоверное- |
||||
в годах |
всего |
телок (/?) |
(р — Р) |
(та ) |
™ V |
|
(от — до) |
|
|
||||
|
|
числе |
|
|
|
|
|
|
телок |
|
|
|
|
2 - 3 |
141 |
77 |
0,55 |
0,05 |
0,043 |
1,2 |
4 - 5 |
89 |
43 |
0,48 |
0,02 |
0,053 |
0,4 |
6 - 7 |
88 |
41 |
0,46 |
0,04 |
0,053 |
0,8 |
> 7 |
118 |
49 |
0,41 |
0,09 |
0,046 |
2,0 |
159