Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Лакин Г.Ф. Биометрия учеб. пособие

.pdf
Скачиваний:
55
Добавлен:
25.10.2023
Размер:
16.09 Mб
Скачать

Это значит, что средняя арифметическая при альтернативном варьировании есть не что иное, как относительная частоты или доля одной из альтернатив в их общей совокупности. Обозначив долю вариант, обладающих данным признаком, через р, полу-

чим: р =

т ~

которые этого признака не

— , іогда доля вариант,

 

п

 

 

имеют,

обозначаемая через q, будет

равна:

 

п т

j

т

 

п

 

п

Очевидно, p + q= l и p = \ —q, а <7—1—р. Например, из общего числа 125 учащихся успевают на хорошо и отлично 80, а осталь­ ные 45 учатся на удовлетворительно. Средняя арифметическая, или доля успевающих на хорошо и отлично, выразится следую­ щей величиной:

X

80

= 0,632, или 63,2%.

І25

Так как p-\-q = n=A00%, отсюда доля*учеников, успевающих на удовлетворительно, будет равна: 100—63,2 = 36,8%. Полученный результат можно найти и из пропорции: 125: 100 = 80 : х, откуда

х = 80Х 100 : 125= 63,2%.

среднее

квадратическое

отклонение

Находим дисперсию и

для альтернативных признаков:

 

 

 

 

 

 

 

S p ( X j - x ) 2 _

p ( l — p)2+ q ( o — p)2

 

 

 

 

п

 

 

 

+ q)

 

 

 

рд2 + др2

рд(р + д)

pq,

или

вр =

ірд =

~\/р(\ — Р).

(,р +

д )

{ р +

д)

=

 

 

 

 

 

 

 

Когда

альтернативы

выражаются

в

процентах,

то ар=

= ]^p(100—р).

Так, для

взятого примера ар= 1^0,632X0,368 =

0,23 = 0,48.

Эта

величина, очевидно,

относится

к обоим

альтернативам.

 

 

 

 

 

 

 

 

 

Ошибка выборочных долей

Выборочные доли, как и любые выборочные характеристики, являются величинами случайными. А так как они служат оцен­ ками генеральных долей, то должны вычисляться с поправкой на погрешность оценки, т. е. сопровождаться ошибкой репрезен­ тативности ГПр.

В случае повторного случайного отбора вариант из генераль­ ной совокупности и в зависимости от того, в каких — абсолют­ ных или относительных — частотах выражены альтернативы, их

1 5 0

выборочная ошибка вычисляется по следующим формулам:

 

\

от,

т(п — от)

(76)

Здесь от и п—от — абсолютные численности альтернатив, поэто­ му и ошибка, вычисляемая по этой формуле, называется ошиб­

кой абсолютной частоты.

выражены в долях единицы р = Щ. и

 

Если же альтернативы= У

 

 

 

п

<7= 1—— , их выборочная

ошибка

 

находится по следующей

формуле относительной частоты:

 

 

 

 

і /

p X q

 

/Р (1 — Р)

(77)

тр = у ---------

=

}

 

1

П

 

 

Когда же альтернативы выражаются в процентах, их выбо­ рочная ошибка рассчитывается по формуле процентной частоты:

от, =

I /

 

 

_ у /7(100- р )

 

(78)

Например, в потомстве от скрещивания золотистых хомячков

получено 64 рыжих и 20 альбинотических

особей. Выборочная

ошибка этих отношений равна:

 

 

 

 

 

 

 

 

У

84

 

 

 

 

 

 

ОТ г

 

 

64X20

 

3,9.

 

 

 

 

 

 

 

У 15,24 =

 

 

 

Это значит, что в потомстве получено 64±3,9 рыжих

и

20±3,9

альбинотических детенышей.

 

 

 

 

 

 

64

 

 

 

 

 

долях

единицы

о =

Если выразить эти отношения в

— =

 

 

 

 

 

 

 

 

 

 

84

20

 

 

 

 

 

 

 

 

 

 

= 0,76 и <7 = 84 =

0,24,

выборочная

ошибка

альтернативных

признаков выразится следующей величиной:

 

 

 

 

 

 

=У-

 

84

 

 

 

 

 

 

 

 

 

76 X 0,24

 

 

 

 

 

от,

 

 

 

 

= 0,05.

 

 

 

Выражая альтернативы в

 

процентах — 76%

рыжих

и 24%

альбиносов — находим выборочную ошибку процентной частоты:

У:76X24

ОТт 84 : У21,7 = 4,7%.

151

Если одна из альтернатив равна или близка

к нулю, т. е.

т = 0 , или же т = п, то выборочная ошибка доли

(в процентах)

определяется по формуле

 

-.//7(100- р )

(79)

ГПр

п + 3

 

где р — показатель относительной доли, определяемой по фор­ муле Ван дер Вардена (в процентах):

т +

1

(80)

п +

X 100.

2

 

Например, в лесном массиве при учете певчих птиц из общего числа 23 зарегистрированных видов не оказалось ни одной пе-

0

ночки-веснички. Выборочная доля весничек р = — == 0. Вводя 23

поправку на случайность этого показателя, т. е. рассчитывая до­ лю пеночек-весничек по формуле 80, находим

0 + 1

X 100

кю

4,0%,

23 +

2

~25

 

откуда средняя ошибка этой доли будет равна:

-1/4X96

,-------

тР =

= У 14,77 = 3,84%.

Если из генеральной совокупности производится бесповтор­ ный случайный отбор и выборка составляет довольно значитель­ ную часть генеральной совокупности (не <25% ), выборочная ошибка альтернатив определяется по следующей формуле:

1+

+ - ^

) ‘

 

<«>

Здесь р и q — численности долей; n = p + q — объем

выборки, а

N — объем генеральной

совокупности.

Например,

из общего

числа 5800 человек, проживающих в населенном пункте,

мето­

дом случайного бесповторного

отбора

обследовано

1500

чело-

1 Когда необходимо увеличить точность, вместо 1—— следует брать мно-

N — n

житель —---- -; но при большом N разница между этими множителями оказы­

вается практически несущественной.

152

век, из которых 200 оказались больными. Доля больных Р =

200

=

0,13, или 13%. Выборочная ошибка доли:

І500

тр =

-1/0,13X0,87/

1500 \

-і/0,006

0,08, или 0 ,8 %.

 

*

1500

58СЮ / — ' 100

 

Нашли, что в населенном пункте

13 ± 0,8%

больных. Достовер­

ность этого показателя не вызывает сомнений.

Доверительный интервал доли

По величине выборочной ошибки доли устанавливаются границы интервала, в котором с определенной вероятностью на­ ходится генеральный параметр доли, именно:

р ± trap,

где tmp= Ap — доверительная

граница доли, т. е. та максималь­

ная погрешность или ошибка,

с которой оценивается генераль­

ная доля по данным выборочного наблюдения. Здесь t имеет то же значение, что и в формуле предельной ошибки средней ариф­ метической рядовой изменчивости, т. е. критерий, по которому с определенной вероятностью устанавливается доверительная граница для генерального параметра. Значения тр, т. е. выбо­ рочной ошибки доли, показаны выше.

Например, доверительные границы генеральной доли боль­ ных д л я / = 2,0 будут следующие:

нижняя граница = 13,0—2X0,8= 11,4% верхняя граница = 13,0+2X0,8=14,6%.

А для той же величины t = 2,0 максимальная ошибка доли пе- ночек-весничек равняется ДР = 2x3,84 = 7,68%. Отсюда верхняя граница доверительного интервала генеральной доли пеночек этого вида равняется 4,0 + 7,68=41,68%.

Метод 9 (фи)

Описанный способ обеспечивает точное установление дове­ рительных границ генеральной доли в тех случаях, когда выбо­ рочная доля равна 50% наблюдений или близка к этой величи­ не. Если же доля одной из альтернатив невелика (р<20) и тем более близка к нулю или к единице, этот способ расчета дове­ рительных границ будет неточным, так как сильное отклонение доли от Р = 0,5 резко сказывается на величине ее выборочной ошибки. Чтобы избежать возможной неточности в таких случаях, следует воспользоваться вспомогательной величиной ф (фи), предложенной Р. А. Фишером: -

Ф = 2 arcsinf/?.

(82)

153

Эта величина имеет близкое к нормальному распределение. Ее ошибка репрезентативности довольно просто связана с объемом

выборки (п):

т<t

(83)

 

~\/п

Для практического использования этого критерия составлена специальная таблица значений ф для разных значений доли,

т

выраженных в процентах, т. е. в виде р = — X ЮО. Эта таблица

приводится в приложениях под № XIII.

Возьмем следующий пример. Из общего числа 80 детей, об­ следованных в детских учреждениях, 5 оказались косноязычны­ ми. Найдем доверительные границы для генеральной доли кос-

ноязычных детей.

Выборочная

доля

равна р =

— =0,063,

или

6,3%. Если выборочную ошибку доли

определить

по формуле

78, она окажется равной

 

 

 

 

 

 

т. -

I

6,3 X 93,7

= 1/7,38 = 2,71%.

 

 

V

 

80

 

 

Предельная ошибка для

Р = 0,95 и соответственно

/=1,96

рав­

няется Ар = 1,96.x2,71 =5,3%. Отсюда

границы

доверительного

интервала оказываются следующими:

 

 

 

 

 

нижняя

граница=6,3— 5,3= 1,0%

 

 

 

 

верхняя

граница = 6,3+5,3 = 11,6%

 

 

 

Но так как доля косноязычных детей весьма невелика — все­ го лишь 6,3%, нет уверенности в том, что установленные таким способом доверительные границы точные. Установим их по ме­ тоду «фи». Для первого порога доверительной вероятности Р = = 0,95 и соответственно /=1,96 предельная ошибка доли, опре­ деляемая по формуле 83, равняется

_ 1 _

1,96

ф/г

0,218.

ф80

По табл. XIII приложений находим, что величине доли р = 6,3% отвечает значение ф= 0,507. Отсюда доверительные границы для Ф будут следующие:

нижняя

граница

(ф і) =0,507— 0,218 = 0,289

 

верхняя

граница

(<р2) =0,507+0,218 = 0,725

 

Затем по значению фі = 0,289 в той же табл. XIII находим ниж­

нюю границу для Р, равную 2,1%, а

по значению

ф2= 0,725 —

верхнюю границу генеральной доли,

равную 12,6%.

Это и есть

154

точные границы доверительного интервала доли. Сравнивая первый результат (1,0 % —11,6 %) со вторым (2 ,1 % —12,6 %), видим, что они не совпадают друг с другом.

Оценка разности между долями

Чтобы по разности между выборочными долями оценить ее достоверность в генеральной совокупности, необходимо эту раз­ ность отнести к ее ошибке и полученное значение сравнить с его критическим значением по критерию ССтьюдента или по крите­ рию ф Фишера.

Оценка по критерию Т-Стьюдента

Ошибка разности

выборочных

долей определяется

по сле­

дующей формуле:

 

 

 

 

 

_

1/ Рі(1 — Рі)

.

Р2(1 — р2)

(84)

ftldp'—

V

--------------- п

)

 

1

 

«2

 

Если же доли выражены в процентах от общего числа наблюде­ ний (л), формула 84 приобретает следующее выражение:

УР і (100 p i )

indp =

Пі

/?2 ( 1 0 0 — Pz)

(85)

пг

Приведенные формулы служат надежными оценками разности долей в генеральной совокупности, когда численности выбороч­ ных групп оказываются равновеликими или не очень сильно от­ личаются одна от другой. Если же сравниваемые группы весьма различны по своим объемам, ошибки разности, вычисляемые по этим формулам, могут оказаться неточными. В таких случаях более точные результаты получаются при использовании сле­ дующей формулы:

mdp = ^

pq (— + — ) =

(8 6 )

1

і

п2'

'

где П\ и «2 численности

выборок,

на которых определяются

доли р и q\ причем р определяется как средняя взвешенная из

р1 и р2 долей, т. е.

р і Щ +P z flz

Р = -------:------ . Яі -f- Пг

а q = 1—р или 9 = 1 0 0 р, если доли выражены в процентах. Так как средняя взвешенная из отношений частот сравни­

ваемых выборок равна

155

 

 

Ші

пі

 

 

т2

п%_

 

 

trii +

т2

 

 

 

 

 

 

Пі

X

 

 

п2

 

 

 

 

 

 

 

р =

 

 

Н------ X

 

 

 

Пі -f- п 2

 

 

 

 

 

 

 

 

 

Пі~{- П2

 

 

 

 

 

 

 

 

можно написать:

 

РіПі

-+j-

p2n2

Шіt l i

 

 

m2

 

 

 

 

(87)

 

 

 

 

 

 

 

 

 

 

 

 

 

П і

П 2

 

--fj-- n 2

 

 

 

 

 

В развернутом виде формула 86 выглядит так:

 

 

 

 

 

mdp =

-\! РіПі + р2п2!

 

pirn +

 

 

р2п2\

пх + п2

у

---------:-------

I

1 — -------- ;--------

) X

Пі

 

 

 

(8 6 a)

 

 

X «2

 

f

« t

- { - П 2

'

 

tuПі 4- f -

 

Пtl2о

/

 

 

 

 

 

Ші

p2

m 2

 

 

 

вариант,

 

имеющих данный приз-

где pi = —• и

------ доли

 

Пі

 

п2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

нак.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Если признак выражен в процентах, то

 

 

 

 

 

 

 

-]/

ріПі-\-р2П2(

 

РіПі +

 

Ріп2^

Пі

-(-

п2

тар =

 

 

 

 

100

 

+

 

 

 

 

 

( 866)

У ------- :------\

Пі

п2

 

 

 

X

 

1

«1 +

«2

'

 

 

 

Пі

п2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Например, при изучении влияния эндотоксина на выживаемость облученных животных были получены результаты, приведенные в табл. 46. Из этой таблицы видно, что смертность особей в опытной и контрольной группах весьма различна. Нужно оце­ нить достоверность полученного результата, т. е. разность меж­ ду числом особей, выживших в опыте и контроле. Можно оце­ нить эту разность по ее отношению к своей ошибке, рассчитан­ ной по формуле 84:

 

 

 

Т а б л и ц а 46

Группы животных

Выжило

Погибло

Всего

Контрольная . . . . . .

3(21,4% )

и (78,6%)

14

Опытная ............................

23 (63,9%)

13(36,1%)

36

И т о г о . . .

26

24

50

т 2

т і

П2

Пі

Р і { \ — Рі)

j М 1~ Рг)

Пі

п2

156

2 3 /3 6 -3 /1 4

1 / 3/14X0,786 23/36X0,361

'

14

^

36

_

0,639 — 0,214

 

0,425 _ д 1

У0 ,0 12 + 0,006 ~~ 0,134 ~

Но такая оценка будет неточной, так как численность контроль­ ной и опытной групп очень различна; сильно отличаются друг от друга и численности погибших и выживших животных в груп­ пах (р<25%). Поэтому выборочную ошибку разности между контролем и опытом следует вычислять в этом случае по более точной формуле 8 6 . Средняя взвешенная долей

3

=

 

 

23

= 0,639

 

 

 

Рі =

0,214 и р 2 = -

 

 

 

будет равна:

0,214 X 14 +

0,639X36

3 + 23

 

 

 

 

 

- 0,52.

 

 

р — ------ -------------------------

50

 

 

 

 

14 +

36

 

 

Находим ошибку разности:

 

 

 

 

 

mdp = У

05,2 X 0,48 ( і - +

= У0,025 =

0,157,

 

 

 

 

 

14 36-

 

 

 

откуда

t

0,425

= 2,71. По таблице

Стьюдента

(табл. V при-

0,157

 

 

 

 

 

 

 

ложений)

для

к = П]+п2—2 = 14+ 36—2 = 48 и

Р = 0,01 находим

tst = 2,58. Так

как

г“ф = 2,71>г% = 2,58,

нулевая

гипотеза отвер­

гается с высокой вероятностью (Р = 0,99); эффективное действие эндотоксина на выживаемость облученных животных нужно признать статистически достоверным.

Оценка по критерию Фишера

Разность между долями, когда они сильно отличаются друг от друга (р<2Ь%), можно с достаточной точностью оценить с

помощью критерия ф («фи»). При этом доли выражаются в про­ центах и с поправкой Йейтса на непрерывность, равной Ѵг и, которая вычитается из большей и прибавляется к меньшей до­ ле. Так, для рассматриваемого примера

Р і ( и с т ф . ) = рл + ^7= 2 1 , 4 + ^

=

= 21,4 + 0,036 = 21,436%

157

 

 

1

 

1

р2(испр.) =

р2% — 2пг =

63,9

2 X 3 6

=

63,9

0,014 =

63,886%.

По табл. XIII приложений

для

= 21,436 находим значение

фі = 0,962 и для р2= 63,886 значение ср2= 1,853. Разность ф2—фі =

= 1,853—0,962 = 0,891

можно

оценить

по ее отношению к

своей

ошибке, равной

 

УЗб + м = п т

 

 

 

ftldtp --

 

0,315 «0,32.

0,89

 

 

 

 

=

2,78. Этому значению

t отвечает вероят­

Именно: і ~

032

 

 

 

 

 

 

 

ность P( t ) =P ( 2,78) =0,995

(см. табл. I приложений). На

этом

основании можно утверждать, что

разница

между

опытом и

контролем статистически достоверна.

сравниваемыми

группами

Достоверность

разницы

между

можно оценить и с помощью критерия Фишера:

П1X «2

р ч>= (фі — ф г ) 2 X Пі + п2'

Если фактическая величина этого критерия превосходит его стандартное значение (/%), указанное в табл. VII приложений для взятого уровня значимости (Р) и чисел степеней свободы ki = 1 (берется по горизонтали таблицы) и &2= ni + n2— 2 (нахо­ дится в первом столбце той же таблицы), нулевая гипотеза от­ вергается, разница признается достоверной. В данном случае

14X36

504

 

 

Рф = (1,853 - 0,962)2 X 14 + 36 = ° ’7 9 3 9 Х 50

= 8,0.

 

По табл. VII приложений для &і = 1

и &2= 14+ 36—2 = 48 и

Р —

= 0,01 находим F st — 7,2. Так как / гф = 8,0>/% = 7,2,

нулевая

ги­

потеза отвергается; разница между опытом и контролем оказы­ вается статистически достоверной.

Разницу между сравниваемыми группами можно оценить и путем сопоставления доверительных интервалов, построенных с помощью критерия «фи». В данном случае эта задача решается

следующим образом. Мы уже знаем,

что

величине доли рі =

=21,4% отвечает значение фі = 0,962

и

р2= 63,9% — значение

ф2= 1,853. Находим максимальные ошибки критерия ср для уров­ ня значимости Д=0,05, которому соответствует /=1,96:

Ар, = 1,96 X -L = = 0,524 и Др2 =

1,96 X ~ = 0,325,

У14

У36

158

откуда границы доверительных интервалов будут следующие:

для

фі

нижняя

граница=0,962—0,524 = 0,468, или

5,4%

для

ф2

верхняя

граница = 0,962 + 0,524= 1,486,

или

45,8%

нижняя

граница = 1,852—0,325=1,528,

или

47,9%

 

 

верхняя

граница= 1,852+ 0,325=2,178,

или

78,5%

Итак, нашли доверительный интервал для р\ — от 5,4% до 45,8% и для р2— от 47,9% до 78,5%. Видно, что интервалы не накла­ дываются друг на друга. Следовательно, с вероятностью Р = 0,95 разница между опытом и контролем должна быть признана до­ стоверной.

Если взять более высокую вероятность Р = 0,99, которой со­ ответствует / = 2,58, то максимальные ошибки критерия ср ока­ жутся следующими: Ді = 0,689 и Д2= 0,430. Построенные по этим данным доверительные интервалы оказываются следующими: для р і — от 1,9 до 54,0% и для р2— от 42,6 до 82,7%. Верхний предел р 1 немного выше нижней границы р2. Однако трансгрес­ сия настолько мала (54,0—42,6=11,4%), что принять нулевую гипотезу нет оснований.

Оценка разности между выборочной и генеральной долями

Когда

известна доля признака в генеральной совокупности

I

А \

, то разница между генеральной и выборочной долями

уР =

- - J

(Рр)

оценивается отношением этой разности к ее ошибке, ко­

торая определяется по генеральной доле, т. е. по формуле

 

 

/л„ = У Я(1~ Р)- ,

(8 8 )

где Р — доля признака в генеральной совокупности;

п — общее

число наблюдений или объем выборки. Рассмотрим применение этой формулы на следующем примере. Изучалось влияние воз­ раста производителей на пол потомства у крупного рогатого ско­ та. Для спаривания с быками разного возраста подбирались коровы примерно одинакового возраста. Результаты трехлетних испытаний оказались следующие (табл. 47).

Т а б л и ц а 47

 

Родилось телят

 

 

Ошибка

Критерий

Возраст быков

 

В ТОМ

Доля

Разность

 

разности

достоверное-

в годах

всего

телок (/?)

(р — Р)

(та )

™ V

(от — до)

 

 

 

 

числе

 

 

 

 

 

 

телок

 

 

 

 

2 - 3

141

77

0,55

0,05

0,043

1,2

4 - 5

89

43

0,48

0,02

0,053

0,4

6 - 7

88

41

0,46

0,04

0,053

0,8

> 7

118

49

0,41

0,09

0,046

2,0

159