Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
«статистика» (1).doc
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
978.95 Кб
Скачать

2.6. Определение ошибок выборки*

По мере отбора единиц в выборочную совокупность или по его завершении производится регистрация предусмотренных программой признаков. Итогом же является расчет обобщающих выборочных характеристик. Часто кроме выборочной средней (X) исчисляют также выборочную долю (W) единиц, обладающих каким-либо интересующим нас признаком, в общей их численности.

Разность между показателями выборочной и генеральной совокупности называется ошибкой выборки. Ошибки выборки подразделяются на ошибки регистрации и ошибки репре­зентативности.

Ошибки регистрации возникают из-за неправильных или неточных сведений. Источниками таких ошибок могут быть непонимание существа вопроса, невнимательность регистратора, пропуск или повторный счет некоторых единиц совокупности, описки при заполнении формуляров и т. д.

Среди ошибок регистрации выделяются систематические, обусловленные причинами, действующими в каком-то одном направлении и искажающими результаты работы (например, округление цифр, тяготение к полным пятеркам, десяткам, сотням и т. д.), и случайные, проявляющиеся в различных направлениях, уравновешивающие друг друга и лишь изредка дающие заметный суммарный итог.

Ошибки репрезентативности также могут быть системати­ческими и случайными. Систематические ошибки репрезента­тивности возникают из-за неправильного, тенденциозного отбора единиц, при котором нарушается основной принцип научно организованной выборки — принцип случайности. Случайные ошибки репрезентативности означают, что, несмотря на принцип случайности отбора единиц, все же имеются расхождения между

* Содержание разделов 2.6, 2.7 рекомендуется изучать после ознакомления с материалом гл 4 («Статистические величины»).

22

характеристиками выборочной и генеральной совокупности. Изучение и измерение случайных ошибок репрезентативности и является основной задачей выборочного метода, о

Рассмотрим на примере, насколько отличаются выборочные и генеральные показатели по данным об успеваемости студентов (две 10 %-е выборки):

Чи

ело студентов, ч

ел.

Оценка

Генеральная совокупность

Первая выборка

Вторая выборка

2 3 4 5

100 300 520 80

9 27 54 10

12 29 52

7

Итого

1000

100

100

Средний балл рассчитаем по средней арифметической взвешенной.

По генеральной совокупности

100 • 2 + 300 • 3 + 520 • 4 + 80 • 5

X = —————————————————————————— = 3,58;

1000 X, = 3,65;

по первой выборке

X, = 3,65;

по второй выборке

X, = 3,54. Доля студентов, получивших оценки «4» и «5»:

по генеральной совокупности

520 + 80

р = ———————— = 0,6, или 60 %;

1000

по первой выборке

W, = 0,64, или 64 %;

по второй выборке

W;, = 0,59, или 59 %.

Разность между показателями выборочной и генеральной совокупности и будет случайной ошибкой репрезентативности. Ошибки репрезентативности:

X, -Х= 3,65-3,58 =+0,07;

X;, - X = 3,54 - 3,58 = - 0,04;

W, - р = 0,64 - 0,6 = + 0,04;

W^-p= 0,59 - 0,6 = - 0,01.

23

Как видно из расчетов, выборочная средняя и выборочная доля являются случайными величинами, которые могут принимать различные значения в зависимости от того, какие единицы совокупности попали в выборку. Следовательно, ошибки выборки также являются случайными величинами и могут принимать различные значения. Поэтому определяют среднюю из возможных

ошибок (обозначим ее через Ц). Средняя ошибка выборки равна среднему квадратическому отклонению, деленному на квадратный корень из численности выборки:

для средней Ц„

для доли Ц^

"X /^

\[^~ \/ П

/ Р(1 -Р)

V——

В этих формулах (7^ и р(1 - р) являются характеристиками генеральной совокупности, которые при выборочном наблюдении неизвестны. На практике их заменяют аналогичными характе­ристиками выборочной совокупности на основании закона больших чисел, по которому выборочная совокупность при достаточно большом объеме достаточно точно воспроизводит характеристики генеральной совокупности. Следовательно, средние ошибки выборки можно представить следующим образом: ____

г^ ^= v —•

П

/W(1 -W)

^= ———•

п

/oi

При бесповторном отборе подкоренное выражение умножается на величину (1 - n / N), которая всегда меньше единицы, поэтому величина средней ошибки выборки при бесповторном отборе оказывается меньше, чем при повторном. В тех случаях, когда доля выборки незначительна и множитель (1 - n / N) близок к единице, поправкой можно пренебречь. Для решения практических задач кроме средней пользуются предельной ошибкой выборки, которая связана с гарантирующим ее уровнем вероятности. Уровень вероятности определяет величина нормированного отклонения t, и наоборот. Значения t даются в таблицах нормального распределения вероятностей.

24

Чаще всего используют следующие сочетания:

t Р

1,0 0,683

1,5 0,866

2,0 0,954

2,5 0,988

3,0 0,997

3,5 0,999

Так, если t =1, то с вероятностью 0,683 можно утверждать, что разность между выборочными и генеральными показателями не превысит одной средней ошибки. Предельные ошибки выборки (А) определяются по формулам табл. 2.1.

Таблица 2.1

Предельные ошибки выборки

Метод

Предельные ошибки

индивидуального отбора

отбора

для средней

для доли

.———— / °2

/ W(1 -W)

Повторный

A=t!/

\/ n

A=t!/ / n

д2 n A-t,/—(l-—)

/W(1 -W) n

Д-t,/————(1-—)

Бесповторный

т

Ч п N

Ч n N

После исчисления предельных ошибок выборки находят доверительные интервалы для генеральных показателей. Для Х это (X ± А,). Для Р это (W ± AJ.

Из формул табл. 2.1 видно, что величина Л зависит от:

1) колеблемости признака (прямая связь); 2) численности выборки (обратная связь); 3) доверительной вероятности (прямая связь);

4) метода отбора.

Формулы, приведенные в табл. 2.1, используются при определении ошибок выборки, осуществляемой собственно случайным или механическим методами.

При стратифицированном отборе в выборку обязательно попадают представители всех групп и обычно в тех же пропорциях, что и в генеральной совокупности. Поэтому ошибка выборки в данном случае зависит главным образом от средней из групповых

дисперсий (82). По правилу сложения дисперсий О2^ + 52 = <72. Отсюда следует, что ошибка выборки для стратифицированного отбора всегда будет меньше, чем для собственно случайного.

25

При серийном (гнездовом) отборе мерой колеблемости будет межгрупповая дисперсия (СТ^гр)-