Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методичка 2 курс / статистика / Статистика.общая теория статистики.doc
Скачиваний:
229
Добавлен:
20.04.2015
Размер:
2.22 Mб
Скачать
    1. 5.2. Ошибки выборки

Любое выборочное наблюдение, как бы грамотно оно ни было организовано, всегда связано с определенными ошибками, которые делятся на два класса:

а) ошибки регистрации являются следствием неправильного установления значения наблюдаемого признака или неправильной записи, они характерны для всех видов наблюдения;

б) ошибки репрезентативности обусловлены тем, что выборочная совокупность не может в точности воспроизвести генеральную совокупность. При этом следует различать:

  • систематические ошибки репрезентативности – преднамеренные, связанные с нарушением принципов формирования выборочной совокупности. Например, в выборку попали единицы, характеризующиеся большими (меньшими) по сравнению с другими единицами значениями наблюдаемых признаков. В этом случае и рассчитанные выборочные характеристики будут завышенными (заниженными).

  • случайные – обусловлены действием случайных факторов.

Статистически можно оценить только случайные ошибки репрезентативности. Для этого с определенной степенью вероятности определяют величину предельной ошибки, с которой результаты выборочного обследования могут быть распространены на всю генеральную совокупность.

В зависимости от исходных данных и способа отбора единиц в выборку, величина предельной ошибки определяется по формулам, приведенным в таблице 5.1.

Таблица 5.1

Метод отбора

Вид выборки

Повторный

Бесповторный

для среднего значения

для доли

для среднего значения

для доли

Собственно-случайная и механическая

Типическая

Серийная

Основные обозначения:

выборочная средняя;

w – выборочная доля  определяется отношением числа единиц, обладающих изучаемым признаком m, к общему числу единиц в выборке n: ;

n – число единиц в выборочной совокупности;

N – число единиц в генеральной совокупности;

r – число отобранных серий;

R – общее число серий;

t – величина нормированного отклонения, значение которого соответствует определенному уровню вероятности p (табл. 5.2).

Таблица 5.2

Распределение вероятности в выборках в зависимости от величины t и объема выборки n

n

t

4

5

6

7

8

9

10

15

20

0.5

0.348

0.356

0.362

0.366

0.368

0.370

0.372

0.376

0.378

0.383

1.0

0.608

0.626

0.636

0.644

0.650

0.654

0.656

0.666

0.670

0.683

1.5

0.770

0.792

0.806

0.816

0.832

0.828

0.832

0.846

0.850

0.865

2.0

0.860

0.884

0.908

0.908

0.914

0.920

0.924

0.936

0.940

0.954

2.5

0.933

0.946

0.955

0.959

0.963

0.966

0.968

0.975

0.978

0.988

3.0

0.942

0.960

0.970

0.976

0.980

0.938

0.984

0.992

0.992

0.997

Примечание

При оценке результатов малой выборки (численность которой не превышает 30 единиц), величина генеральной дисперсии в расчетах не используется. Величина и предельная ошибка малой выборки вычисляются на основе данных выборочного наблюдения:

и ,

где  мера случайных колебаний выборочной средней в малой выборке, а .

На заключительном этапе на основе предельной ошибки выборки определяют доверительные интервалы, в которых может находиться генеральная средняя или генеральная доля. Выход за пределы этой области имеет весьма малую вероятность. Доверительные интервалы определяются по формулам:

  • для среднего значения: ;

  • для доли: .