Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
теория статистики.doc
Скачиваний:
165
Добавлен:
23.03.2015
Размер:
2.64 Mб
Скачать

4. Выборочное наблюдение

    1. Понятие о выборочном наблюдении

Выборочное наблюдение представляет собой один из наиболее широко применяемых видов сплошного наблюдения.

Выборочное наблюдение – это метод статистического исследования, при котором характеристика всей совокупности фактов (генеральной совокупности) дается по некоторой ее части (выборочной совокупности) (см. рис.4 )

В последние годы выборочное наблюдение широко применяется в работе органов статистики, так как это позволяет:

– сэкономить затраты средств и труда на обработку информации;

– сократить ошибки регистрации на этапе сбора данных;

– повысить оперативность получения сведений.

В отличие от других методов несплошного наблюдения (монографического наблюдения, метода основного массива) выборочное наблюдения имеет важную особенность – возможность попадания в выборочную совокупность равна для всех единиц генеральной совокупности.

Это предупреждает появление тенденциозных ошибок при формировании выборки.

    1. Виды выборочного наблюдения

Рис. 9. Классификация выборочного наблюдения

В зависимости от способа отбора единиц различают:

– повторную выборку – после отбора, какой-то единицы, она снова возвращается в совокупность и может быть снова набрана, т.е. вероятность попадания каждой отдельной единицы в выборочную совокупность остается постоянной;

– бесповторную выборку – отобранная единица не возвращается обратно и возможность попадания у оставшихся единиц в выборочную совокупность постоянно возрастает.

По форме организации способа отбора выборочное наблюдение может быть:

– случайным – случайный отбор;

– механическим – отбор единиц в выборочную совокупность из генеральной производится через равные интервалы (группы);

– типическим – в выборочной совокупности более равномерно представлены различные типы (части) генеральной совокупности;

– серийным – отбираются серии единиц, которые подвергаются сплошному исследованию;

– комбинированным – комбинация нескольких форм организации выборочного наблюдения.

    1. Ошибки выборочного наблюдения

Между характеристиками выборочной и генеральной совокупности, как правило, существует расхождение, которое называется ошибкой.

Ошибки выборочного наблюдения могут быть двух видов:

– ошибки регистрации – свойственны любому наблюдению, вызваны несовершенством измерительных приборов, недостаточной квалификацией работников и т.п.;

– ошибки репрезентативности (представительности) присущи только несплошным наблюдениям, возникают из-за того, что выборочная совокупность не точно характеризует генеральную.

Ошибка выборки зависит от следующих факторов:

– степени вариации изучаемого признака;

– численности выборки;

– метода отбора единиц в выборочную совокупность;

– принятого уровня достоверности результатов исследования.

В математической статистике доказывается, что значение средней ошибки повторной выборки равно:

1. средняя  

2. среднее квадратическое отклонение выборочное или генеральное 

где µ − ошибка выборки; δ2 − дисперсия (средний квадрат отклонений); n − объем выборки (число обследованных единиц).

При бесповторном отборе формула средней ошибки выборки принимает вид:

,

где N – объем генеральной совокупности.

Предельная ошибка выборки , гдеt – коэффициент доверия. Определяется по справочным таблицам в зависимости от уровня вероятности.

В целом ряде случаев средние и относительные величины для какой-либо совокупности рассчитываются на основе данных выборочного наблюдения, суть которого заключается в том, что из генеральной совокупности, наудачу, чисто случайно, отбирается n единиц, составляющих выборочную совокупность; для отобранных единиц рассчитываются обобщенные характеристики (средние или относительные показатели), а затем результаты выборочного обследования распространяются на всю генеральную совокупность. Основной задачей при этом является определение ошибок выборки, т.е. возможных расхождений между выборочной средней () и генеральной () или выборочной долей единиц (w), обладающих изучаемым признаком, и генеральной долей (p).

Различают среднюю и предельную ошибки выборки.

Средняя ошибка выборки (µ) характеризует среднюю величину возможных расхождений выборочной и генеральной средней (или доли) и представляет собой по форме и содержанию среднее квадратическое отклонение возможных значений выборочной средней от генеральной.

В математической статистике доказывается, что - дисперсия возможных значений выборочной средней – вn раз меньше дисперсии изучаемого признака и генеральной совокупности, т.е. .

Исходя из этого средняя ошибка выборочной средней при повторном отборе определяется по формуле:

,

где - дисперсия изучаемого показателя в генеральной совокупности (т.к. дисперсия изучаемого показателя в генеральной совокупности неизвестна, то фактически в формулу подставляется дисперсия выборочная, которая при большом числе наблюдений близка к генеральной), аn – объем (численность) выборки.

Как видно из формулы, средняя ошибка выборки (µ) при повторном отборе зависит от показателя вариации () и от объема выборки (n).

Средняя ошибка выборочной доли определяется по формуле:

,

где w – выборочная доля единиц, обладающих изучаемым признаком, а w(1 − w) – дисперсия доли (альтернативного признака).

При бесповторном отборе в формулах под знаком радикала появляется множитель ,

где N –численность генеральной совокупности.

Говоря об ошибках выборки, следует иметь в виду, что в каждой конкретной выборке разность может быть меньше, больше или равнаµ. И вероятность каждой такой ошибки различна.

Отклонение выборочной характеристики от генеральной называется предельной ошибкой выборки.

Предельная ошибка выборки, обозначаемая через , рассчитывается как

,

где µ − средняя ошибка выборки, t – коэффициент доверия.

При бесповторной выборке формула ошибки выборки имеет вид:

,

где δ2 – межсерийная дисперсия; s – число отобранных серий;S число серий в генеральной совокупности.

Все рассмотренные выше формулы используются при так называемой большой выборке.

Если n < 20 (у некоторых авторов n <30), то выборка именуется малой и при расчете ошибок выборки необходимо учитывать следующие моменты. Во-первых, в формуле средней ошибки в знаменателе принимается n – 1, т.е.

.

И, во-вторых, при нахождении вероятности допуска той или иной ошибки или определении доверительных интервалов исследуемого показателя в генеральной совокупности пользуются таблицами вероятность Стьюдента, где определяется в зависимости от объема выборки иt.

Формулы предельной ошибки выборки позволяют решить следующие три задачи:

1. Определить доверительные пределы.

для генеральной средней:

;

для доли:

.

2. Определить вероятность допуска той или иной заданной ошибки .

В этом случае определяется и по таблице (приn>20) находится вероятность (P).

3. Определить необходимую численность выборки (n), обеспечивающую с определенной вероятностью заданную точность ().

Формулы для n определяются из соответствующих формул предельной ошибки.

Так, для определения средней () из формулыприповторном отборе имеем:

,

Для доли аналогично из получаем:

.

При бесповторном отборе из иимеем:

−для средней ();

−для доля (w).

Как видно, в формулах для определения необходимой численности выборки, получаемых из формул случайной ошибки выборки, предполагается обязательное знание величины дисперсии признака () или [w (1w)].

Обычно в этих формулах используется значение дисперсии признака в аналогичных предшествующих исследованиях или же проводится пробное обследование небольшого числа единиц, для которых определяется значение . В случае изучения доли определенных единиц в совокупности при отсутствии каких-либо сведений о дисперсии принимается максимальное значение [w (1w)], равное 0,25.

Рассмотрим решение некоторых задач к этой теме с применением формул предельной ошибки выборки.

Задача 1.

Методом собственно случайной выборки обследована жирность молока у 100 коров. По данным выборки средняя жирность молока оказалась равной 3,64%, а дисперсия составила 2,56.

Определить: а) среднюю ошибку выборки; б) с вероятностью, равной 0,954, предельные значения генеральной средней.

Решение:

A. Формула средней ошибки выборки: .

По условию n = 100, =2,56. Отсюда

Б. Формула предельной ошибки выборки: .

По таблице значений F(t) при P = 0,954 находим, что t = 2. Отсюда , или, т.е. предельные значения жирности молока (или доверительный интервал генеральной средней) определяются как.

Задача 2.

На основе выборочного обследования 600 рабочих (n = 600) одной из отраслей промышленности установлено, что удельный вес численности женщин составил 0,4 (w = 0,4).

С какой вероятностью можно утверждать, что при определении доли женщин, занятых в отрасли, допущена ошибка (), не превышающая 5% (0,05)?

Решение:

Чтобы определить вероятность допуска той или иной ошибки, из формулы находим показательt, связанный с вероятностью:

По таблице значений F(t) для t=2,5 находим, что P=0,988, т.е. с вероятностью 0,988 можно утверждать, что при определении доли женщин (0,4) в общем числе рабочих допущена ошибка не более 0,05 (5%).

Задача 3.

Сколько рабочих завода нужно обследовать в порядке случайной выборки для определения средней заработной платы, чтобы с вероятностью (P),равной 0,954, можно было бы гарантировать ошибку не более 50 руб.? Предполагаемое среднее квадратическое отклонение заработной платы =200 руб.

Решение.

Из формулы находимn:

(человека).

Контрольные вопросы к теме:

1. Дайте определение выборочного наблюдения. Для чего в экономике применяют выборочное наблюдение.

2. Перечислите и охарактеризуйте виды выборочного наблюдения.

3. Расскажите об ошибках выборочного наблюдения, от каких факторов они зависят.

4. Расскажите о предельной ошибке выборки, какие задачи позволяют решить формулы предельной ошибки выборки.