Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Статистика предприятия Часть I курс лекций.docx
Скачиваний:
343
Добавлен:
09.04.2015
Размер:
732.65 Кб
Скачать

9 Выборочное наблюдение

9.1 Общее понятие о выборочном методе и причины его использования

1. Выборочное наблюдение – это один из видов несплошного наблюдения, когда исследованию подвергается какая-то часть совокупности; показатели, характеризующие эту отобранную часть, распространяются на всю совокупность.

Вся исследуемая совокупность называется генеральной, а отобранная часть – выборочной (выборной).

Выборочное наблюдение отличается от других видов несплошного наблюдения следующим:

– заранее должно быть установлено, какая часть генеральной совокупности будет подвергаться исследованию;

– заранее устанавливается вид или способ отбора.

Причины использования выборочного метода:

– экономия времени и средств;

– сведение к минимуму порчи или уничтожения исследуемых объектов;

– выборочный метод уменьшает ошибки регистрации.

Однако при выборочном методе возникают ошибки репрезентативности (представительности) – это разность между показателями выборочной и генеральной совокупности. Эти ошибки могут возникать только при несплошном наблюдении. Однако при правильной организации выборочного наблюдения эти ошибки можно свести к минимуму, и выборочное наблюдение может стать более точным, чем сплошное.

9.2 Способы отбора

Существуют различные виды (способы) отбора единиц в целях образования выборки.

Выборку можно проводить путем последовательного отбора отдельных единиц (это индивидуальный отбор) или путем отбора групп или серий единиц (это серийный отбор).

Индивидуальный и серийный отборы могут быть организованы в виде повторной и бесповторной выборки.

Бесповторная выборка – это такая выборка, когда отобранная группа единиц после обследования назад не возвращается.

Повторная выборка применяется только тогда, когда бесповторная выборка невозможна.

Индивидуальный и серийный отборы могут быть организованы в виде собственно-случайной выборки, механического и типического отбора

Введем следующие обозначения.

Для генеральной совокупности:

– генеральная средняя,

р – генеральная доля,

– генеральная дисперсия,

N – число единиц генеральной совокупности.

Для выборочной совокупности:

– выборочная средняя,

ω – выборочная доля,

– выборочная дисперсия,

n – число единиц выборочной совокупности.

9.2.1 Собственно случайная выборка

Собственно-случайная выборка – это такая выборка, при которой отбор единиц и групп единиц для обследования производится в случайном порядке. Часто для таких целей применяется жеребьевка. При этом количество отобранных в выборочную совокупность единиц обычно определяется исходя из принятой доли выборки.

Доля выборки - это отношение числа единиц выборочной совокупности к числу единиц генеральной совокупности:

Кв=n/N,

где Кв – доля выборки.

Если объем генеральной совокупности равен 1000 единиц, Кв=0,01, то

единиц.

При собственно-случайной выборке выборочная средняя и выборочная доля могут принимать различные значения в зависимости от исхода выборки.

Но все эти значения будут колебаться около генеральной средней или генеральной доли. Возможные расхождения между характеристиками выборочной и генеральной совокупности определяются средней ошибкой выборки.

В математической статистике доказывается, что значения средней ошибки выборки вычисляются по формуле:

–для средней,

–для доли.

Эти формулы справедливы для повторного отбора.

Для бесповторного отбора формулы принимают вид:

–для средней,

–для доли.

Средняя ошибка выборки прямо пропорциональна среднему квадратическому отклонению. Поэтому, чем больше колеблемость признака генеральной совокупности, тем больше ошибка (и наоборот). В то же время средняя ошибка обратно пропорциональна корню квадратному из объема выборки. Следовательно, чем больше объем выборки, тем ошибка меньше. Т.к. (1-n/N)<1, то ошибка при бесповторном отборе меньше, чем при повторном.

Если n намного меньше, чем N, то (1-n/N) →1,тогда при бесповторном отборе мы можем использовать формулы повторного отбора.

Средняя ошибка выборки характеризует меру отклонения выборочной средней или выборочной доли от генеральной средней или генеральной доли. При этом в математической статистике доказывается, что с некоторой вероятностью можно утверждать, что эти отклонения не превысят некоторой величины, которую можно назвать предельной ошибкой выборки.

Вычисляется она по формуле

,

где t – коэффициент доверия, который зависит от вероятности, с которой можно гарантировать, что предельная ошибка выборки не превысит t-кратную среднюю ошибку.

По теореме Чебышева можно утверждать, что при достаточно большом объеме выборки и ограниченной генеральной дисперсии выборочные показатели будут сколь угодно мало отличаться от соответствующих генеральных показателей.

Применительно к среднему значению теорема Чебышева выглядит следующим образом:

.

Следовательно,

.

Это неравенство выражает собой пределы, в которых будет заключена генеральная средняя. Рассуждая аналогично, мы получим пределы генеральной доли p:

.

Пример 1 При проверке веса поставляемого груза методом случайной повторной выборки было отобрано 350 изделий. В результате был установлен средний вес изделия – 120 г при среднем квадратическом отклонении 9 г. С вероятностью 0,997 определите пределы, в которых находится средний вес изделий в генеральной совокупности.

Решение

1 Рассчитаем предельную ошибку выборки () по формуле

,

где – коэффициент доверия, который зависит от вероятности, с которой можно гарантировать, что предельная ошибка выборки не превыситt-кратную среднюю ошибку (при вероятности 0,997);

–средняя ошибка выборки.

Среднюю ошибку выборки рассчитаем по формуле

,

где – среднее квадратическое отклонение;

–объем выборочной совокупности.

Таким образом

2 Определим пределы генеральной средней

,

где – среднее значение признака в генеральной совокупности;

–среднее значение признака в выборочной совокупности.

Для нашего примера

Следовательно, с вероятностью 0,997 можно утверждать, что средний вес изделий в генеральной совокупности находится в пределах от 118,557 г до 121,443 г.

Пример 2 В городе проживают 250 тыс. семей. Для определения среднего числа детей в семье была организована 2%-я случайная бесповторная выборка семей. По ее результатам было получено следующее распределение семей по числу детей (таблица 1).

Таблица 1 – Состав семей по количеству детей

Число детей в семье

0

1

2

3

4

5

Количество семей

1000

2000

1200

400

200

200

С вероятностью 0,954 найти пределы, в которых будет находиться среднее число детей в генеральной совокупности.

Решение

На основании имеющегося распределения семей определим выборочную среднюю и дисперсию

чел.

Предельную ошибку выборки определим по формуле

,

где – коэффициент доверия, который зависит от вероятности, с которой можно гарантировать, что предельная ошибка выборки не превыситt-кратную среднюю ошибку (при вероятности 0,954);

–средняя ошибка выборки.

Среднюю ошибку выборки для бесповторного отбора определим по формуле

,

где – дисперсия;

–объем выборочной совокупности;

–объем генеральной совокупности;

–доля выборки.

Таким образом

Определим пределы генеральной средней

Следовательно, с вероятностью 0,954 можно утверждать, что среднее число детей в семьях города практически не отличается от 1,5, т. е. в среднем на каждые две семьи приходится 3 ребенка.

Определение оптимального объема выборки:

1. Необходимая численность выборки при повторном отборе при расчете средней величины количественного признака:

;

для расчета численности выборки при выборочном обследовании доли альтернативного признака применяют формулу

.

2 Для бесповторного отбора:

–для средней величины количественного признака,

–для доли альтернативного признака.

Пример 3 Определите, сколько пассажиров одного автобусного маршрута необходимо обследовать, чтобы при средней дальности поездки, составившей 4,5 км и среднем квадратическом отклонении, равном 1,5 км, предельная ошибка выборки не превысила 0,1 км. Ответ дайте с вероятностью 0,954.

Объем выборочной совокупности определим по вышеприведенной формуле

Пример. Определите, сколько рабочих необходимо обследовать, чтобы при доле рабочих, выполняющих нормы выработки, равной 90 %, ошибка выборки при вероятности 0,997 не превысила 2 %.

Необходимая численность выборки составит