Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции (Статистика).doc
Скачиваний:
30
Добавлен:
07.05.2019
Размер:
1.66 Mб
Скачать

8.4.4. Оценка параметров генеральной совокупности по малым выборкам

На практике зачастую в ходе выборочного исследования нецелесообразно или нет возможности использовать выборки повышенного объема, что связано с утерей в ходе обследования изучаемых свойств единицами наблюдения. К примеру, исследуется прочность изделия, средняя продолжительность его эксплуатации и т.д. В данных случаях целесообразно использование выборок небольшого объема – малых выборок.

В статистике выборка считается малой, если ее объем n < 20÷30. Использование малых выборок при выборочном наблюдении имеет следующие особенности:

  1. необоснованным становится вывод о нормальном законе распределения выборочных средней и доли w, так как он основан на центральной предельной теореме при больших значениях n 10;

  2. необоснованной становится замена неизвестных генеральной дисперсии σ2 и доли р их точечными оценками соответственно s2 и w, так как в силу состоятельности данных оценок эта замена возможна лишь при больших n.

В случае малых выборок оценка генеральной средней и доли осуществляется следующим образом.

1. Оценка генеральной средней.

В теории математической статистики доказано, что по данным выборки можно построить случайную величину

,

которая имеет распределение Стьюдента с степенями свободы. Функция плотности распределения Стьюдента имеет следующий вид:

,

где ; - гамма-функция;

t – возможные реализации случайной величины T; n – объем выборки.

Тогда доверительную вероятность (и доверительный интервал соответственно), т.е. вероятность попадания оцениваемой величины в заданный интервал можно определить на основе функции распределения Стьюдента11:

,

2. Оценка генеральной доли (вероятности биномиального распределения).

Границы p1 и p2 доверительного интервала для генеральной доли (для случая повторного отбора) можно определить по следующим формулам:

.

В случае больших выборок, при , в вышеприведенной формуле величинами (по сравнению с 1), (по сравнению w) и (по сравнению с ) можно пренебречь, в результате чего данную формулу можно упростить следующим образом:

.

8.5. Определение необходимой численности выборки

При разработке программы выборочного обследования одним из наиболее сложных является вопрос об объеме выборки.

Анализируя формулу предельной ошибки выборки, можно отметить, что при любом способе отбора предельная ошибка выборки обратно пропорциональна числу обследованных единиц. Таким образом, с увеличением объема выборки, уменьшается погрешность результатов выборочного обследования (при прочих равных условиях), однако при этом необходимо учитывать, что возрастут и затраты на проведение обследования.

Определение необходимой численности выборки осуществляется на основе формулы предельной ошибки выборки, к примеру, для собственно-случайной повторной выборки ее численность может быть определена следующим образом:

.

Аналогичным образом определяются формулы для расчета объема различных видов выборок при различных способах отбора (таблица 3).

Таблица 11

Формулы расчета численности выборки

Тип выборки

Оцениваемый параметр

Повторный отбор

Бесповторный или механический отбор

1.

Собственно-случайная и механическая выборки

p

2.

Типическая (стратифицированная) выборка

p

3.

Серийная (гнездовая) выборка

p

Для определения необходимой численности выборки должны быть заданы предельная ее ошибка, вероятность того, что эта ошибка не превысит заданного предела, а также иметься информация о дисперсии изучаемого признака в генеральной совокупности.

В практике исследований величина предельной ошибки выборки, как правило, устанавливается не в абсолютном, а в относительном выражении:

,

,

причем ее величина для обеспечения репрезентативности выборки, как правило, не должна превышать 5%.

Тогда абсолютная величина предельной ошибки выборки может быть определена по следующим формулам:

,

.

Зачастую в практике исследований имеют место случаи, когда на этапе разработки программы выборочного обследования нет точной информации о вариации изучаемого признака. В таких случаях (т.е. до проведения обследования) приближенно оценить дисперсию или среднее квадратическое отклонение можно следующим образом:

  • исходя из результатов специально организованного пробного обследования;

  • опираясь на данные предыдущих обследований, как выборочных, так и сплошных. К примеру, если из предыдущих исследований имеется информация о коэффициенте вариации (V), то дисперсия может быть определена следующим образом:

;

  • исходя из закона распределения изучаемого признака в генеральной совокупности, к примеру, если распределение изучаемого признака близко к нормальному, то среднее квадратическое отклонение в 6 раз меньше размаха вариации.

Если дисперсия доли единиц генеральной совокупности, обладающих определенным значением альтернативного признака, неизвестна, то при определении объема выборки можно использовать максимальное ее значение 0,25 (при p=q=0,5). Однако в данном случае объем выборки существенно возрастет, что приведет к значительному увеличению трудоемкости выборочного обследования.

Уровень надежности результатов выборочного обследования или вероятность того, что предельная ошибка не превысит заданного предела, задается, как правило, равной 0,95 и выше, что обуславливается необходимостью обеспечения практической ценности результатов выборочного обследования.