
- •3.4. Подготовка статистического наблюдения
- •Формулы средних квадратических ошибок для разных видов выборки
- •1. Формулы средних квадратических ошибок простой случайной выборки представлены в табл. 8.1.
- •Формулы стандартных простой случайной ошибок выборки
- •2. Формулы стандартных ошибок типической выборки зависят от способа размещения единиц по типическим группам (табл. 8.2 и 8.3).
- •3. Формулы стандартных ошибок серийной выборки при равновеликих сериях приведены в табл. 8.4.
- •Определение необходимой численности выборки
Определение необходимой численности выборки
При проектировании выборочного наблюдения решается задача нахождения необходимой численности выборки, обеспечивающей определенную точность расчета оценок генеральных параметров.
Обычно на практике расчет объема выборки производят по формуле для повторного отбора:
Если полученный объем выборки превышает 5% численности генеральной совокупности, расчеты корректируют «на бесповторность»:
Если доля отбора не превышает 5%, к формуле бесповторного отбора можно не переходить, так как это существенно не скажется на величине n.
При решении задачи определения объема выборки величина допустимой предельной ошибки и уровень вероятности, гарантирующей точность оценок будущей выборки, задаются исследователем. Величина генеральной дисперсии, как правило, неизвестна. Для ее оценки можно использовать
1) выборочную дисперсию по данным прошлых или пробных обследований;
2) дисперсию, найденную из соотношения для среднего квадратического отклонения:
,
3) дисперсию, определенную из соотношения для асимметричного распределения:
4) дисперсию, вычисленную из соотношения для нормального распределения:
В качестве оценки генеральной дисперсии доли используют максимально возможную дисперсию альтернативного признака:
=
=0,25.
Пример. Определить численность выборки по следующим данным.
Для определения средней цены говядины на рынках города предполагается произвести выборочную регистрацию цен. Известно, что цены на говядину колеблются от 90 до 120 руб. за 1 кг. Реализация мяса осуществляется в 5000 торговых точках. Сколько торговых точек необходимо обследовать, чтобы с вероятностью 0.954 ошибка выборки при определении средней цены не превышала 2 руб. за 1 кг?
Предположим, что распределение цен соответствует нормальному распределению. Тогда
Вероятности 0,954 соответствует значение z=2. Осуществим расчет численности выборки по формуле для повторного отбора:
торговых точек
Поскольку доля отбора не превышает 5% (25:5000=0,005, или 0,5%), к формуле бесповторного отбора можно не переходить.
Таким образом, для того чтобы с вероятностью 0,954 гарантировать, что ошибка при определении средней цены говядины не превысит 2 руб. за 1 кг, необходимо обследовать 25 торговых точек на рынках города.
Иногда на практике задается не абсолютная величина предельной ошибки выборки, а ее относительный уровень - отношение предельной ошибки выборки к среднему значению признака, выраженное в процентах. Эта величина называется относительной ошибкой выборки и характеризует относительную погрешность выборочного наблюдения:
Расчет объема выборки при заданном уровне относительной ошибки выборки осуществляется по формулам:
где ν — коэффициент вариации;
100%.
Пример.
В городе зарегистрировано 30 тыс. безработных. Для определения средней продолжительности безработицы организуется выборочное обследование. По данным прошлых лет известно, что коэффициент вариации продолжительности безработицы составляет 40%. Какое число безработных необходимо охватить выборочным наблюдением, чтобы с вероятностью 0,997 утверждать, что полученная предельная ошибка выборки не превышает 5% средней продолжительности безработицы?
Доверительной вероятности 0,997 соответствует коэффициент доверия z = 3.
Расчет численности осуществляется по формуле для бесповторного отбора
человек.
Таким образом, для того чтобы с вероятностью 0,997 утверждать, что полученная ошибка выборки не превышает 5 % средней продолжительности безработицы, необходимо охватить выборочным наблюдением 566 рабочих.