- •Выборочное наблюдение
- •1. Общая характеристика выборочного наблюдения
- •Основные этапы выборочного наблюдения:
- •2. Ошибки выборки при собственно случайном отборе Виды случайного отбора
- •Ошибки выборки при случайном повторном отборе
- •Ошибки выборки при случайном бесповторном отборе
- •3. Основные способы формирования выборочной совокупности
- •4. Определение необходимой численности выборки
- •5. Малая выборка
- •6. Распространение результатов выборочного наблюдения на генеральную совокупность
- •7. Общие понятия и схема статистической проверки гипотез
- •8. Проверка гипотез о средней и о доле Гипотезы о средней
- •Гипотезы о доле
- •9. Практика применения выборочного метода наблюдения
- •Список использованной литературы
Ошибки выборки при случайном бесповторном отборе
Приведенные ранее формулы средней ошибки выборки справедливы только при повторном отборе. Однако на практике чаще используется бесповторный отбор: обследованная единица не возвращается в генеральную совокупность и не может быть обследована повторно. При этом принцип независимости испытаний нарушается. Очевидно, что при бесповторном отборе из четырех студентов двоих (см. табл. 2.1) средний возраст студентов I курса не может быть равен 16 и 18 годам. Следовательно, средняя ошибка выборки будет меньше.
Средняя ошибка выборки при собственно случайном бесповторном отборе рассчитывается по формуле:
.
(2.5)
При больших значениях N величину (N – 1) в формуле (5.1) можно заменить на N, тогда упрощенная формула средней ошибки выборки запишется следующим образом:
(2.6)
для доли
(2.7)
где
- доля обследованных единиц совокупности.
При собственно случайном бесповторном отборе средняя ошибка выборки зависит от:
вариации изучаемого признака;
объем выборки;
доли обследованных единиц.
Чем больше объем выборки и доля обследованных единиц, тем меньше ошибка выборки; вариация признака связана с ней прямо пропорционально.
Если доля обследованных единиц, то дополнительный множитель под знаком радикала практически не влияет на ошибку выборки. В этом случае ошибку выборки при бесповторном отборе можно найти по формулам, которые применяются при повторном отборе.
Наряду
с абсолютной величиной средней и
предельной ошибок выборки в статистической
практике используется относительная
их величина, рассчитываемая как отношение
ошибки к исследуемому параметру:
или
.
Теоретически в знаменателе должно быть
значение исследуемого параметра
генеральной совокупности. Однако оно
известно, поэтому относительная ошибка
рассчитывается через соответствующий
параметр выборки:
или
.
Относительная ошибка выражается в
процентах. Выборка считается
репрезентативной, если Δотн ≤ 5%.
Пример. По данным выборочного обследования, проведенного Госкомстатом России по состоянию на конец марта 2005 г., средний возраст безработных в России составил = 34,4 года при среднем квадратическом отклонении σ = 13,8 года. С вероятностью p = 0,997 определить пределы, в которых находится средний возраст безработных в генеральной совокупности, если известно, что в ходе обследования опрошено п = 155 тыс. человек в возрасте 15—72 лет, что составляет = 0,15% от общей численности населения в этом возрасте.
Средняя ошибка выборки при собственно случайном бесповторном отборе составит:
года.
При
коэффициент доверия t = 3 (см. Приложение
2), а предельная ошибка выборки
года.
Таким образом, средний возраст безработных в России с вероятностью 0,997 находится в пределах
,
т.е.
,
или
.
При решении данной задачи среднюю ошибку выборки можно рассчитать по формуле для повторного отбора, поскольку величина мала.
Пример. С вероятностью 0,954 определить предельную ошибку выборки для доли мужчин среди безработных в России в конце марта 1996 г., если известно, что в выборке (n = 155 тыс. человек) их доля составила 54,9%.
При
коэффициент
доверия t
= 2(см.
Приложение 1).
Предельная ошибка выборки
,
т.е. Δ = 0,27%.
Следовательно, с вероятностью 0,954 можно утверждать, что в генеральной совокупности предельная ошибка выборки для доли безработных мужчин не превысит 0,25%.
Можно решить и обратную задачу: задав предельную ошибку выборки, определить вероятность, с которой она может быть гарантирована. При этом, зная Δ и µ, сначала находят коэффициент доверия t = Δ/µ, а затем по таблице (см. Приложение 1) искомое значение вероятности.
