Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Тема 5. Выборочное наблюдение.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
1.4 Mб
Скачать

Ошибки выборки при случайном бесповторном отборе

Приведенные ранее формулы средней ошибки выборки справедливы только при повторном отборе. Однако на практике чаще используется бесповторный отбор: обследованная единица не возвращается в генеральную совокупность и не может быть обследована повторно. При этом принцип независимости испытаний нарушается. Очевидно, что при бесповторном отборе из четырех студентов двоих (см. табл. 2.1) средний возраст студентов I курса не может быть равен 16 и 18 годам. Следовательно, средняя ошибка выборки будет меньше.

Средняя ошибка выборки при собственно случайном бесповторном отборе рассчитывается по формуле:

. (2.5)

При больших значениях N величину (N – 1) в формуле (5.1) можно заменить на N, тогда упрощенная формула средней ошибки выборки запишется следующим образом:

(2.6)

для доли

(2.7)

где - доля обследованных единиц совокупности.

При собственно случайном бесповторном отборе средняя ошибка выборки зависит от:

  • вариации изучаемого признака;

  • объем выборки;

  • доли обследованных единиц.

Чем больше объем выборки и доля обследованных единиц, тем меньше ошибка выборки; вариация признака связана с ней прямо пропорционально.

Если доля обследованных единиц, то дополнительный множитель под знаком радикала практически не влияет на ошибку выборки. В этом случае ошибку выборки при бесповторном отборе можно найти по формулам, которые применяются при повторном отборе.

Наряду с абсолютной величиной средней и предельной ошибок выборки в статистической практике используется относительная их величина, рассчитываемая как отношение ошибки к исследуемому параметру: или . Теоретически в знаменателе должно быть значение исследуемого параметра генеральной совокупности. Однако оно известно, поэтому относительная ошибка рассчитывается через соответствующий параметр выборки: или . Относительная ошибка выражается в процентах. Выборка считается репрезентативной, если Δотн ≤ 5%.

Пример. По данным выборочного обследования, проведенного Госкомстатом России по состоянию на конец марта 2005 г., средний возраст безработных в России составил = 34,4 года при среднем квадратическом отклонении σ = 13,8 года. С вероятностью p = 0,997 определить пределы, в которых находится средний возраст безработных в генеральной совокупности, если известно, что в ходе обследования опрошено п = 155 тыс. человек в возрасте 15—72 лет, что составляет = 0,15% от общей численности населения в этом возрасте.

Средняя ошибка выборки при собственно случайном бесповторном отборе составит:

года.

При коэффициент доверия t = 3 (см. Приложение 2), а предельная ошибка выборки

года.

Таким образом, средний возраст безработных в России с вероятностью 0,997 находится в пределах

,

т.е.

,

или

.

При решении данной задачи среднюю ошибку выборки можно рассчитать по формуле для повторного отбора, поскольку величина мала.

Пример. С вероятностью 0,954 определить предельную ошибку выборки для доли мужчин среди безработных в России в конце марта 1996 г., если известно, что в выборке (n = 155 тыс. человек) их доля составила 54,9%.

При коэффициент доверия t = 2(см. Приложение 1).

Предельная ошибка выборки

,

т.е. Δ = 0,27%.

Следовательно, с вероятностью 0,954 можно утверждать, что в генеральной совокупности предельная ошибка выборки для доли безработных мужчин не превысит 0,25%.

Можно решить и обратную задачу: задав предельную ошибку выборки, определить вероятность, с которой она может быть гарантирована. При этом, зная Δ и µ, сначала находят коэффициент доверия t = Δ/µ, а затем по таблице (см. Приложение 1) искомое значение вероятности.