
- •Глава 8 выборочное наблюдение
- •Значение и теоретические основы выборочного наблюдения
- •Варианты повторной выборки из генеральной совокупности
- •Методы (алгоритмы) отбора единиц в выборочную совокупность
- •Реализация метода отбора-отказа для совокупиости а
- •Собственно-случайная (простая случайная) выборка
- •Результаты выборочного обследования жилищных условий жителей города
- •Расчет средней общей (полезной) площади жилищ, приходящейся на 1 чел., и дисперсии
- •8.4 Механическая (систематическая) выборка
- •Типическая (стратифицированная) выборка
- •8.6 Серийная выборка
- •Практика применения выборочного наблюдения в социально-экономических исследованиях
- •Основные понятия
- •Глава 10 статистическое изучение динамики социально-экономических явлений
- •Понятие и классификация рядов динамики
- •Число квартир, построенных предприятиями и организациями всех форм собственности и их средний размер в рф
- •Динамика продукции сельского хозяйства рф за 1997-2000 гг., млн руб.'
- •Сопоставимость уровней и смыкание рядов динамики
- •Дннямикя объема продукции*
- •Аналитические показатели изменения уровней ряда динамики
- •10.4 Компоненты ряда динамики
- •Виды трендовой компоненты и проверка гипотезы о существовании тенденции
- •Реализованная продукция производственного объединения
- •Методы анализа основной тенденции (тренда) в рядах динамики
- •1Почком.
- •Удельный вес воздушных судов, прибывших без опоздания по сравнению с расписанием за 1991-2001 гг.
- •Динамика урожайности зерновых культур в хозяйстве
- •10.7 Методы выявления периодической компоненты. Модели сезонных колебаний
- •Дмвамнка поквартальной продажи безалкогольных напитков • одной из республик за 1999-2001 гг.
- •Регрессионный анализ связных динамических рядов
- •Элементы прогнозирования и интерполяции
- •Прогнозные значения урожайности зерновых культур в хозяйстве на 2002-2005 гг.
- •Основные понятия
- •Глава 12 экономические индексы
- •Понятие экономических индексов. Классификация индексов
- •Рве. 12.1. Классификация экономических индексов
- •Индивидуальные и общие индексы
- •Агрегатный индекс как исходная форма индекса
- •12.4 Средние индексы
- •Основные формулы исчисления сводных, или общих, индексов
- •12.5 Выбор базы и весов индексов
- •Системы индивидуальных индексов
- •12.6 Индексы структурных сдвигов
- •Индексы пространственно-территориального сопоставления
- •Важнейшие экономические индексы и их взаимосвязи
- •12.9 Свойства индексов ласпейреса и пааше
- •Индекс Ласпейреса и Пааше
- •12.10 Идеальный индекс фишера
- •12.11 Индексы-дефляторы
- •Основные понятия
Методы (алгоритмы) отбора единиц в выборочную совокупность
Процесс формирования выборочной совокупности основан на принципе случайности, реализация которого обеспечивается применением соответствующих методов, или алгоритмов, отбора единиц'.
В простейшем варианте отбор единиц в выборочную совокупность может быть проведен методом жеребьевки. Для этого необходимо располагать достаточным количеством жребиев (фишек, карточек), соответствующих объему генеральной совокупности. Каждый жребий должен содержать информацию об отдельной единице совокупности -номер, название, фамилию лица, адрес или какой-либо другой отличительный признак. Требуемое в соответствии с установленным процентом отбора число жребиев извлекается из общей совокупности в случайном порядке.
Жеребьевка является в большей степени теоретическим методом формирования выборки, так как ее техническая реализация при большом объеме генеральной совокупности затруднительна. Используемые же на практике методы отбора единиц в выборочную совокупность базируются на специальных алгоритмах, реализующих принцип случайности. Рассмотрим некоторые из них.
Метод случайной сортировки включает три шага:
1. Каждой единице генеральной совокупности присваивается случайное число и, полученное с помощью процессора случайных чисел
В данном случае мы не рассматриваем менее распространенные методы нс-равновероитностного, или направленного, отбора. 289
в интервале от 0 до 1 (полученные случайные числа должны в той или иной степени соответствовать закону равномерного распределения). Отметим, что генерация случайных чисел может быть произведена в Microsoft Excel (Вставка функции - Математические - Случайное число).
2. Единицы генеральной совокупности ранжируются в соответствии с полученным значением и.
3. Отбираются п первых единиц.
Достоинства данного метода заключаются в простом алгоритме отбора единиц, а также в возможности формирования нескольких выборок без перекрытия. К недостатку данного метода относят наличие процедуры сортировки единиц генеральной совокупности, которая при достаточно большом ее объеме нежелательна.
Метод прямой реализации предполагает следующую последовательность действий:
1. Все единицы генеральной совокупности, расположенные в случайном порядке или ранжированные по какому-либо признаку, нумеруются от 1 до N.
2. С помощью процессора случайных чисел получают п значений в интервале от 1 до N. Если первоначально случайные числа получены в интервале от 0 до 1, их необходимо умножить на N и округлить по правилам до целого значения.
3. Из сформированного списка единиц генеральной совокупности отбираются единицы, соответствующие по номеру полученным случайным числам.
Отметим, что если полученные в п. 2 случайные числа ранжировать, то реализация данного алгоритма потребует только одного считывания файла единиц генеральной совокупности.
Упрощенным вариантом метода прямой реализации является отбор единиц в выборочную совокупность на основе таблицы случайных чисел (см. приложение 15). Для проведения отбора могут быть использованы цифры любого столбца данной таблицы, при этом необходимо учитывать объем генеральной совокупности.
Рассмотрим процедуру отбора на основе фрагмента таблицы случайных чисел. Предположим, объем генеральной совокупности составляет 70 000 ед. и требуется сформировать выборку объемом 500 ед.;
тогда цифры таблицы следует перегруппировать для получения пятизначных чисел следующим образом:
290
5489 5
|
583 31
|
56 083
|
5 1988
|
3522 0
|
935 78
|
77 566
|
5 7020
|
7555 7
|
579 25
|
50 248
|
7 9477
|
5759 3
|
554 50
|
80 907
|
4 7001
|
6303 6
|
895 33
|
71 319
|
6 7231
|
Для формирования выборки мы должны взять 500 чисел в интервале от 00 001 до 70 000. Таким образом, нам следует из списка единиц генеральной совокупности отобрать единицы под номером 54 895, 35 220, 57 593 и т.д. При этом номера свыше 70 000 (75 557, 93 578 и подобные) будут проигнорированы.
При проведении бесповторного отбора повторяющиеся номера следует учитывать только один раз. При повторном отборе, если тот или иной номер случайно встретится еще один или более раз, соответствующая этому номеру единица в каждом случае повторно включается в выборочную совокупность.
Метод отбора-отказа включает следующие итерации:
• последовательно образуют случайные числа Up у, ... в соответствии с законом равномерного распределения в интервале от 0 до 1;
• для первой единицы генеральной совокупности проверяется выполнение следующего неравенства:
(8.1)
Если данное неравенство выполняется, то первая единица включается в выборку, в противном случае - нет;
• для оставшихся единиц последовательно проверяется выполнение неравенства
(8.2)
где д^ - число отобранных в выборку единиц среди первых Л; просмотренных единиц.
291
Если для (А+1)-й единицы это неравенство выполняется, то данная единица включается в выборку, в противном случае - нет;
• процедура заканчивается, когда п^ = п, т. е. когда выборка необходимого объема полностью сформирована. Этот момент вполне может наступить и до завершения полного просмотра всех единиц генеральной совокупности.
Следует отметить, что данный метод основан на алгоритме последовательного извлечения единиц, не требующем ни предварительной сортировки единиц генеральной совокупности или образованных случайных чисел, ни многократного считывания исходного файла.
Рассмотрим на условных примерах, как действует метод отбора-отказа и докажем, что положенный в его основу алгоритм действительно приводит к формированию выборки требуемого объема вне зависимости от значений получаемых случайных чисел.
Пример. Требуется сформировать выборку объемом 100 единиц из генеральной совокупности объемом 1000 единиц, т.е. п = 100 и i N= 1000. :
Предположим, на 1-м шаге для совокупности А образованное слу-, чайное число составило 0,03, тогда неравенство (8.1) выполняется, так как
и 1-я единица генеральной совокупности будет включена в совокупность выборочную.
Допустим теперь, что значения последующих случайных чисел по той или иной причине также не превысили 0,1 (см. графу 1 табл. 8.2). Результаты проверки выполнения неравенства (8.2) для соответствующих единиц генеральной совокупности представлены в графах 2 и 3 табл. 8.2.
На 2-м шаге из первых 2 единиц обе были включены в выборку, на 3-м шаге - из первых 3 единиц все три были включены в выборку, и так далее до 100-го шага, на котором из первых 100 единиц генеральной совокупности все 100 вошли в совокупность выборочную. Начиная со 101-го шага, числитель дроби в правой части неравенства (8.2) становится равным нулю, а следовательно, и вся дробь также равна нулю. Тогда, какими бы малыми ни были случайные числа, образованные для оставшихся 900 единиц генеральной совокупности, они не могут быть
292
Таблица 8.2