Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ГЛАВА 8-12.doc
Скачиваний:
42
Добавлен:
07.05.2019
Размер:
12.29 Mб
Скачать

Методы (алгоритмы) отбора единиц в выборочную совокупность

Процесс формирования выборочной совокупности основан на принципе случайности, реализация которого обеспечивается приме­нением соответствующих методов, или алгоритмов, отбора единиц'.

В простейшем варианте отбор единиц в выборочную совокупность может быть проведен методом жеребьевки. Для этого необходимо рас­полагать достаточным количеством жребиев (фишек, карточек), соот­ветствующих объему генеральной совокупности. Каждый жребий дол­жен содержать информацию об отдельной единице совокупности -номер, название, фамилию лица, адрес или какой-либо другой отличи­тельный признак. Требуемое в соответствии с установленным процен­том отбора число жребиев извлекается из общей совокупности в слу­чайном порядке.

Жеребьевка является в большей степени теоретическим методом формирования выборки, так как ее техническая реализация при боль­шом объеме генеральной совокупности затруднительна. Используемые же на практике методы отбора единиц в выборочную совокупность базируются на специальных алгоритмах, реализующих принцип слу­чайности. Рассмотрим некоторые из них.

Метод случайной сортировки включает три шага:

1. Каждой единице генеральной совокупности присваивается слу­чайное число и, полученное с помощью процессора случайных чисел

В данном случае мы не рассматриваем менее распространенные методы нс-равновероитностного, или направленного, отбора. 289

в интервале от 0 до 1 (полученные случайные числа должны в той или иной степени соответствовать закону равномерного распределе­ния). Отметим, что генерация случайных чисел может быть произве­дена в Microsoft Excel (Вставка функции - Математические - Слу­чайное число).

2. Единицы генеральной совокупности ранжируются в соответ­ствии с полученным значением и.

3. Отбираются п первых единиц.

Достоинства данного метода заключаются в простом алгоритме отбора единиц, а также в возможности формирования нескольких выборок без перекрытия. К недостатку данного метода относят нали­чие процедуры сортировки единиц генеральной совокупности, кото­рая при достаточно большом ее объеме нежелательна.

Метод прямой реализации предполагает следующую последова­тельность действий:

1. Все единицы генеральной совокупности, расположенные в слу­чайном порядке или ранжированные по какому-либо признаку, нуме­руются от 1 до N.

2. С помощью процессора случайных чисел получают п значений в интервале от 1 до N. Если первоначально случайные числа получе­ны в интервале от 0 до 1, их необходимо умножить на N и округлить по правилам до целого значения.

3. Из сформированного списка единиц генеральной совокупнос­ти отбираются единицы, соответствующие по номеру полученным случайным числам.

Отметим, что если полученные в п. 2 случайные числа ранжиро­вать, то реализация данного алгоритма потребует только одного счи­тывания файла единиц генеральной совокупности.

Упрощенным вариантом метода прямой реализации является от­бор единиц в выборочную совокупность на основе таблицы случай­ных чисел (см. приложение 15). Для проведения отбора могут быть использованы цифры любого столбца данной таблицы, при этом не­обходимо учитывать объем генеральной совокупности.

Рассмотрим процедуру отбора на основе фрагмента таблицы слу­чайных чисел. Предположим, объем генеральной совокупности состав­ляет 70 000 ед. и требуется сформировать выборку объемом 500 ед.;

тогда цифры таблицы следует перегруппировать для получения пяти­значных чисел следующим образом:

290

5489 5

583 31

56 083

5 1988

3522 0

935 78

77 566

5 7020

7555 7

579 25

50 248

7 9477

5759 3

554 50

80 907

4 7001

6303 6

895 33

71 319

6 7231

Для формирования выборки мы должны взять 500 чисел в интер­вале от 00 001 до 70 000. Таким образом, нам следует из списка еди­ниц генеральной совокупности отобрать единицы под номером 54 895, 35 220, 57 593 и т.д. При этом номера свыше 70 000 (75 557, 93 578 и подобные) будут проигнорированы.

При проведении бесповторного отбора повторяющиеся номера следует учитывать только один раз. При повторном отборе, если тот или иной номер случайно встретится еще один или более раз, соот­ветствующая этому номеру единица в каждом случае повторно вклю­чается в выборочную совокупность.

Метод отбора-отказа включает следующие итерации:

• последовательно образуют случайные числа Up у, ... в соот­ветствии с законом равномерного распределения в интервале от 0 до 1;

• для первой единицы генеральной совокупности проверяется выполнение следующего неравенства:

(8.1)

Если данное неравенство выполняется, то первая единица вклю­чается в выборку, в противном случае - нет;

• для оставшихся единиц последовательно проверяется выполне­ние неравенства

(8.2)

где д^ - число отобранных в выборку единиц среди первых Л; просмотренных единиц.

291

Если для (А+1)-й единицы это неравенство выполняется, то дан­ная единица включается в выборку, в противном случае - нет;

• процедура заканчивается, когда п^ = п, т. е. когда выборка необ­ходимого объема полностью сформирована. Этот момент впол­не может наступить и до завершения полного просмотра всех единиц генеральной совокупности.

Следует отметить, что данный метод основан на алгоритме пос­ледовательного извлечения единиц, не требующем ни предваритель­ной сортировки единиц генеральной совокупности или образованных случайных чисел, ни многократного считывания исходного файла.

Рассмотрим на условных примерах, как действует метод отбора-отказа и докажем, что положенный в его основу алгоритм действи­тельно приводит к формированию выборки требуемого объема вне зависимости от значений получаемых случайных чисел.

Пример. Требуется сформировать выборку объемом 100 единиц из генеральной совокупности объемом 1000 единиц, т.е. п = 100 и i N= 1000. :

Предположим, на 1-м шаге для совокупности А образованное слу-, чайное число составило 0,03, тогда неравенство (8.1) выполняется, так как

и 1-я единица генеральной совокупности будет включена в совокуп­ность выборочную.

Допустим теперь, что значения последующих случайных чисел по той или иной причине также не превысили 0,1 (см. графу 1 табл. 8.2). Результаты проверки выполнения неравенства (8.2) для со­ответствующих единиц генеральной совокупности представлены в графах 2 и 3 табл. 8.2.

На 2-м шаге из первых 2 единиц обе были включены в выборку, на 3-м шаге - из первых 3 единиц все три были включены в выборку, и так далее до 100-го шага, на котором из первых 100 единиц генеральной совокупности все 100 вошли в совокупность выборочную. Начиная со 101-го шага, числитель дроби в правой части неравенства (8.2) стано­вится равным нулю, а следовательно, и вся дробь также равна нулю. Тог­да, какими бы малыми ни были случайные числа, образованные для ос­тавшихся 900 единиц генеральной совокупности, они не могут быть

292

Таблица 8.2

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]