- •Тема 5. Определение выборочной совокупности Выборки. Типы выборок. Расчет ошибки выборки
- •Расчет ошибки и размера выборки (для случайной выборки)
- •Выборочный метод в социологических исследованиях
- •Генеральная и выборочная совокупность.
- •Репрезентативность и основные принципы формирования выборочной совокупности.
- •4. Основа и объем выборки.
- •Вероятностные способы формирования выборочной совокупности
- •Простая вероятностная выборка.
- •2.Неслучайные (не вероятностные) методы отбора.
- •Направленный отбор.
- •Многоступенчатые и комбинированные способы формирования выборочной совокупности
Многоступенчатые и комбинированные способы формирования выборочной совокупности
Многоступенчатые выборки. Любой тип вероятностной выборки (простая случайная, систематическая и серийная) может быть одно- пли многоступенчатым. Необходимость многоступенчатого отбора вызвана, как правило, отсутствием информации по всей генеральной совокупности о единицах наблюдения.
При многоступенчатом отборе для организации первой ступени достаточно иметь информацию о распределении признака отбора. Для организации второй ступени информация нужна уже только с отобранных единиц первой ступени.
При многоступенчатом отборе на каждой ступени меняется единица отбора. Например, на первой ступени производился отбор промышленных предприятий, на второй — отбор бригад на предприятиях, попавших в выборку на первой ступени, на третьей — отбор рабочих из бригад, попавших в выборку на второй ступени отбора.
Пропорциональный способ организации . Для организации вероятностной выборки, начиная со второй ступени, отбор ведется независимо по каждой единице отбора первой ступени и т. д.
Как правило, используется строго случайный отбор на первой ступени отбора, а начиная со второй ступени — вероятностный пропорциональный отбор (т. е. учитывается размер единиц первой ступени, попавших в выборку).
Доли отбора на каждой ступени комбинируются таким образом, чтобы в целом доля отбора выборки обеспечивала всем единицам генеральной совокупности равные шансы попасть в выборку. Практическое формирование долей отбора будет показано на примере выборки при исследовании ленинградскими социологами отношения молодежи к труду.
Пропорциональный способ организации многоступенчатой выборки связан со следующим неудобством. Социолог, с одной стороны, уменьшает объем выборки в целях экономии средств и сокращения сроков проведения исследования, а с другой — соблюдая принцип пропорциональности, может получить очень малочисленные группировки по отдельным факторам, которые окажутся недостаточными для статистического анализа. Б рамках случайного отбора можно задавать любую долю отбора для единиц как первой, так и последующих ступеней (увеличивая ее или уменьшая), но так, чтобы она давала равную возможность попасть в выборку всем единицам генеральной совокупности.
Многофазовый отбор является особым видом многоступенчатого отбора. Он заключается в том, что из сформированной выборки (районированной, случайной) большого объема производится новая выборка (подвыборка) меньшего объема и т. д.
Особенностью этого способа формирования выборочной совокупности является то, что независимо от числа фаз в последующих подвыборках используется неизменно одна и та же единица отбора, что и в основной выборке.
К многофазовому отбору прибегают тогда, когда в рамках большого исследования, которое проводится на большой выборке, возникает необходимость тщательного изучения более узкого круга вопросов. Для этих целей формируется вторая фаза — та же выборка в миниатюре и т. д. Число таких подвыборок не имеет формального ограничения.
Как и в многоступенчатых выборках, при многофазовом отборе каждая фаза является источником случайных ошибок.
Пример двухфазовой районированной выборки14. В ходе исследования сельского населения возникла необходимость более углубленно изучить его культурные потребности и материальные затраты на «потребление культуры».
Основная выборка (ге) была сделана из стратифицированной генеральной совокупности — изучаемый регион был разделен на 5 типологических групп по типу хозяйств: от мелких (1) до самых крупных (5). Вторая фаза выборки (ге11) была организована из этой основной.
При исчислении выборочных показателей по выборке необходимо учитывать оба компонента случайной ошибки (как и в случае двухступенчатого отбора), связанного со структурой выборки первой фазы {п) и второй фазы (п11).
Комбинированные выборки. Соединение в многоступенчатой выборке различных приемов отбора (простого случайного, систематического или серийного) делает выборку комбинированной.
Уже указывалось, что прием районирования делает любую выборку (одно- и многоступенчатую) комбинированной. Большинство используемых в современных социологических исследованиях выборок являются комбинированными: любая сравнительно большая генеральная совокупность социальных объектов за редким исключением является неоднородной и, следовательно, требует предварительного районирования.
Формирование комбинированных выборок с помощью новых методов. До сих пор описывались различные способы комбинирования приемов отбора единиц в выборочную совокупность, сложившие я в математической статистике
В настоящее время разрабатывается новые процедуры формирования выборочных совокупностей. Рассмотрим кратко один из них — таксономию для районирования генеральной и выборочной совокупности. Примером такого подхода к выборке является опыт новосибирских социологов по формированию комбинированной многоступенчатой выборки.
На первой ступени были сформированы типические группы районов, которые выделялись по комбинации выбранных признаков. Типологизация достигалась автоматически методом распознавания образов. Полученные группы были названы таксопами. Выделение таксонов соответствовало приему районирования. Далее из каждого таксона был выбран один район (первая ступень отбора).
Вторая ступень состояла в выборе сельсоветов из попавших в выборку районов. Но этой процедуре предшествовало также распределение сельсоветов на таксоны по схожему, но несколько отличному набору признаков.
Третья ступень отбора состояла в систематической выборке семей по хозяйственным книгам попавших в выборку сельсоветов (на второй ступени). Объем выборки планирования в 5000 сельских семей Новосибирской обл. Ориентировочные доли отбора для первой ступени — 0,5 (или 14—15 районов из 29), для второй — 0,2 (20% сельсоветов в выбранных районах, или всего 37 сельсоветов), для третьей — 0,02. Комбинация долей отбора гарантировала намеченный объем выборки (20% от генеральной совокупности).
В качестве другого подхода к формированию комбинированных выборок можно назвать формальное описание объекта при помощи комбинации методов автоматической классификации и методов выделения существенных характеристик объекта. При таком подходе возникает возможность учесть задачи качественного анализа многомерных данных, которые будут решаться в исследовании .
В качестве третьего примера можно рассмотреть привлечение техники «причинного анализа» для обоснованного выделения факторов при формировании выборки. Описанная на стр. 290 выборка формировалась с помощью тех факторов, которые были выделены причинным анализом как имеющие «наибольший вес влияния» на изучаемый признак из числа рассмотренных.
1 Напомним, что под индуктивным выводом обычно понимают рассуждение по схеме «от частных наблюдений — к общей эмпирической закономерности».
1 Более детальные сведения о развитии выборочного метода можно найти, в частности, в интересной и доступной книге: Дружинин Н. К. Выборочное наблюдение и эксперимент. М.: Статистика, 1979.
2 См.: Fisher R. A. The Design of Experiment. 3rd ed. L.: Oliver & Boyd, 1942.
3 В дальнейшем мы будем использовать термины «случайная выборка» и «вероятностная выборка» как взаимозаменяемые.
1 В качестве метода получения репрезентативной выборки употребляется случайный выбор. По известным законам математической статистики при этом не возникают систематические ошибки, конечно, при условии, что такой выбор удается осуществить. При случайном выборе имеются только случайные ошибки, но они убывают с ростом объема выборки. Объем выборки зависит от изменчивости характеристик объектов генеральной совокупности и может быть малым, если генеральная совокупность близка к однородной. Поскольку в социологических исследованиях, как правило, приходится иметь дело с весьма неоднородными генеральными совокупностями, то это может потребовать для получения высокой репрезентативности очень большого объема выборки. Поэтому прибегают к различным способам расслоения всей совокупности объектов на однородные группы, в каждой из которых необходимый объем случайной выборки будет уже практически приемлемым.
1 Gallup G. A. Guide to Public Opinion Polls. Princeton: Princeton University Press, 1948.
1 Подробнее об источниках смещений в основе выборки и некоторых способах борьбы со смещениями см.: Kish L. Survey sampling. N. Y.: J. Wiley, 1965. P. 53—59.
1 Здесь и далее речь идет о случайной безвозвратной выборке, так как выборка с возвращением отобранной единицы в совокупность на каждом шаге отбора не очень удобна практически (хотя и обладает рядом статистических преимуществ).
2 Следует заметить, что бесповторный отбор не отвечает принципу случайности. Это нарушение тем существеннее, чем меньше ГС. Однако на практике как правило применяется бесповторный отбор.
1 Выборка считается более эффективной, если:
при одинаковых расходах она более точна.
при одинаковой точности она более дешевая.
2 Принцип моделирования выборки станет более понятен при непосредственном рассмотрениии модификаций случайной выборки.
1 В действительности нам понадобится как минимум 20%-й запас карточек с именами и адресами для замещения тех респондентов, которые окажутся недоступными даже 2—3 посещений. Доля «недоступных» в исследовании специфических популяций (например, зубных врачей или читателей «Вопросов литературы») может составить 40—50%, включая и длительно отсутствующих, и отказавшихся от сотрудничества и т. п. Соответственно в последнем случае «запас» должен составлять 40—50% от первоначально запланированного объема выборки.
2 Подробнее см.: Sudman S. Applied sampling. N. Y.: Academic Press, 1975. P. 126—130.
