- •Тема 5. Определение выборочной совокупности Выборки. Типы выборок. Расчет ошибки выборки
- •Расчет ошибки и размера выборки (для случайной выборки)
- •Выборочный метод в социологических исследованиях
- •Генеральная и выборочная совокупность.
- •Репрезентативность и основные принципы формирования выборочной совокупности.
- •4. Основа и объем выборки.
- •Вероятностные способы формирования выборочной совокупности
- •Простая вероятностная выборка.
- •2.Неслучайные (не вероятностные) методы отбора.
- •Направленный отбор.
- •Многоступенчатые и комбинированные способы формирования выборочной совокупности
Вероятностные способы формирования выборочной совокупности
Строгое обоснование выборки как модели генеральной совокупности и степени ее репрезентативности — все это в "полной мере осуществимо только для вероятностных (случайных) выборок.
Понятие случайного способа формирования выборочной совокупности нельзя понимать в обыденном значении этого слова, ибо случайная выборка предполагает определенные процедуры ее организации и предъявляет социологу определенные требования.
Существует ряд приемов формирования выборочных совокупностей, которые строятся по подобию вероятностных, но для которых нельзя строго обосновать, что выборочные характеристики выступают оценками соответствующих характеристик генеральной совокупности. Такие выборки можно назвать эмпирическими, так как они не имеют теоретического вероятностного обоснования.
Основная цель выборочного исследования — сформировать репрезентативную выборку. Для этого необходимо обеспечить всем элементам генеральной совокупности равные возможности- попасть в выборку. При этих условиях элементы генеральной совокупности оказываются представленными в выборке с вероятностями, которые приближаются к их распределению в генеральной совокупности. Объекты, которые чаще встречаются в генеральной совокупности, чаще будут преобладать и в выборке. Такой результат является проявлением действия закона больших чисел. Именно подобные типы выборок, воспроизводящие закон распределения генеральной совокупности, получили название вероятностных.
Различают следующие виды вероятностной выборки: простую, систематическую и серийную («гнездовую»).
Простая вероятностная выборка.
Собственно случайная выборка лежит в основе всех остальных типов выборки, которые будут рассмотрены далее.
Выборка называется собственно случайной, если при извлечении выборки объема n все возможные комбинации из n элементов, которые могут быть получены из генеральной совокупности объема N, имеют равную вероятность быть извлеченными.
По определению, при собственно случайной выборке выполняется принцип случайности.
Отбор производится с помощью жеребьевки, таблицы (либо генератора) случайных чисел. Главный принцип – случайность, т.е. все единицы генеральной совокупности имеют равную вероятность попасть в выборочную совокупность. Другие принципы:
Принцип жеребьевки. Каждый элемент генеральной совокупности заносится на бумажку (это могут быть фамилии, адреса, просто номера (в этом случае выпавшие номера ставят в соответствие с людьми в списках) и т.д.), затем бумажки помещаются в барабан, перемешиваются и не глядя вытаскиваются.
Принцип таблицы случайных чисел. Начиная с любого места таблицы, берем четыре следующих друг за другом числа. Эти числа и будут номерами людей в списке, которых следует отобрать в выборку (числа, превышающие численность генеральной совокупности, опускаются).
Принцип генератора случайных чисел. Это то же самое, что и таблицы случайных чисел, только числа вырабатываются компьютером (для этого существует специальная программа).
Процедура построения простой случайной выборки включает в себя следующие шаги.
Во-первых, нужно получить полный список членов генеральной совокупности и пронумеровать этот список. Такой список, напомним, называется основой выборки.
Во-вторых, следует определить предполагаемый объем выборки, т. е. ожидаемое число опрошенных.
В-третьих, нужно извлечь из таблицы случайных чисел (либо с помощью генератора случайных чисел) столько чисел, сколько нам требуется выборочных единиц. Если в выборке должно оказаться 100 человек, из таблицы берут 100 случайных чисел.
В-четвертых, нужно выбрать из списка-основы те наблюдения, номера которых соответствуют выписанным случайным числам1.
Различают повторную и бесповторную выборку.
Простая повторная выборка. На карточки наносятся номера респондентов. Карточки перемешиваются. Вслепую вынимается карточка, записывается ее помер, затем карточка возвращается в колоду, и карточки снова перемешиваются. Эта операция называется повторным отбором. Сама процедура повторной выборки почти не используется для социологических исследований, и возможное дублирование единиц отбора для многих программ социологического исследования равносильно сокращению намеченного объема выборки. При повторном отборе каждый выбранный элемент возвращается в ГС.
Простая бесповторная выборка. При бесповторном отборе выбранный элемент не возвращается в ГС2. Респонденты отбираются как и при простой повторной выборке, но отобранные карточки не возвращаются в колоду, а откладываются в сторону.
Плюсом простого случайного отбора является полное соблюдения принципа случайности и, как следствие – избежание систематических ошибок.
Случайная выборка обладает рядом недостатков, которые затрудняют ее применение на практике. Эти недостатки можно представить в трех пунктах:
Необходимость наличия списка элементов генеральной совокупности. Обычно элементами генеральной совокупности являются люди; в этом случае в качестве списка могут выступать адреса, телефоны и т.д. Трудность здесь заключается в том, что получить такой список далеко не всегда представляется возможным. Следовательно, в тех случаях, когда невозможно получить список элементов генеральной совокупности, невозможно проводить и случайный отбор.
Сложность проведения опроса. Процедура опроса при случайном отборе является очень громоздкой и требующей много времени. Ведь в результате случайного отбора исследователь получает на выходе список фамилий респондентов (телефонов, адресов и т.д.), которых необходимо опросить. Иными словами, интервьюерам приходится «бегать» за каждым респондентом и добиваться от него согласия ответить на «парочку вопросов».
Осложняет дело и то, что респондентов порой бывает не так просто достать; в случае отсутствия респондента его приходится посещать по нескольку раз (по крайней мере не менее трех раз).
Все вышеперечисленное ведет к повышенным временным затратам на проведение опроса. Временные затраты можно уменьшить только благодаря привлечению дополнительных интервьюеров, т.е. только за счет дополнительных денежных расходов. Помимо этого возникает еще так называемая проблема неответивших.
Сравнительно большой объем выборки. Для получения результатов со сравнительно высокой степенью точности собственно случайный отбор требует достаточно большого объема выборки по сравнению с другими видами отбора. Другими словами, случайный отбор обладает меньшей степенью точности, что, в конечном счете, является причиной его меньшей эффективности1.
Довольно часто исследователь сталкивается с ситуацией, когда временные и финансовые затраты на осуществление простой случайной выборки становятся неприемлемо высокими. Наиболее разумным выходом здесь является использование других, «компромиссных», процедур случайного отбора. Часто используются различные методы моделирования случайности.
Использование различных типов случайного отбора позволяет несколько сгладить некоторые из вышеупомянутых трудностей, возникающих при проведении собственно случайного отбора. Например, некоторые типы случайного отбора позволяют упростить организацию опроса, но главное – это то, что они увеличивают эффективность выборки.
Так при случайном отборе ошибка выборки контролируется только за счет изменения объема выборки. В рассматриваемых же нами типах случайного отбора эффективность выборки можно повысить за счет моделирования выборки без увеличения ее объема.
Под моделированием выборки понимается проведение случайного опроса с учетом информации о генеральной совокупности. Это означает, что по некоторым параметрам составляется модель генеральной совокупности для того, чтобы уже на стадии, предшествующей стадии случайного отбора, повысить соответствие этих параметров в выборке и генеральной совокупности2.
Однако модификации случайного отбора не могут преодолеть всех трудностей, связанных со случайной выборкой. Это связано с тем, что все они являются разновидностями именно случайного отбора и в них используется принцип случайности.
Из этого следует, что проводить любой случайный отбор невозможно без списка элементов генеральной совокупности. Более того, большинство типов случайного отбора приводят к тем же трудностям при организации опроса, что и при собственно случайной выборке. Главное, чего достигают эти модификации случайного отбора, так это увеличения точности выборки.
Однако при формальном сходстве с собственно случайной выборкой, любая ее вариация есть все же некоторое отклонение от принципа случайности. Эти отклонения могут приводить к систематическим ошибкам, которые невозможны при собственно случайной выборке. Теперь непосредственно перейдем к рассмотрению типов случайного отбора.
2. Механическая (или систематическая вероятностная) выборка — это упрощенный вариант вероятностного отбора. Систематическая выборка по качеству часто приближается к простой случайной. Систематическая выборка, как и простая случайная, требует полного списка или заданного упорядочения совокупности (различные алфавитные списки, картотеки учреждений, книги жильцов в домоуправлении). Техника осуществления систематического отбора элементарна: сначала случайным образом отбирается первая единица, затем отбору подлежит каждый k-й элемент. Число k в данном случае называют шагом выборки. Можно, например, отбирать каждый 25-й или каждый 200-й элемент. Чтобы определить шаг отбора, нужно поделить известный объем генеральной совокупности (N) на предполагаемый объем выборки (n).
(k) .
Начало отбора выбирается случайным образом в пределах шага выборки. Например, если шаг выборки равен 20, то начинать отбор надо с любого числа от 1 до 20.
Не существует никаких априорных статистических или социологических правил для определения объема имеющейся информации. Единственное общее правило заключается в том, что чем более статистически однородна генеральная совокупность, тем объем выборки может быть меньше; чем меньше информации о характере генеральной совокупности, тем больше должен быть объем выборки.
Пусть, например, нужно отобрать 200 человек из 20000 владельцев телефонов:
1) определим шаг отбора: N/n = 20000 : 200 = 100;
2) с помощью таблицы случайных чисел найдем первую выборочную единицу. Если, скажем, выпал номер «053», то из списка владельцев телефонов выпишем того, кто значится под этим номером;
3) с установленным шагом отбираем номера: 153, 253, 353, 453 и т. д. до исчерпания списка.
Выбор величины k зависит от характера поставленной проблемы. Предположим, что основой выборки является пронумерованный список школ данного города от 1 до 100. Если исследователя интересует соотношение мальчиков и девочек в выпускных классах, то достаточно взять k =20 (п = 5), а если исследуется профессиональная ориентация школьников, то может оказаться слишком большим и k = 10 (га == 10). Это объясняется тем, что во втором случае поднимается более сложная задача, ее изучение зависит от большого числа воздействующих факторов, а значит — больше вариаций.
Допустим, что часть школ расположена в типичном заводском районе. Тогда профессиональная ориентация школьников, возможно, окажется в нем отличной от профессиональной ориентации в школах, расположенных в центре города. В большинстве исследований k берется равным 10, хотя определение интервала чаще всего зависит от размера генеральной совокупности и намеченного размера выборки.
Иногда генеральная совокупность (и соответственно основа выборки) слишком велика либо исследователю известен не полный список, а лишь правило упорядочения элементов в генеральной совокупности. Предположим, что мы хотим составить представление о весе и формате книг, содержащихся в некой библиотеке, при том, что мы не располагаем полным каталогом, а лишь видим, как книги расставлены на стеллажах. При условии, что объем библиотечного собрания нам приблизительно известен, мы можем воспользоваться процедурой систематического отбора и отобрать, скажем, каждую 55-ю книгу. Очень важно отобрать «стартовую» единицу сугубо случайным образом. Именно в этом пункте кроется основная слабость систематического отбора. Если в способе упорядочения единиц совокупности имеет место некая цикличность, т. е. неизвестная нам «система» (систематический паттерн), а случайность в выборе «старта» должным образом не обеспечена, то полученная выборка может также оказаться смещенной (если о систематическом паттерне мы знаем заранее, то он не представляет собой угрозы валидности и может быть учтен в ходе отбора). Если воспользоваться примером с отбором книг в библиотеке, то легко представить себе такую гипотетическую ситуацию: исследователь выбирает в качестве стартовой первую книгу на нижней полке ближайшего стеллажа и далее двигается с шагом 250 единиц. Если на каждом стеллаже размещается около 500 книг, то приблизительно половина его выборки будет взята с нижних полок. Однако известно, что на нижних полках многих библиотек нередко размещают книги больших форматов — художественные альбомы, атласы и т. п. Если в нашем примере это правило упорядочения будет соблюдено хотя бы в половине случаев (т. е. половина нижних полок будет отведена под «неформатные» издания, под так называемые фолио), любые выборочные оценки «направленности» библиотечного собрания или формата представленных в нем книг окажутся невалидными.
Аналогией примеру с библиотечными книгами может служить случай систематической выборки городских квартир. Если в результате осуществляемого непосредственно «в поле» интервьюерами систематического отбора в выборке будут сверхпредставлены квартиры, расположенные на первых и последних этажах, возникнет систематическая выборочная ошибка. На первых и последних этажах в российских городах часто живут люди из групп, имеющих более низкий социально-экономический статус и соответственно ограниченные финансовые ресурсы: квартиры, расположенные на «крайних» этажах и соприкасающиеся с системами коммунального водо- и теплоснабжения, обычно стоят дешевле, так как названные системы в России традиционно являются источником неприятностей и дисфункций в структуре жизнеобеспечения.
Систематическая выборка является экономным и удобным способом формирования выборочной совокупности, хотя следует учитывать возможность систематического распределения в списках единиц различного типа, повторяемости в их распределении, которая может совпадать с величиной интервала отбора, равной k.
Проиллюстрируем это положение. При составлении основы выборки для опроса рабочих в одном из цехов завода выбранный интервал k может совпасть с числом рабочих в бригаде, в списке которой первым окажется бригадир. Поэтому при выборе интервала отбора, который совпадает со скрытой периодичностью в генеральной реальной совокупности, выборка может оказаться полностью смещенной. Опасность в данном случае состоит в том, что можно отобрать только одних бригадиров.
Таким образом, если при систематическом отборе в генеральной совокупности существует какой-либо определенный порядок размещения ее единиц (расположение их по возрастанию или убыванию изучаемого признака), возникает опасность систематической ошибки.
Выборка может оказаться смещенной в том случае, если, например, ее основой является платежная ведомость, в которой лица расположены в порядке возрастания размера заработной платы. В этом случае выборка из начала списка приводит к занижению средней величины заработной платы и к преуменьшению величины средней ошибки выборки. Отбор из конца списка приводит к их завышению.
Возможности и ограничения систематической выборки. Систематическая выборка часто применяется при проведении конкретных социологических исследований. Этот способ выборки лучше всего использовать при более или менее однородной генеральной совокупности. В связи с этим систематическая выборка часто используется в качестве последней, завершающей ступени отбора в сложных выборках.
Стратифицированная (районированная) выборки. Вероятностная выборка с любой техникой отбора (простая вероятностная, систематическая, серийная и даже многоступенчатая) становится районированной, если процедурам отбора единиц наблюдения предшествует разделение генеральной совокупности на однородные части.
В статистическом смысле районирование соответствует выделению такого числа и таких статистически однородных групп, чтобы колебаемость изучаемых признаков внутри их была меньше, чем между ними. Это и свидетельствует (с формальной стороны) о качественном районировании.
Эта дифференциация внутри генеральной совокупности на качественно более однородные группы содержательно связана с предметом исследования.
Необходимость районирования вызвана сложной структурой социальных объектов.
Районирование совокупности оказывается необходимым во всех случаях, когда она является неоднородной с точки зрения социальных, экономических и других характеристик, формирующих ее социальных объектов.
Например, чтобы избежать совпадений цикличности, которая могла встретиться в уже приведенных примерах (отбор бригадиров или по ведомостям заработной платы), можно всех бригадиров данного цеха или лиц, получающих одинаковую заработную плату, выделить в отдельные группы и в каждой из этих групп производить случайный отбор. Такая выборка, предусматривающая предварительное разделение генеральной совокупности на содержательные сходные группы (страты), и является примером районированной выборки.
Так, исследуя профессиональную ориентацию школьников в пределах одного города, можно в одну группу отнести 16 школ, расположенных в заводском районе, во вторую — 20 школ, расположенных в центральной части города, в третью — 64 школы, расположенные в остальных его частях, где население в основном занято малоквалифицированным трудом. Для опроса можно отоборать выпускников из двух школ первой группы, двух школ из второй группы и двух — из третьей. Если такая группировка школ действительно отражает различия районов по их расположению, которые существенно учитывать в исследовании, например различие социально-профессиональной структуры населения, то колеблемость изучаемых признаков внутри каждой группы школ должна быть меньше, чем между группами. Тогда несмотря на относительное уменьшение доли представительства третьей группы репрезентативность выборки не уменьшается.
Применительно к стратифицированному отбору часто высказывают все те неверные и предрассудочные мнения, которые в начале XX века высказывались относительно квотной выборки (см. ниже) и ее воображаемых преимуществ перед случайным отбором. В действительности стратифицированный отбор имеет определенные практические преимущества до тех пор, пока сохраняется его вероятностный, случайный характер. Как только стратифицированная выборка превращается в более или менее специально отобранную квотную выборку, воспроизводящую некоторые известные пропорции генеральной совокупности (например, 51% женщин, 30% горожан и т. п.), любые статистические, т. е. строгие, оценки параметров генеральной совокупности становятся невозможными.
Стратификацией, строго говоря, называют процедуру, при которой отбор осуществляют как бы из нескольких «параллельных» подсовокупностей, заданных на одной и той же генеральной совокупности. Это абстрактное определение можно прояснить с помощью примера. Пусть у нас есть генеральная совокупность взрослых горожан, относительно которой мы располагаем какой-то существенной с точки зрения исследовательских гипотез информацией. Наличие такой предварительной информации — необходимое условие стратифицированного отбора. Предположим, мы знаем, что в генеральной совокупности 60% рабочих и 40% служащих. Это соотношение может оказаться весьма существенным с точки зрения наших исследовательских гипотез, если оно задает одну из независимых переменных, как, например, при изучении влияния рода занятий на частоту посещения футбольных матчей. Даже при отсутствии значительной систематической погрешности небольшие смещения в реализации случайной выборочной процедуры могут привести к ситуации, когда в нашей конкретной выборке соотношение рабочих и служащих будет существенно (на 5—7%) отклоняться от ожидаемой «правильной» пропорции, имеющей место в генеральной совокупности (см. обсуждение нормальной кривой и индуктивного статистического вывода в гл. 8). Соответственно под угрозой окажется точность наших оценок взаимосвязи между главной независимой переменной (профессиональным статусом) и интересом к футболу. Такого рода неточность может быть устранена при использовании еще одной случайной выборки из генеральной совокупности, но здесь вступают в силу экономические соображения, так как исследовательский бюджет обычно ограничен. В описанной ситуации желательно заранее обеспечить представленность обеих интересующих нас групп, т. е. страт, сохранив вероятностный характер отбора. Этого можно добиться, если осуществить некую независимую процедуру случайного отбора для каждой социальной группы в отдельности (в нашем примере для рабочих и служащих) и затем объединить полученные случайные подвыборки в одну (заметьте, что для нашего примера объем подвыборки рабочих, в согласии с заранее известной пропорцией, будет в 1,5 раза больше объема подвыборки служащих). Полученная в результате выборка будет и стратифицированной (по профессиональному статусу), и вероятностной.
На практике две случайные процедуры отбора в подвыборки-страты можно технически объединить в одну, если мы располагаем априорной информацией о принадлежности каждой выборочной единицы к той или иной страте. Для этого достаточно вести параллельный отбор из списка-основы в несколько подвыборок (по числу страт). Собственно выборочная процедура может быть и простой случайной, и систематической (соответственно мы получим либо простую, либо систематическую стратифицированную выборку).
Рассмотрим эту процедуру на примере составления систематической выборки населения, стратифицированной по этнической принадлежности. Пусть мы осуществляем выборку взрослых жителей небольшого промышленного центра, при этом полученная выборка должна отражать существующую этнодемографическую ситуацию: 80% русских, 10% украинцев и 10% представителей других национальностей. Основываясь на информации, хранящейся в паспортных столах милиции (или на избирательных списках), мы в идеальном случае можем составить полный список-основу, включающий 100000 известных административным органам постоянных жителей. Если предварительно мы предполагаем включить в нашу выборку около 1000 человек, нам нужно отобрать из картотек паспортных столов (или избирательных списков) каждого сотого. То есть доля генеральной совокупности f, включенная в выборку, составит 1/100:
f = объем выборки (и) / объем целевой совокупности (N).
Выборка объемом в 1000 человек будет включать в себя 800 русских, 100 украинцев и 100 представителей других национальностей. Причем шаг систематического отбора (К) для всех трех подсовокупностей будет равен 100.
Таким образом, мы будем выписывать из реальных картотек (списков) каждого сотого русского, каждого сотого украинца и т.п. (естественно, украинцы и представители других национальностей будут встречаться в списках в среднем в 10 раз реже русских)1.
Вес каждой единицы (респондента) в k-й страте равен отношению числа таких элементов в генеральной совокупности к объему выборки для k-й страты2, т.е.:
Выборка в описанном нами примере является пропорциональной, так как она представляет все страты в той пропорции, в которой они содержатся в генеральной совокупности.
Другой, более дешевый, метод заключается в непропорциональной стратификации, т. е. в непропорциональном отборе из различных подсовокупностей. Нередко возникает необходимость сделать «распространенные» и «редкие» страты равно представленными в выборке. Если вернуться к обсуждавшемуся выше примеру исследования городского населения, можно, в частности, представит; ситуацию, когда необходимо сравнить кулинарные предпочтения русских и украинцев. Очевидно, не вполне корректно сравнивать 800 русских и 100 украинцев. В этом случае можно прибегнуть к непропорциональному систематическому отбору из названных страт: если отбирать каждого 200-го русского и каждого 25-го украинца, мы получим две вполне сопоставимые, равные по объему, — 400 и 400 человек — подвыборки (однако эти равные подвыборки будут непропорционально репрезентировать доли соответствующих подсовокупностей, в чем можно убедиться, самостоятельно произведя подсчеты по описанным выше формулам).
Выбор между пропорциональной и непропорциональной стратификацией исследователь осуществляет, исходя из содержательных и экономических соображений.
Типические группы. В качестве типических группировок районирования могут быть использованы как естественные образования, так и специально формируемые для определенного исследования. Например, при большом географическом разбросе выборки такими группировками могут выступать экономико-географические регионы или области страны. Другим примером такого районирования может быть классификация городов по их административному статусу и по численности населения.
Группами районирования могут выступать и идеальные образования. Примером такого районирования является выделение в генеральной совокупности при исследовании отношения молодежи к труду шести групп по содержанию труда.
Признак районирования или расслоения. Признак, на основании которого производится расслоение генеральной совокупности, называется признаком расслоения или районирования. Районирование может проводиться по одному или по нескольким признакам.
Организация районированной выборки и ее типы. С точки зрения процедур отбора генеральная совокупность районированной выборки выступает как сумма типических групп. Районированный отбор иногда называют типическим.
Организация районированной выборки требует представления о характере распределения во всей совокупности тех признаков, которые должны быть положены в основу образования типических групп или выделения районов.
Неправильный выбор признака для группировки элементов генеральной совокупности может привести не к повышению репрезентативности выборочных данных, а, напротив, к ее понижению.
Организация районированной репрезентативной выборки связана на практике с известными трудностями, особенно если типические группы неравночисленны. Математическая статистика рекомендует в этих случаях, чтобы размеры различных типических групп в выборке были бы пропорциональны средним квадрати-ческим отклонениям соответствующих групп генеральной совокупности. Но дисперсии, как правило, неизвестны. Поэтому при организации репрезентативной районированной выборки отбор из типических групп генеральной совокупности производится пропорционально их размеру (доле) в общей численности совокупности.
Комбинированная выборка. Прием районирования превращает любую вероятностную выборку в комбинированную.
На основе предварительного районирования генеральной совокупности можно организовать любую вероятностную выборку из числа уже описанных: простую случайную, систематическую (механическую) или серийную (гнездовая, кластерная).
Из районированной генеральной совокупности выборочная совокупность может формироваться при помощи или только одной процедуры отбора (простой случайной серийной или систематической) — это одноступенчатая районированная выборка, или несколькими последовательными процедурами — это районированная многоступенчатая выборка. В зависимости от задач исследования и характера информации на этих ступенях могут последовательно комбинироваться уже описанные способы формирования вероятностных выборок (см. настоящую главу, 5).
Районированные выборки не обязательно имеют строго вероятностный характер.
Квотная выборка. Уже описанная квотная выборка чаще всего организуется как ступень сбора информации на основе районированной генеральной совокупности. Группами расслоения обычно выступают типы населенных пунктов. Такие выборки попользовались при опросе читательских аудиторий центральных газет 12.
Районированные выборки с отбором типичных объектов. Другим примером могут быть районированные выборки, в которых из каждой группы районирования производится не случайный отбор (по схеме простой выборки, систематической или серийной), а выбирается один типичный объект.
В современных социологических исследованиях формирование выборки из типичных объектов па основе предварительного районирования генеральной совокупности используется при выборе регионов, городов, населенных пунктов, которые в том или ином отношении являются «типичными» для более обширной территории. Типичными называют объекты, которые по большинству своих изучаемых в исследовании характеристик приближаются к сродним показателям. В рамках выборочного метода этот способ выборки почти не разработан. Это касается прежде всего расчета характеристик выборки.
Существует трудность определения типичного объекта с увеличением числа интересующих исследователя признаков: средние по одним показателям, они не будут средними по другим.
Таким образом, районированная выборка при прочих равных условиях дает более точные результаты.
1.Гнездовая (серийная, кластерная) выборка. «Кластеры» (дословно с англ. cluster — гроздь, группа) — это естественные группировки единиц наблюдения. Здесь отбираются не люди, а группы. Группы отбираются случайным образом, а внутри них проводится сплошной опрос. Например, в ВУЗе с большим количеством студенческих групп отбор можно проводить путем случайного отбора этих групп и дальнейшего сплошного опроса в этих группах.
Сначала изучаемая совокупность делится на взаимоисключающие и взаимодополняющие подгруппы, называемые кластерами. Затем с помощью вероятностного метода выборки, такого как простая случайная выборка, отбираются кластеры. В выборку включаются либо все элементы отобранного кластера, либо проводится их отбор вероятностным методом.
Корректное применение кластерной процедуры основано на неукоснительном соблюдении четырех необходимых условий:
1) кластеры должны быть однозначно и явно заданы: каждый член генеральной совокупности должен принадлежать к одному (и только одному) кластеру;
2) число членов генеральной совокупности, входящих в каждый кластер, должно быть известно или поддаваться оценке с приемлемой степенью точности;
3) кластеры должны быть не слишком велики и географически компактны, иначе кластерная выборка теряет всякий финансовый смысл;
4) выбор кластеров должен быть осуществлен таким способом, который минимизирует рост выборочной ошибки (последний процесс, в свою очередь, является неизбежным следствием кластеризации).
Серийная выборка может организовываться по схемам простой случайной и систематической выборок. Наконец, она может формироваться после предварительного районирования генеральной совокупности.
В первых двух случаях к информации о генеральной совокупности — основе выборки — предъявляются те же требования, что и для всех вероятностных выборок: размещение элементов генеральной совокупности (серий) не должно быть каким-либо образом систематизировано. Серийная выборка может быть использована, например, для изучения семьи, выпускных классов школ в репрезентативных локальных исследованиях или в качестве последней ступени комбинированной выборки в географических точках, включенных в выборку.
Основное различие между кластерной и стратифицированной выборкой состоит в том, что в первом случае используются только отобранные подгруппы (кластеры), в то время как в стратифицированной выборке все подгруппы (слои) используются для дальнейшего отбора. Эти методы преследуют разные цели. Цель кластерной выборки — увеличить эффективность выборки, уменьшив затраты на ее проведение. Цель стратифицированной выборки — увеличение точности. По однородности и неоднородности критерии формирования кластеров прямо противоположны критериям формирования слоев. Элементы кластера должны быть максимально разнородны, а сами кластеры — как можно более однородными. В идеале каждый кластер должен представлять собой небольшую модель генеральной совокупности. При кластерной выборке основа выборочного наблюдения необходима только для кластеров, которые вошли в выборку.
Главное достоинство этого типа отбора в том, что он гораздо проще в организационном плане. Действительно, гораздо проще выбрать несколько групп и опросить их целиком, чем бегать за каждым респондентом. Это дает нам выигрыш в средствах и во времени.
Но при этом необходимо следить, чтобы количество групп в генеральной совокупности было достаточно большим, иначе ни о каком принципе случайности не может быть и речи. Более того, возможны перекосы из-за того, что на момент опроса не удается застать всех членов группы. К тому же объем выборки при гнездовом отборе обычно больше, чем при случайном отборе.
В принципе можно показать, что рост выборочной ошибки для кластерной выборки (в сравнении с простой случайной) является функцией двух нерешенных проблем — величины кластеров и гомогенности (гетерогенности) исследуемого признака внутри каждого кластера
Распространенная форма кластерной выборки — территориальная выборка (area sampling), в которой кластеры состоят из географических территорий, таких как округа, жилые районы или кварталы. Если отбор основных элементов проводится в один этап (например, исследователь выбирает некоторые кварталы, а затем все семьи, живущие в этих кварталах, включаются в выборку), такой выборочный метод называется одноступенчатой территориальной выборкой. Если отбор основных элементов проводится в два (или больше) этапа (исследователь выбирает кварталы, а затем в каждом таком квартале отбирает семьи, которые будут включены в выборку), такой метод называется двухступенчатой (или многоступенчатой) территориальной выборкой. Отличительная черта одноступенчатой территориальной выборки заключается в том, что все семьи из выбранных кварталов (или географических регионов) включаются в выборку.
Метод маршрутного опроса (как вариация территориальной выборки). Этот метод социологи часто используют, когда единицей наблюдения выступает семья.
В выборочную совокупность, например, намечено включить определенное число случайно отобранных семей уили квартир. На карте города или населенного пункта нумеруются все улицы. С помощью таблицы случайных чисел отбираются большие числа, которые позволят идентифицировать семьи или квартиры, попавшие в выборку. Каждое большое число рассматривается как состоящее из трех компонентов: первые две или три цифры в нем указывают на номер улицы, следующая цифра — номер дома, последняя цифра — номер квартиры в выбранном доме.
Например, число 42—25—3 указывает на квартиру № 3 (можно этой же цифре приписать все десятки в пределах сотни: или 13, или 23 и т. д.) дома № 25 (возможно также 125, если улицы очень длинны) на 42-й улице.
Организация серийной выборки методом маршрутного опроса наиболее приспособлена к городам, где преобладают отдельные квартиры, или к населенным пунктам, где еще сохраняется частное домовладение (в последнем случае отпадает необходимость выбирать номер квартиры).