Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Л5_Выборка.doc
Скачиваний:
86
Добавлен:
26.08.2019
Размер:
295.42 Кб
Скачать
  1. Вероятностные способы формирования выборочной совокупности

Строгое обоснование выборки как модели генеральной совокупности и степени ее репрезентативности — все это в "полной мере осуществимо только для вероятностных (случайных) выборок.

Понятие случайного способа формирования выборочной сово­купности нельзя понимать в обыденном значении этого слова, ибо случайная выборка предполагает определенные процедуры ее организации и предъявляет социологу определенные тре­бования.

Существует ряд приемов формирования выборочных совокуп­ностей, которые строятся по подобию вероятностных, но для которых нельзя строго обосновать, что выборочные характеристики выступают оценками соответствующих характеристик генераль­ной совокупности. Такие выборки можно назвать эмпирическими, так как они не имеют теоретического вероятностного обоснования.

Основная цель выборочного исследования — сформировать репрезентативную выборку. Для этого необходимо обеспечить всем элементам генеральной сово­купности равные возможности- попасть в выборку. При этих условиях элементы генеральной совокупности оказываются пред­ставленными в выборке с вероятностями, которые приближаются к их распределению в генеральной совокупности. Объекты, которые чаще встречаются в генеральной совокупности, чаще будут преоб­ладать и в выборке. Такой результат является проявлением дей­ствия закона больших чисел. Именно подобные типы выборок, воспроизводящие закон распределения генеральной совокупно­сти, получили название вероятностных.

Различают следующие виды вероятностной выборки: простую, систематическую и серийную («гнездовую»).

  1. Простая вероятностная выборка.

Собственно случайная выборка лежит в основе всех остальных типов выборки, которые будут рассмотрены далее.

Выборка называется собственно случайной, если при извлечении выборки объема n все возможные комбинации из n элементов, которые могут быть получены из генеральной совокупности объема N, имеют равную вероятность быть извлеченными.

По определению, при собственно случайной выборке выполняется принцип случайности.

Отбор производится с помощью жеребьевки, таблицы (либо генератора) случайных чисел. Главный принципслучайность, т.е. все единицы генеральной совокупности имеют равную вероятность попасть в выборочную совокупность. Другие принципы:

  1. Принцип жеребьевки. Каждый элемент генеральной совокупности заносится на бумажку (это могут быть фамилии, адреса, просто номера (в этом случае выпавшие номера ставят в соответствие с людьми в списках) и т.д.), затем бумажки помещаются в барабан, перемешиваются и не глядя вытаскиваются.

  2. Принцип таблицы случайных чисел. Начиная с любого места таблицы, берем четыре следующих друг за другом числа. Эти числа и будут номерами людей в списке, которых следует отобрать в выборку (числа, превышающие численность генеральной совокупности, опускаются).

  3. Принцип генератора случайных чисел. Это то же самое, что и таблицы случайных чисел, только числа вырабатываются компьютером (для этого существует специальная программа).

Процедура построения простой случайной выборки включает в себя следую­щие шаги.

  1. Во-первых, нужно получить полный список членов генеральной совокупности и пронумеровать этот список. Такой список, напомним, называется основой выборки.

  2. Во-вторых, следует определить предполагаемый объем выборки, т. е. ожидае­мое число опрошенных.

  3. В-третьих, нужно извлечь из таблицы случайных чисел (либо с помощью генератора случайных чисел) столько чисел, сколько нам требуется выборочных единиц. Если в выборке должно ока­заться 100 человек, из таблицы берут 100 случайных чисел.

  4. В-четвертых, нужно выбрать из списка-основы те наблюдения, но­мера которых соответствуют выписанным случайным числам1.

Различают повторную и бесповторную выборку.

Простая повторная выборка. На карточки наносятся номе­ра респондентов. Карточки перемешиваются. Вслепую вынимается карточка, записывается ее помер, затем карточка возвра­щается в колоду, и карточки снова перемешиваются. Эта операция называется повторным отбором. Сама процедура повторной выборки почти не используется для социологических исследований, и возможное дублирование единиц отбора для многих программ социологического исследова­ния равносильно сокращению намеченного объема выборки. При повторном отборе каждый выбранный элемент возвращается в ГС.

Простая бесповторная выборка. При бесповторном отборе выбранный элемент не возвращается в ГС2. Респонденты отбираются как и при простой повторной выборке, но отобранные карточки не возвращаются в колоду, а откладываются в сторону.

Плюсом простого случайного отбора является полное соблюдения принципа случайности и, как следствие – избежание систематических ошибок.

Случайная выборка обладает рядом недостатков, которые затрудняют ее применение на практике. Эти недостатки можно представить в трех пунктах:

  1. Необходимость наличия списка элементов генеральной совокупности. Обычно элементами генеральной совокупности являются люди; в этом случае в качестве списка могут выступать адреса, телефоны и т.д. Трудность здесь заключается в том, что получить такой список далеко не всегда представляется возможным. Следовательно, в тех случаях, когда невозможно получить список элементов генеральной совокупности, невозможно проводить и случайный отбор.

  2. Сложность проведения опроса. Процедура опроса при случайном отборе является очень громоздкой и требующей много времени. Ведь в результате случайного отбора исследователь получает на выходе список фамилий респондентов (телефонов, адресов и т.д.), которых необходимо опросить. Иными словами, интервьюерам приходится «бегать» за каждым респондентом и добиваться от него согласия ответить на «парочку вопросов».

Осложняет дело и то, что респондентов порой бывает не так просто достать; в случае отсутствия респондента его приходится посещать по нескольку раз (по крайней мере не менее трех раз).

Все вышеперечисленное ведет к повышенным временным затратам на проведение опроса. Временные затраты можно уменьшить только благодаря привлечению дополнительных интервьюеров, т.е. только за счет дополнительных денежных расходов. Помимо этого возникает еще так называемая проблема неответивших.

  1. Сравнительно большой объем выборки. Для получения результатов со сравнительно высокой степенью точности собственно случайный отбор требует достаточно большого объема выборки по сравнению с другими видами отбора. Другими словами, случайный отбор обладает меньшей степенью точности, что, в конечном счете, является причиной его меньшей эффективности1.

Довольно часто исследователь сталкивается с ситуацией, когда временные и финансовые затраты на осуществление простой случайной выборки становятся неприемлемо высокими. Наиболее ра­зумным выходом здесь является использование других, «компромиссных», про­цедур случайного отбора. Часто используются различные методы моделирования случайности.

Использование различных типов случайного отбора позволяет несколько сгладить некоторые из вышеупомянутых трудностей, возникающих при проведении собственно случайного отбора. Например, некоторые типы случайного отбора позволяют упростить организацию опроса, но главное – это то, что они увеличивают эффективность выборки.

Так при случайном отборе ошибка выборки контролируется только за счет изменения объема выборки. В рассматриваемых же нами типах случайного отбора эффективность выборки можно повысить за счет моделирования выборки без увеличения ее объема.

Под моделированием выборки понимается проведение случайного опроса с учетом информации о генеральной совокупности. Это означает, что по некоторым параметрам составляется модель генеральной совокупности для того, чтобы уже на стадии, предшествующей стадии случайного отбора, повысить соответствие этих параметров в выборке и генеральной совокупности2.

Однако модификации случайного отбора не могут преодолеть всех трудностей, связанных со случайной выборкой. Это связано с тем, что все они являются разновидностями именно случайного отбора и в них используется принцип случайности.

Из этого следует, что проводить любой случайный отбор невозможно без списка элементов генеральной совокупности. Более того, большинство типов случайного отбора приводят к тем же трудностям при организации опроса, что и при собственно случайной выборке. Главное, чего достигают эти модификации случайного отбора, так это увеличения точности выборки.

Однако при формальном сходстве с собственно случайной выборкой, любая ее вариация есть все же некоторое отклонение от принципа случайности. Эти отклонения могут приводить к систематическим ошибкам, которые невозможны при собственно случайной выборке. Теперь непосредственно перейдем к рассмотрению типов случайного отбора.

2. Механическая (или систематическая вероятностная) выборка — это упрощенный вариант вероятностного отбора. Систематическая выборка по качеству часто приближается к простой случай­ной. Систематическая выборка, как и простая случайная, требует полного списка или заданного упорядочения совокупности (различные алфавитные списки, картотеки учреждений, книги жильцов в до­моуправлении). Техника осуществления систематического отбора элементарна: сначала случайным образом отбирается первая единица, затем отбору подлежит каждый kэлемент. Число k в данном случае называют шагом выборки. Можно, например, отбирать каждый 25-й или каждый 200-й элемент. Чтобы определить шаг отбора, нужно поделить изве­стный объем генеральной совокупности (N) на предполагаемый объем вы­борки (n).

(k) .

Начало отбора выбирается случайным образом в пределах шага выборки. Например, если шаг выборки равен 20, то начинать отбор надо с любого числа от 1 до 20.

Не существует никаких априорных статистических или социо­логических правил для определения объема имеющейся информа­ции. Единственное общее правило заключается в том, что чем более статистически однородна генеральная совокупность, тем объем выборки может быть меньше; чем меньше информации о ха­рактере генеральной совокупности, тем больше должен быть объем выборки.

Пусть, например, нужно отобрать 200 человек из 20000 владельцев телефонов:

1) определим шаг отбора: N/n = 20000 : 200 = 100;

2) с помощью таблицы случайных чисел найдем первую выборочную еди­ницу. Если, скажем, выпал номер «053», то из списка владельцев телефонов выпишем того, кто значится под этим номером;

3) с установленным шагом отбираем номера: 153, 253, 353, 453 и т. д. до исчерпания списка.

Выбор величины k зависит от характера поставленной пробле­мы. Предположим, что основой выборки является пронумерован­ный список школ данного города от 1 до 100. Если исследователя интересует соотношение мальчиков и девочек в выпускных клас­сах, то достаточно взять k =20 (п = 5), а если исследуется профессиональная ориентация школьников, то может оказаться слишком большим и k = 10 (га == 10). Это объясняется тем, что во втором случае поднимается более сложная задача, ее изучение зависит от большого числа воздействующих факторов, а значит — больше вариаций.

Допустим, что часть школ расположена в типичном заводском районе. Тогда профессиональная ориентация школьников, воз­можно, окажется в нем отличной от профессиональной ориентации в школах, расположенных в центре города. В большинстве иссле­дований k берется равным 10, хотя определение интервала чаще всего зависит от размера генеральной совокупности и намеченного размера выборки.

Иногда генеральная совокупность (и соответственно основа выборки) слиш­ком велика либо исследователю известен не полный список, а лишь правило упорядочения элементов в генеральной совокупности. Предположим, что мы хотим составить представление о весе и формате книг, содержащихся в некой библиотеке, при том, что мы не располагаем полным каталогом, а лишь видим, как книги расставлены на стеллажах. При условии, что объем библиотечного собрания нам приблизительно известен, мы можем воспользоваться процеду­рой систематического отбора и отобрать, скажем, каждую 55-ю книгу. Очень важно отобрать «стартовую» единицу сугубо случайным образом. Именно в этом пункте кроется основная слабость систематического отбора. Если в способе упорядочения единиц совокупности имеет место некая цикличность, т. е. неиз­вестная нам «система» (систематический паттерн), а случайность в выборе «старта» должным образом не обеспечена, то полученная выборка может так­же оказаться смещенной (если о систематическом паттерне мы знаем заранее, то он не представляет собой угрозы валидности и может быть учтен в ходе отбора). Если воспользоваться примером с отбором книг в библиотеке, то легко представить себе такую гипотетическую ситуацию: исследователь выбирает в качестве стартовой первую книгу на нижней полке ближайшего стеллажа и далее двигается с шагом 250 единиц. Если на каждом стеллаже размещается около 500 книг, то приблизительно половина его выборки будет взята с нижних полок. Однако известно, что на нижних полках многих библиотек нередко раз­мещают книги больших форматов — художественные альбомы, атласы и т. п. Если в нашем примере это правило упорядочения будет соблюдено хотя бы в половине случаев (т. е. половина нижних полок будет отведена под «неформат­ные» издания, под так называемые фолио), любые выборочные оценки «направ­ленности» библиотечного собрания или формата представленных в нем книг окажутся невалидными.

Аналогией примеру с библиотечными книгами мо­жет служить случай систематической выборки городских квартир. Если в ре­зультате осуществляемого непосредственно «в поле» интервьюерами система­тического отбора в выборке будут сверхпредставлены квартиры, расположен­ные на первых и последних этажах, возникнет систематическая выборочная ошибка. На первых и последних этажах в российских городах часто живут люди из групп, имеющих более низкий социально-экономический статус и соответственно ограниченные финансовые ресурсы: квартиры, расположенные на «крайних» этажах и соприкасающиеся с системами коммунального водо- и теп­лоснабжения, обычно стоят дешевле, так как названные системы в России тра­диционно являются источником неприятностей и дисфункций в структуре жиз­необеспечения.

Систематическая выборка является экономным и удобным спо­собом формирования выборочной совокупности, хотя следует учи­тывать возможность систематического распределения в списках единиц различного типа, повторяемости в их распределении, ко­торая может совпадать с величиной интервала отбора, равной k.

Проиллюстрируем это положение. При составлении основы выборки для опроса рабочих в одном из цехов завода выбранный интервал k может совпасть с числом рабочих в бригаде, в списке которой первым окажется бригадир. Поэтому при выборе интер­вала отбора, который совпадает со скрытой периодичностью в ге­неральной реальной совокупности, выборка может оказаться полностью смещенной. Опасность в данном случае состоит в том, что можно отобрать только одних бригадиров.

Таким образом, если при систематическом отборе в генераль­ной совокупности существует какой-либо определенный порядок размещения ее единиц (расположение их по возрастанию или убы­ванию изучаемого признака), возникает опасность систематической ошибки.

Выборка может оказаться смещенной в том случае, если, напри­мер, ее основой является платежная ведомость, в которой лица расположены в порядке возрастания размера заработной платы. В этом случае выборка из начала списка приводит к занижению средней величины заработной платы и к преуменьшению величины средней ошибки выборки. Отбор из конца списка приводит к их завышению.

Возможности и ограничения систематической выборки. Си­стематическая выборка часто применяется при проведении кон­кретных социологических исследований. Этот способ выборки лучше всего использовать при более или менее однородной гене­ральной совокупности. В связи с этим систематическая выборка часто используется в качестве последней, завершающей ступени отбора в сложных выборках.

  1. Стратифицированная (районированная) выборки. Вероятностная выборка с любой техникой отбора (простая вероятностная, систематическая, серийная и даже многоступенчатая) становится районированной, если процедурам отбора единиц наблюдения предшествует раз­деление генеральной совокупности на однородные части.

В статистическом смысле районирование соответствует выде­лению такого числа и таких статистически однородных групп, чтобы колебаемость изучаемых признаков внутри их была меньше, чем между ними. Это и свидетельствует (с формальной стороны) о качественном районировании.

Эта дифференциация внутри генеральной совокупности на качественно более однородные группы содержательно связана с предметом исследования.

Необходимость районирования вызвана сложной структурой социальных объектов.

Районирование совокупности оказывается необходимым во всех случаях, когда она является неоднородной с точки зрения социальных, экономических и других характеристик, формирую­щих ее социальных объектов.

Например, чтобы избежать совпадений цикличности, которая могла встретиться в уже приведенных примерах (отбор бригадиров или по ведомостям заработной платы), можно всех бригадиров данного цеха или лиц, получающих одинаковую заработную пла­ту, выделить в отдельные группы и в каждой из этих групп про­изводить случайный отбор. Такая выборка, предусматривающая предварительное разделение генеральной совокупности на содержательные сходные группы (страты), и является примером районированной выборки.

Так, исследуя профессиональную ориентацию школьников в пределах одного города, можно в одну группу отнести 16 школ, расположенных в заводском районе, во вторую — 20 школ, рас­положенных в центральной части города, в третью — 64 школы, расположенные в остальных его частях, где население в основном занято малоквалифицированным трудом. Для опроса можно отоборать выпускников из двух школ первой группы, двух школ из второй группы и двух — из третьей. Если такая группировка школ действительно отражает различия районов по их расположению, которые существенно учитывать в исследовании, например раз­личие социально-профессиональной структуры населения, то колеблемость изучаемых признаков внутри каждой группы школ должна быть меньше, чем между группами. Тогда несмотря на от­носительное уменьшение доли представительства третьей группы репрезентативность выборки не уменьшается.

Применительно к стратифицированному отбору часто высказывают все те не­верные и предрассудочные мнения, которые в начале XX века высказывались относительно квотной выборки (см. ниже) и ее воображаемых преимуществ перед случайным отбором. В действительности стратифицированный отбор име­ет определенные практические преимущества до тех пор, пока сохраняется его вероятностный, случайный характер. Как только стратифицированная выборка превращается в более или менее специально отобранную квотную выборку, воспроизводящую некоторые известные пропорции генеральной совокупности (например, 51% женщин, 30% горожан и т. п.), любые статистические, т. е. стро­гие, оценки параметров генеральной совокупности становятся невозможными.

Стратификацией, строго говоря, называют процедуру, при которой отбор осу­ществляют как бы из нескольких «параллельных» подсовокупностей, заданных на одной и той же генеральной совокупности. Это абстрактное определение можно прояснить с помощью примера. Пусть у нас есть генеральная совокуп­ность взрослых горожан, относительно которой мы располагаем какой-то су­щественной с точки зрения исследовательских гипотез информацией. Наличие такой предварительной информации — необходимое условие стратифициро­ванного отбора. Предположим, мы знаем, что в генеральной совокупности 60% рабочих и 40% служащих. Это соотношение может оказаться весьма суще­ственным с точки зрения наших исследовательских гипотез, если оно задает одну из независимых переменных, как, например, при изучении влияния рода занятий на частоту посещения футбольных матчей. Даже при отсутствии зна­чительной систематической погрешности небольшие смещения в реализации случайной выборочной процедуры могут привести к ситуации, когда в нашей конкретной выборке соотношение рабочих и служащих будет существенно (на 5—7%) отклоняться от ожидаемой «правильной» пропорции, имеющей место в генеральной совокупности (см. обсуждение нормальной кривой и индук­тивного статистического вывода в гл. 8). Соответственно под угрозой окажется точность наших оценок взаимосвязи между главной независимой переменной (профессиональным статусом) и интересом к футболу. Такого рода неточность может быть устранена при использовании еще одной случайной выборки из генеральной совокупности, но здесь вступают в силу экономические соображе­ния, так как исследовательский бюджет обычно ограничен. В описанной ситу­ации желательно заранее обеспечить представленность обеих интересующих нас групп, т. е. страт, сохранив вероятностный характер отбора. Этого можно добиться, если осуществить некую независимую процедуру случайного отбора для каждой социальной группы в отдельности (в нашем примере для рабочих и служащих) и затем объединить полученные случайные подвыборки в одну (за­метьте, что для нашего примера объем подвыборки рабочих, в согласии с зара­нее известной пропорцией, будет в 1,5 раза больше объема подвыборки служа­щих). Полученная в результате выборка будет и стратифицированной (по про­фессиональному статусу), и вероятностной.

На практике две случайные процедуры отбора в подвыборки-страты можно тех­нически объединить в одну, если мы располагаем априорной информацией о принадлежности каждой выборочной единицы к той или иной страте. Для это­го достаточно вести параллельный отбор из списка-основы в несколько подвыборок (по числу страт). Собственно выборочная процедура может быть и про­стой случайной, и систематической (соответственно мы получим либо про­стую, либо систематическую стратифицированную выборку).

Рассмотрим эту процедуру на примере составления систематической выборки населения, стратифицированной по этнической принадлежности. Пусть мы осуществляем выборку взрослых жителей небольшого промышленного центра, при этом полученная выборка должна отражать существу­ющую этнодемографическую ситуацию: 80% русских, 10% украинцев и 10% представителей других национальностей. Основываясь на информа­ции, хранящейся в паспортных столах милиции (или на избирательных списках), мы в идеальном случае можем составить полный список-осно­ву, включающий 100000 известных административным органам постоян­ных жителей. Если предварительно мы предполагаем включить в нашу выборку около 1000 человек, нам нужно отобрать из картотек паспортных столов (или избирательных списков) каждого сотого. То есть доля генеральной совокупности f, включенная в выборку, составит 1/100:

f = объем выборки (и) / объем целевой совокупности (N).

Выборка объемом в 1000 человек будет включать в себя 800 русских, 100 украинцев и 100 представителей других национальностей. Причем шаг систематического отбора (К) для всех трех подсовокупностей будет равен 100.

Таким образом, мы будем выписывать из реальных картотек (списков) каж­дого сотого русского, каждого сотого украинца и т.п. (естественно, украинцы и представители других национальностей будут встречаться в спис­ках в среднем в 10 раз реже русских)1.

Вес каждой единицы (респон­дента) в kстрате равен отношению числа таких элементов в генеральной со­вокупности к объему выборки для k-й страты2, т.е.:

Выборка в описанном нами примере является пропорциональной, так как она представляет все страты в той пропорции, в которой они содержатся в гене­ральной совокупности.

Другой, более дешевый, метод заключается в непропорциональной стратификации, т. е. в непропорциональном отборе из различных подсовокупностей. Нередко возникает необходимость сделать «распространенные» и «редкие» страты равно представленными в выборке. Если вернуться к обсуждавшемуся выше примеру исследования городского населения, можно, в частности, представит; ситуацию, когда необходимо сравнить кулинарные предпочтения русских и ук­раинцев. Очевидно, не вполне корректно сравнивать 800 русских и 100 украин­цев. В этом случае можно прибегнуть к непропорциональному систематичес­кому отбору из названных страт: если отбирать каждого 200-го русского и каж­дого 25-го украинца, мы получим две вполне сопоставимые, равные по объему, — 400 и 400 человек — подвыборки (однако эти равные подвыборки будут непропорционально репрезентировать доли соответствующих подсовокупностей, в чем можно убедиться, самостоятельно произведя подсчеты по описанным выше формулам).

Выбор между пропорциональной и непропорциональной стратификацией ис­следователь осуществляет, исходя из содержательных и экономических сооб­ражений.

Типические группы. В качестве типических группировок районирования могут быть использованы как естественные обра­зования, так и специально формируемые для определенного ис­следования. Например, при большом географическом разбросе выборки такими группировками могут выступать экономико-геогра­фические регионы или области страны. Другим примером такого районирования может быть классификация городов по их админи­стративному статусу и по численности населения.

Группами районирования могут выступать и идеальные обра­зования. Примером такого районирования является выделение в генеральной совокупности при исследовании отношения моло­дежи к труду шести групп по содержанию труда.

Признак районирования или расслоения. Признак, на основа­нии которого производится расслоение генеральной совокупно­сти, называется признаком расслоения или районирования. Районирование может проводиться по одному или по нескольким признакам.

Организация районированной выборки и ее типы. С точки зрения процедур отбора генеральная совокупность районирован­ной выборки выступает как сумма типических групп. Районирован­ный отбор иногда называют типическим.

Организация районированной выборки требует представления о характере распределения во всей совокупности тех признаков, которые должны быть положены в основу образования типических групп или выделения районов.

Неправильный выбор признака для группировки элементов генеральной совокупности может привести не к повышению репрезентативности выборочных данных, а, напротив, к ее по­нижению.

Организация районированной репрезентативной выборки свя­зана на практике с известными трудностями, особенно если типи­ческие группы неравночисленны. Математическая статистика ре­комендует в этих случаях, чтобы размеры различных типических групп в выборке были бы пропорциональны средним квадрати-ческим отклонениям соответствующих групп генеральной сово­купности. Но дисперсии, как правило, неизвестны. Поэтому при организации репрезентативной районированной выборки отбор из типических групп генеральной совокупности производится пропорционально их размеру (доле) в общей численности совокуп­ности.

Комбинированная выборка. Прием районирования превращает любую вероятностную выборку в комбинированную.

На основе предварительного районирования генеральной сово­купности можно организовать любую вероятностную выборку из числа уже описанных: простую случайную, систематическую (механическую) или серийную (гнездовая, кластерная).

Из районированной генеральной совокупности выборочная со­вокупность может формироваться при помощи или только одной процедуры отбора (простой случайной серийной или систе­матической) — это одноступенчатая районированная выборка, или несколькими последовательными процедурами — это районирован­ная многоступенчатая выборка. В зависимости от задач исследо­вания и характера информации на этих ступенях могут последова­тельно комбинироваться уже описанные способы формирования вероятностных выборок (см. настоящую главу, 5).

Районированные выборки не обязательно имеют строго вероят­ностный характер.

Квотная выборка. Уже описанная квотная выборка чаще всего организуется как ступень сбора информации на основе райони­рованной генеральной совокупности. Группами расслоения обычно выступают типы населенных пунктов. Такие выборки попользо­вались при опросе читательских аудиторий центральных газет 12.

Районированные выборки с отбором типичных объектов. Дру­гим примером могут быть районированные выборки, в которых из каждой группы районирования производится не случайный отбор (по схеме простой выборки, систематической или серийной), а выбирается один типичный объект.

В современных социологических исследованиях формирование выборки из типичных объектов па основе предварительного райо­нирования генеральной совокупности используется при выборе регионов, городов, населенных пунктов, которые в том или ином отношении являются «типичными» для более обширной терри­тории. Типичными называют объекты, которые по большинству своих изучаемых в исследовании характеристик приближаются к сродним показателям. В рамках выборочного метода этот способ выборки почти не разработан. Это касается прежде всего расчета характеристик выборки.

Существует трудность определения типичного объекта с увеличением числа интересующих исследователя признаков: средние по одним показателям, они не будут средними по другим.

Таким образом, райони­рованная выборка при прочих равных условиях дает более точные результаты.

1.Гнездовая (серийная, кластерная) выборка. «Кластеры» (дословно с англ. cluster — гроздь, группа) — это естествен­ные группировки единиц наблюдения. Здесь отбираются не люди, а группы. Группы отбираются случайным образом, а внутри них проводится сплошной опрос. Например, в ВУЗе с большим количеством студенческих групп отбор можно проводить путем случайного отбора этих групп и дальнейшего сплошного опроса в этих группах.

Сначала изучаемая совокупность делится на взаимоисключающие и взаимодополняющие подгруппы, называемые кластерами. Затем с помощью вероятностного метода выборки, такого как простая случайная выборка, отбираются кластеры. В выборку включаются либо все элементы отобранного кластера, либо проводится их отбор вероятностным методом.

Корректное применение кластерной процедуры основано на неукоснительном соблюдении четырех необходимых условий:

1) кластеры должны быть однозначно и явно заданы: каждый член гене­ральной совокупности должен принадлежать к одному (и только одному) кластеру;

2) число членов генеральной совокупности, входящих в каждый кластер, должно быть известно или поддаваться оценке с приемлемой степенью точности;

3) кластеры должны быть не слишком велики и географически компактны, иначе кластерная выборка теряет всякий финансовый смысл;

4) выбор кластеров должен быть осуществлен таким способом, который минимизирует рост выборочной ошибки (последний процесс, в свою оче­редь, является неизбежным следствием кластеризации).

Серийная выборка может организовываться по схемам простой случайной и систематической выборок. Наконец, она может формироваться после предварительного районирования генеральной совокупности.

В первых двух случаях к информации о генеральной совокуп­ности — основе выборки — предъявляются те же требования, что и для всех вероятностных выборок: размещение элементов генеральной совокупности (серий) не должно быть каким-либо образом систематизировано. Серийная выборка может быть ис­пользована, например, для изучения семьи, выпускных классов школ в репрезентативных локальных исследованиях или в каче­стве последней ступени комбинированной выборки в географиче­ских точках, включенных в выборку.

Основное различие между кластерной и стратифицированной выборкой состоит в том, что в первом случае используются только отобранные подгруппы (кластеры), в то время как в стратифицированной выборке все подгруппы (слои) используются для дальнейшего отбора. Эти методы преследуют разные цели. Цель кластерной выборки — увеличить эффективность выборки, уменьшив затраты на ее проведение. Цель стратифицированной выборки — увеличение точности. По однородности и неоднородности критерии формирования кластеров прямо противоположны критериям формирования слоев. Элементы кластера должны быть максимально разнородны, а сами кластеры — как можно более однородными. В идеале каждый кластер должен представлять собой небольшую модель генеральной совокупности. При кластерной выборке основа выборочного наблюдения необходима только для кластеров, которые вошли в выборку.

Главное достоинство этого типа отбора в том, что он гораздо проще в организационном плане. Действительно, гораздо проще выбрать несколько групп и опросить их целиком, чем бегать за каждым респондентом. Это дает нам выигрыш в средствах и во времени.

Но при этом необходимо следить, чтобы количество групп в генеральной совокупности было достаточно большим, иначе ни о каком принципе случайности не может быть и речи. Более того, возможны перекосы из-за того, что на момент опроса не удается застать всех членов группы. К тому же объем выборки при гнездовом отборе обычно больше, чем при случайном отборе.

В принципе можно показать, что рост выборочной ошибки для кластер­ной выборки (в сравнении с простой случайной) является функцией двух нере­шенных проблемвеличины кластеров и гомогенности (гетерогенности) исследуемого признака внутри каждого кластера

Распространенная форма кластерной выборки — территориальная выборка (area sampling), в которой кластеры состоят из географических территорий, таких как округа, жилые районы или кварталы. Если отбор основных элементов проводится в один этап (например, исследователь выбирает некоторые кварталы, а затем все семьи, живущие в этих кварталах, включаются в выборку), такой выборочный метод называется одноступенчатой территориальной выборкой. Если отбор основных элементов проводится в два (или больше) этапа (исследователь выбирает кварталы, а затем в каждом таком квартале отбирает семьи, которые будут включены в выборку), такой метод называется двухступенчатой (или многоступенчатой) территориальной выборкой. Отличительная черта одноступенчатой территориальной выборки заключается в том, что все семьи из выбранных кварталов (или географических регионов) включаются в выборку.

Метод маршрутного опроса (как вариация территориальной выборки). Этот метод социологи часто ис­пользуют, когда единицей наблюдения выступает семья.

В выборочную совокупность, например, намечено включить определенное число случайно отобранных семей уили квартир. На карте города или населенного пункта нумеруются все улицы. С помощью таблицы случайных чисел отбираются большие числа, которые позволят идентифицировать семьи или квартиры, попав­шие в выборку. Каждое большое число рассматривается как со­стоящее из трех компонентов: первые две или три цифры в нем указывают на номер улицы, следующая цифра — номер дома, последняя цифра — номер квартиры в выбранном доме.

Например, число 42—25—3 указывает на квартиру № 3 (можно этой же цифре приписать все десятки в пределах сотни: или 13, или 23 и т. д.) дома 25 (возможно также 125, если улицы очень длинны) на 42-й улице.

Организация серийной выборки методом маршрутного опроса наиболее приспособлена к городам, где преобладают отдельные квартиры, или к населенным пунктам, где еще сохраняется част­ное домовладение (в последнем случае отпадает необходимость выбирать номер квартиры).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]