
- •Глава I
- •Глава II ошибки репрезентативности
- •Глава III случайная выборка
- •Глава IV районированная выборка*
- •Глава V многоступенчатая выборка
- •Метод типичных единиц в многоступенчатой выборке
- •Глава VI неслучайные методы отбора
- •Основные принципы квотного отбора
- •Глава VII формирование объекта исследования
- •Глава VIII
- •Причины смещения результатов почтового опроса
- •Глава IX проблемы многофазной выборки
- •6 И более 4
Глава IV районированная выборка*
Пути модификации собственно-случайной выборки
До сих пор в основном речь шла о случайной выборке в ее «чистом» варианте, о так называемой собственно-случайной выборке, предполагающей наличие единого, не преобразованного каким-либо образом списка всех единиц генеральной совокупности и отборе с помощью различных процедур единиц наблюдения из этого списка.
Теория и практика выборочного метода, однако, показала, что собственно-случайную выборку применяют сравнительно редко, так как, с одной стороны, ее можно в большинстве случаев заметно улучшить, исходя из экономических критериев, а с другой стороны, во многих ситуациях ее нельзя использовать. Заметим в то же время, что использование именно собственно-случайной выборки предрешено тогда, когда исследователь не располагает никакой информацией о структуре генеральной совокупности и когда информация о единицах исследования может быть получена только в процессе самого обследования.
Основные модификации случайной выборки, позволяющие заметно повысить ее экономическую эффективность и расширить сферу ее применения, связаны с районированием (или стратификацией) выборки и с применением многоступенчатого гнездового отбора.
Прогресс в применении выборочного метода в социологии, экономике потребовал предварительного (или априорного) на основе накопленной ранее информации изучения объекта исследования. Априорное описание объекта предполагает выделение и анализ структуры отдельных сегментов в изучаемой совокупности (страты, гнез-
68
да), выяснение характера связей между отдельными признаками, характеризующими эту совокупность.
Предварительное изучение объекта исследования начало осуществляться одновременно с 'внедрением выборочного метода в науке. Однако описание объекта 'выделилось 'в 'специальную стадию при проектировании выборки 'сравнительно недавно. Теперь стала особенно очевидной целесообразность увеличения затрат на стадии описания объекта для повышения экономической эффективности выборки в целом (уменьшение общих затрат на выборку при одной 'и той же точности или 'повышение точности при данной величине затрат).
В конечном счете все модификации случайной выборки опираются на известную теорему о сложении дисперсии. Согласно этой теореме общая дисперсия может быть расчленена на отдельные компоненты, например на межгрупповую (или межгнездовую) и внутригрупповую (или внутригнездовую) дисперсии:
картинка
Улучшение случайной выборки в рамках первой модификации означает, что ошибка уменьшается в первую очередь за счет сведения к нулю 'влияния на ошибку первой компоненты—'межгрупповой дисперсии, а также за счет уменьшения и второй компоненты — внутригрупповой дисперсии (имея 'в виду, что автоматическое увеличение в этих условиях первой компоненты не увеличивает ошибку).
Применение второй модификации предполагает, что исследователь приобретает преимущество организационно-экономического характера за счет примирения с тем, что дисперсия соотносится не со всем числом изучаемых единиц, а только с числом гнезд, попавших в выборку (при том, что первая величина почти всегда намного больше второй).
Заметим также, что если первая модификация случайной выборки предполагает максимальное уменьшение второй компоненты в приведенном выше равенстве, т. е. внутригрупповой дисперсии, то вторая модификация, наоборот, наиболее эффективна тогда, когда диспер-
69
сия внутри гнезд будет как можно большей. В последнем случае возрастание внутригрупповой дисперсии будет компенсировано уменьшением межгрупповой дисперсии.
Основные принципы построения стратифицированной выборки
Первая модификация случайного отбора получила название районированной (или стратифицированной) выборки4. Сущность стратифицированной выборки сводится, как уже отмечалось, к уменьшению ошибки за счет межгрупповой дисперсии.
Поясним это на примере. Ранее отмечался факт сильного влияния уровня образования человека на структуру его внерабочего времени. Поэтому исследователь, составляющий прогнозы, касающиеся досуга в будущем, при проектировании выборки должен, естественно, особое внимание уделить тому, чтобы в его выборке соотношение лиц с различным уровнем образования было примерно таким же, как в изучаемом им объекте. Конечно, он может положиться полностью на случайный отбор, обладающий свойством «самовзвешивания». Иначе говоря, если объем выборки будет достаточно велик, то доля лиц с высоким и низким уровнем образования в выборке будет отличаться от истинных значений на величину заранее прогнозируемой ошибки.
Можно, однако, свести ошибку по этому показателю до минимума. Для этого необходимо выделить отдельные страты, например, для лиц со средним и высшим образованием и лиц, не имеющих среднего образования, и из каждой страты уже производить случайный отбор. При этом общий объем выборки чаще всего следует распределить пропорционально численности людей в каждой страте. Предположим, выборка объемом в 2000 человек производится из взрослого населения города (старше 16 лет), насчитывающего 20 тыс. человек, из которых
4 Нередко используется также и другой термин — «типическая выборка». Однако использование понятия «типа» применительно к описываемому способу отбора вызывает возражение, так как выделяемые в генеральной совокупности группы, слои, страты далеко не всегда можно считать типическими группами, если сохранять за понятием «типа» его обычное значение. В то же время целесообразно с нашей точки зрения использовать этот термин, когда идет речь о методе типических единиц (об этом см. дальше).
70
картинка
Благодаря такому приему социолог гарантирует себе соответствие выборки генеральной совокупности по данному показателю, сохраняя при этом в неприкосновенности основной принцип случайной выборки — равенство всех единиц перед возможностью попасть в объектив исследователя.
Обеспечение жесткого контроля за такой переменной, как уровень образования, понадобилось исследователю не для того, чтобы получить из выборки точные данные о соотношении лиц, окончивших и не окончивших среднее учебное заведение. Ведь именно этими данными он располагал еще до начала самого исследования. Контроль за этой переменной обещает быть эффективным благодаря тому, что «образование» (в соответствии с накопленными ранее знаниями) сильно влияет как раз на те переменные, для изучения которых и проводится само исследование (в данном случае затраты времени на чтение, просмотр телепрограмм и т. п.) 1. Значит, ошибки репрезентативности для этих переменных будут (при том же объеме выборки) меньше, чем следовало бы ожидать из основной формулы случайной выборки2.
В общем виде принцип районированной выборки может быть описан следующим образом. Предположим, в объекте исследования выделены L однородных страт и выборка из каждой 1-й страты, осуществленная случайным
1 Заметим, что стратифицированная выборка в определенном смысле соприкасается с целенаправленной (и, в частности, квотной) выборкой. Ведь в обоих видах выборки исследователь жестко контролирует в процессе отбора некоторые переменные.
2 Имеются примеры, свидетельствующие о том, что действительное соотношение случайной и стратифицированной выборок не вполне понимается даже учеными, активно применяющими математические методы в социально-экономических исследованиях. Утверждается, например, что «случайная выборка обеспечивает равную возможность попасть в выборку для каждой единицы отбора (т. е. для каждого города), но не равную (курсив наш.—В. Ш.) репрезентативность всех типов» [107; 19—20]. Между тем очевидно, что случайная выборка (в рамках ее объема) обеспечивает репрезентативное представительство всех типов единиц отбора.
71
картинка
Первый множитель представляет собой квадрат ошибки случайной выборки, второй характеризует влияние стратификации, точнее, зависимости между стратифицирующим и изучаемым признаками. При приближении р к единице ошибка стратифицированной выборки сильно уменьшается по сравнению с ошибкой чисто случайной выборки. При обратном движении эффект районирования уменьшается1.
Следует отметить, что практики часто преувеличивают эффективность стратификации. Дело в том, что обычно используемые для стратификации признаки не в состоянии обеспечить формирование однородных с точки зрения изучаемых признаков групп.
Эффект стратификации бывает особенно невелик, когда идет речь о качественных признаках. Если доля единиц, обладающих определенным признаком, колеблется в отдельных стратах в пределах, скажем, 35—65%, то выигрыш из-за стратификации будет крайне мал. В интервале от 20 до 80% величина дисперсии р{1—р} весьма нечувствительна к сравнительно небольшим изменениям. Иначе дело обстоит в отношении крайних значений р (до 20 и более 80) [289; 88—89].
При использовании стратифицированной выборки в зависимости от того, как решается вопрос о репрезентативности выделяемых страт, могут возникнуть две ситуации. Чаще всего исследователь, проявляя озабоченность по поводу -обеспечения высокой представительности для характеристик генеральной совокупности в целом, не проявляет беспокойства о репрезентативности данных, относящихся к отдельным стратам, выделяемым на стадии проектирования выборки. Так дело обстоит часто в обследованиях, проводящихся в масштабе страны. Объем выборки в таких обследованиях чаще всего не таков, чтобы обеспечить репрезентативность используемых в качестве страт регионов2.
' Влияние величины коэффициента корреляции между изучаемым и стратифицируемым признаками на ошибку выборки подробно рассмотрена в [21; 65—78].
2 Такова была, например, ситуация во всесоюзных исследованиях центральных газет (1966—1970 гг.). В это же время в подготовленном под руководством автора книги проекте сравнительного исследования подписчиков «Правды» предполагалось обеспечение репрезентативности данных для каждой из областей, отобранных на первой ступени.
73
Однако в некоторых обследованиях, особенно локальных и монографических, положение иное, и социолог, определяя объем выборки и распределяя ее между страта-ми, принимает в расчет указанное обстоятельство.
Следует отметить, что стратификация выборки осуществляется не только на стадии ее проектирования, но и после сбора информации. К апостериорной стратификации приходится прибегать тогда, когда сведения о стратифицирующем признаке могут быть получены только в ходе опроса; когда исследователь был вынужден опираться на стихийную выборку; когда в ходе сбора информации произошли отклонения от модели выборки1.
Основные процедуры одномерной стратифицированной выборки
Выше был изложен общий принцип построения районированной выборки. На основе этого принципа разработаны различные процедуры, отличающиеся друг от друга прежде всего использованием при выделении страт одного или нескольких признаков, отбором из каждой страты числа единиц пропорционально или непропорционально объему страты, формированием страты на основе примерных соображений или с использованием формальных методов.
Простейшая процедура стратификации предполагает использование для выделения страт одного признака, формирование страт на основе эвристических соображе--ний и применение пропорционального отбора. Эта процедура называется одномерной пропорциональной районированной выборкой.
В качестве исходных моментов при использовании данной процедуры выступает обычно ранжированный ряд, характеризующий вариацию 'в исходной совокупности признака, используемого для стратификации. Нередко этот ряд предварительно преобразуется в интервальный с тем, чтобы из каждой выделенной группы отбирать число единиц пропорционально ее объему.
Одномерная районированная пропорциональная выборка до сих пор чаще всего применялась в отечественной социологии при стратифицированной выборке. Заметим при этом, что стратификация применяется на разных ступенях отбора, так что ее объектом оказываются и непосредственные (или конечные) единицы наблюдения, и так называемые промежуточные единицы (области, города, предприятия, вузы и т. д.).
Наиболее часто стратификация применяется именно по отношению к последним. В этих целях обычно используют: для стратификации областей и городов — интенсивность того или иного показателя, характеризующего уровень экономики или культуры; для стратификации предприятий — отрасли народного хозяйства, ведомственную принадлежность, численность рабочих и служащих, размер средней заработной платы, процент выполнения плана, удельный вес групп рабочих с различным содержанием труда и т. д.; для стратификации вузов— отрасль народного хозяйства или науки, число студентов и т. д.
Усовершенствование одномерной выборки может быть осуществлено несколькими способами: за счет отказа при определенных условиях от принципа пропорциональности при размещении выборки в стратах и за счет применения более строгих приемов формирования страт. Во всех случаях прогресс в технике отбора опирается на использование априорной информации о дисперсии признака, служащего основой для стратификации, и о характере его связи с изучаемым признаком.
Если страта состоит из единиц, очень похожих друг на друга, и имеет, следовательно, небольшую дисперсию, то при прочих равных условиях она может быть представлена в выборке меньшим числом представителей, чем разнородная страта. Процедура стратифицированного отбора, построенная на этих идеях и разработанная независимо друг от друга А. А. Чупровым (1923 г.) и Е. Нейманом (1934 г.), получила название оптимального размещения. Эта процедура обеспечивает максимально экономное использование ресурсов,- выделяемых на обследование.
При простейшем варианте этого метода (он иногда называется методом минимальной дисперсии) исходят из предположения, что денежные и прочие затраты на изу-
75
картинка
Важно подчеркнуть, что оптимальное размещение, предусматривая непропорциональный объем выборки из каждой страты, предполагает в то же время как само собой разумеющееся применение весов страты при исчислении всех характеристик совокупности (средней, ошибки средней и т. д.) 1.
Заметим также, что в условиях пропорционального отбора можно воспользоваться в качестве весов в итоговых расчетах объемами выборки из каждой страты. Самовзвешивающийся характер пропорциональной выборки гарантирует, что структура выборки будет соответствовать структуре генеральной совокупности.
В условиях применения оптимального размещения или других способов непропорционального отбора (например, при размещении в каждой страте выборки равного объема) объем выборки из страты уже не может играть роль «веса», и нужны прямые данные об объеме страты. Это обстоятельство в известной мере увеличивает затраты на обработку материалов обследования.
Метод оптимального размещения можно рационально использовать, как видно из сказанного выше, только тогда, когда имеется необходимая информация о дисперсии стратифицирующего признака и если дисперсии этого признака в отдельных стратах сильно отличаются друг от друга1.
Особое значение имеют сведения о тесноте связи между стратифицирующим и изучаемым признаками. «Оптимальное размещение» оказывается «самым лучшим» при коэффициенте корреляции между указанными признаками, близком к единице. Если же этот коэффициент мал, то легко себе представить ситуацию, при которой «оптимальное размещение» даст худший результат по сравнению с пропорциональной выборкой2.
Необходимо подчеркнуть еще одно принципиальное обстоятельство. Исследователь всегда работает в режиме неполной информации. Поэтому в лучшем случае социолог может рассчитывать на получение с помощью метода оптимального размещения высокорепрезентатив-ных данных только в отношении признаков, о которых он обладает какой-то априорной информацией. Что же касается других изучаемых признаков, то его отказ от механизма «самовзвешивания», присущий пропорциональному отбору, означает готовность идти на известный
1 Именно поэтому эффективность рассматриваемого метода сильно снижается, если изучаются качественные признаки. И дело в том, что, как уже отмечалось, дисперсия р(\—р) малочувствительна к колебаниям между 0,2 и 0,8. Указанный метод невозможно применить и тогда, когда разность между значениями признака в крайних группах очень велика. В этом случае применение оптимального размещения требует выборки очень большого размера. См. об этом [226; 97], [89а; 119].
2 Представим себе, что мы, изучая интенсивность чтения книг, вновь воспользовались для стратификации уровнем образования. Мы, однако, не подозревали, что зависимость между интенсивностью чтения и образованием в данной совокупности была весьма слабой (например, из-за влияния «третьей» переменной — возраста, семейного положения и т. д.). Руководствуясь, однако, предположениями о сильной зависимости между этими признаками, мы в соответствии с принципами оптимального размещения из группы лиц с законченным высшим образованием отобрали для опроса гораздо меньше людей, чем из группы лиц, не имеющих среднего образования, полагая, что во второй группе разброс по уровню образования довольно большой, в то время как в первой он почти равен нулю. В действительности же в первой группе дисперсия изучаемого признака — интенсивности чтения — была намного выше, чем во второй группе, и избранная стратегия отбора оказалась крайне неудачной.
77
риск ухудшения репрезентативности указанных признаков1.
Все описанные выше обстоятельства объясняют, почему на практике оптимальное размещение используется сравнительно редко. Вместе с тем разработка этого метода серьезно углубила понимание многих проблем применения выборки2.
Если первый путь улучшения стратификации основывается на манипулировании структурой выборки при заданном расчленении совокупности на страты, то второй путь ориентирован на поиск лучших вариантов разделения генеральной совокупности на страты.
картинка
Современные вычислительные средства позволяют эффективно формировать страты (если их число невелико) с помощью прямого перебора.
Само собой разумеется, что ориентация проектировщика выборки одновременно на оптимальную стратификацию и оптимальное размещение теоретически обещает получение при заданном объеме выборки наилучших оценок. Однако и здесь следует напомнить, что такая стратегия предполагает теснейшую связь между изучаемым и стратифицирующим признаками. Если же эта связь является слабой, то тогда в силу вступает так называемая схема Далениуса [21; 70—71], которая, решая вопрос о формировании страт и размещении между ними выборки, учитывает тесноту связи между соответствующими признаками и допускает отклонение от пропорционального
отбора только в той мере, в какой позволяет идти на этот риск конкретный коэффициент корреляции 1.
Практика применения оптимальной стратификации очень бедна. Один из немногих примеров — работа, проделанная Ю. П. Вороновым 'при проектировании выборки в исследовании аудитории «Литературной газеты» [40], [197]. В качестве признака стратификации использовался показатель плотности подписки на газету в расчете на 10 тыс. жителей. На первой ступени отбора 150 территориальных единиц были объединены в страты так, чтобы был обеспечен минимум дисперсии по указанному признаку.
Следует подчеркнуть, что эффективность стратификации находится в определенной зависимости от числа страт. Увеличение числа страт выше определенного уровня приносит очень небольшой выигрыш.
С учетом этих соображений можно полагать, что число страт при использовании одного стратифицирующего признака может быть в интервале от 3 до 10 [289; 102].
Стратификация в многоцелевом исследовании
В предшествующих разделах вопросы районирования рассматривались при предположении, что целью исследования является получение информации по одной переменной и что стратификация осуществляется только по одному признаку. И то и другое допущения являются с точки зрения практики малореалистичными, и потому уже давно начали предприниматься попытки освободиться от указанных ограничений.
Рассмотрим сначала проблемы, возникающие в связи с многоцелевым характером обычного социологического исследования. Эта проблема становится особенно острой, если исследователь пытается применить методы оптимального размещения. В этом случае минимизация дисперсии для одной переменной может сопровождаться большими дисперсиями и, следовательно, ошибками для других переменных. Наиболее естественным выходом из этой конфликтной ситуации, как уже отмечалось, является обращение к пропорциональной выборке.
Многие исследователи предприняли попытку разработать способы, которые позволили бы сохранить принципы оптимального размещения в условиях многопеременного исследования. Одно из направлений в этих поисках получило название «компромиссного размещения». Речь идет о таком распределении выборки между стратами, при котором «интересы» всех переменных ущемляются в наименьшей степени.
Один из эвристических приемов предполагает, что вначале следует разместить выборку для обеспечения необходимой величины ошибки наиболее важной переменной. Если же в .распоряжении исследователя останется «резерв», его следует использовать для пополнения выборки из тех страт, где дисперсия следующей переменной особенно велика.
Формализация «компромиссного подхода» стала более реалистичной, когда для планирования выборки использовались методы оптимального программирования. Т. Далениус сформулировал задачу размещения выборки в терминах линейного программирования
картинка
В правой части неравенств указываются величины, которые не должны быть превзойдены фактическими ошибками.
Известны лишь немногие попытки использовать методы оптимального программирования при проектировании выборки. Одна из них связана с работой Ю. П. Воронова .
Многомерная стратификация
До сих пор шла речь о поиске путей уменьшения величины ошибок одновременно по многим переменным в рамках одномерной стратификации. Новый этап в развитии выборки как раз и связан с выходом на многомерную стратификацию.
81
В известном смысле первыми шагами в указанном направлении можно считать применение такого приема стратификации по двум или трем признакам, как метод «решетки»1.
В целом можно утверждать, что многомерная стратификация возникла не как развитие идей оптимального размещения и оптимальной стратификации, а как совершенно новый подход к проектированию выборки.
Сама идея многомерной стратификации возникла после появления аппарата распознавания образов [43], [73], [125]. Появление возможностей группировки объектов по многим признакам породило надежду, что новые методы позволяют сформировать страты из похожих по многим признакам единиц отбора. Предполагалось, что однородность страты настолько велика, что практически между всеми переменными в пределах страты существует тесная корреляция и поэтому можно добиться высокого эффекта районирования, даже не прибегая к таким сложным и малоприспособленным к многоцелевой выборке приемам, как оптимальное размещение и оптимальная стратификация.
Методы многомерной стратификации для априорного описания объекта впервые были использованы в работах Ю. П. Воронова при планировании выборки для обследования миграции сельского населения Западной Сибири, проведенного под руководством Т. И. Заславской [41], [42], [49], [ИЗ].
Предварительно было построено многомерное описание районов Новосибирской области по шести показателям. 29 районов Новосибирской области с помощью шести указанных характеристик были разбиты на 14 групп. Далее из каждой группы было взято для обследования по одному району. В состав отобранных районов входило 185 сельсоветов. Для отбора сельсоветов было пост-. роено их многомерное описание в терминах также шести характеристик. Полученное описание содержало 18 единичных групп (каждая из 1 сельсовета) и 19 групп, содержащих от 2 до 37 сельсоветов. Согласно опубликованным данным использование многомерной стратификации в исследованиях новосибирцев дало в отношении некоторых переменных неплохие результаты [49; 48], [113;
69]. К сожалению, нам неизвестно, в каком соотношении находится эффективность использованной новосибирцами методики по сравнению с одномерной стратификацией.
Метод таксономии нашел применение и при проектировании выборки в исследовании Ю. В. Арутюняна [9].
Существенное улучшение методики многомерной стратификации связано с включением в аппарат социологов, занимающихся проектированием выборки, факторного анализа. Он позволил заметно расширить совокупность признаков, из которой отбираются стратифицирующие переменные. Специальная процедура, основывающаяся на применении указанных методов, получила название структурной классификации.
Первая стадия исследования посвящается составлению перечня признаков, которые могут быть использованы для стратификации. Отбор признаков осуществляется с учетом, во-первых, соображений о предполагаемом влиянии этих признаков на переменные, подлежащие изучению, во-вторых, наличия и доступности соответствующей информации [67; 56].
В последнее время для отбора признаков часто привлекаются эксперты. С помощью экспертов на основе ранее накопленной информации можно более • эффективно решить (кроме составления самого перечня показателей) такие задачи, как определение примерного «веса», значимости признака, выяснение характера его связей с другими признаками (и прежде всего для выделения относительно зависимых и независимых признаков), определение «метрики», т. е. того, в каком виде признак будет
83
использован4, изучение степени сопоставимости признаков друг с другом исходя из временных и пространственных критериев.
На второй стадии с помощью факторного анализа 2 вся совокупность признаков, которые исследователь решил использовать как стратифицирующие, объединяется, исходя из их близости, в отдельные группы. При этом исследователю иногда удается дать содержательную ин-' терпретацию каждой группе признаков и выделить тот внутренний, латентный фактор, который и объединил данные признаки в одну группу. Например, Е. С. Петренко [136], (137], [138] разбила 32 признака, характеризующие 74 города РСФСР .на 5 факторов. Первый фактор объединил данные о числе лиц с различным уровнем образования. Эта группа признаков 'в целом характеризует уровень образования жителей города. Во (второй группе оказались объединенными показатели, характеризующие число рабочих, а также служащих, занятых в торговле, общественном питании, транспорте и связи. По мнению исследователя, этот фактор дает представление об уровне развития сферы обслуживания.
Признаки, образующие третий фактор, дают представление о характере промышленности города, а образующие четвертый фактор — о интенсивности строительства, образующие пятый — о наличии в городе резервов рабочей силы.
В процессе типологизации по 22 признакам 171 сельского населенного пункта Новосибирской области Т. И. Заславская и И. Б. Мучник [72], [73] выделили
4 Так, например, данные об уровне 'образования населения могут быть представлены в виде доли лиц, имеющих образование определенного уровня, числа лиц с указанным образованием на 1000 жителей, среднего числа лет обучения на 1 жителя, соотношения числа лиц с разным уровнем образования и т. д.
2 В использованных ниже примерах типологизации применена такая разновидность факторного анализа, как метод экстремальных группировок, позволяющий формировать «чистые» факторы и обеспечивающий включение каждого признака только в один фактор [19], [20].
Несколько иной подход к стратификации применил О. В. Староверов и его соавторы [2; 223—229]. Ими был применен для образования страт из городов метод главных компонент. Оказалось, что 5 главных компонент могут объяснить 70% суммарной дисперсии по 32 признакам. На основе этих данных было осуществлено распределение 74 городов: на 5 страт.
84
4 фактора. В первый фактор вошло б признаков, в том числе расстояние села от ближайшего ателье по пошиву и ремонту одежды, расстояние от комбината бытового обслуживания, расстояние от районного центра. В целом этот фактор характеризует удаленность села от межсельских предприятий обслуживания.
Второй фактор, объединяющий показатели обеспеченности торговыми заведениями, учреждениями связи, медицинской помощью, по мнению авторов, в целом характеризует уровень развития сферы обслуживания непосредственно в селе. Интерпретацию получили также третий и четвертый факторы.
На третьей стадии классификации происходит построение частных классификаций. Единицы исследования (например, населенные пункты) разбиваются по каждому фактору на отдельные классы.
Расчленение единиц отбора на отдельные 'классы может быть осуществлено различными приемами. Простейший прием предполагает выделение признака, который в данном факторе имеет наибольший вес и который играет чаще всего решающую роль при интерпретации содержания фактора. Так, например, при типологизации сел среди признаков, объединенных во второй фактор, наибольший вес (0,839) имел индекс обеспеченности торговыми заведениями. Его-то и можно было бы использовать для выделения нескольких групп сел.
Второй прием основывается на возможности приписать каждой единице отбора вес исходя из данного обобщающего фактора. После этого не составляет труда разбить всю совокупность единиц отбора на группы.
Наконец, можно использовать для расчленения единиц отбора на классы обычные методы таксономии, например так называемую автоматическую классификацию. С 'помощью этого приема единицы отбора объединяются в таксоны 'исходя 'из близости их векторов, 'каждый из которых образуется «з переменных, объединенных одним фактором.
С помощью выделенного фактора можно разбить совокупность единиц отбора на разное число классов. Обыч-, но исследователь, исходя из критерия «наполняемости» отдельных классов, сам определяет это число. Часто ограничиваются выделением двух-трех классов. Так, в упоминавшейся стратификации городов все города по каж-
85
дому фактору были расчленены на три группы. По первому фактору были выделены города с населением, имеющим высокий средний и сравнительно низкий уровень образования. Сельские населенные пункты были разбиты по каждому фактору на два класса, например на села отдаленные и не очень отдаленные от общественных центров, со слабо или высокоразвитым обслуживание и т. п.
Таким образом, после завершения третьей стадии каждая единица исследования (а в данном случае она является и единицей отбора) оказывается приписанной к разным классам, число которых равно количеству выделенных факторов. Например, каждый город оказался включенным в 5 классов, а каждое село в 4 класса.
На четвертой стадии исследователь пытается свести частные классификации в одну общую типологию. Это осуществляется путем выделения таких сочетаний различных классов, на которые приходится значительное число единиц отбора. В результате упоминавшейся классификации каждый город получил пятизначный код, в котором первая цифра характеризовала принадлежность города к одному из классов по первому фактору, вторая цифра — принадлежность города к одному из классов по второму фактору 'и т. д.
Формально в данном исследовании можно выделить 74 общих классов городов. Однако оказалось, что большая часть городов (60%) распределяется между 10 общими классами. Первый общий класс, например, объединил города, в которых население имеет средний (по сравнению .с другими городами) уровень образования, уровень обслуживания является высоким,'уровень развития промышленности является средним, а строительства — низким, доля нетрудоспособного населения высокая.
Несколько иной подход, напоминающий технику кластерного анализа и сегментации, применили классификаторы сел. Вначале они прорайонировали факторы по их «силе». Затем в качестве исходного пункта они взяли классы, выделенные по самому значимому фактору, потом каждый из этих классов разбили на подклассы по второму по важности фактору и т. д. В результате было выделено 7 общих классов. В первый из этих классов, например, вошли самые малые периферийные поселки, уда-
86
ленные от общественных центров, с преобладанием сельского типа застройки и слабым развитием обслуживания.
Выделенные общие классы городов и сел являются готовыми стратами для отбора из них единиц исследования.
Первые опыты применения многомерной стратификации во многом напоминали тот период в истории выборки, когда использование оптимального размещения не предполагало в качестве обязательного условия предварительное изучение связей между стратифицирующим и исследуемым 'признаками. Новый этап в 'применении многомерной стратификации связан опять-таки с усилением интереса к этой стороне дела.
Теоретически можно себе представить, что с учетом неодинакового характера связи изучаемых переменных со стратифицирующими признаками следует в рамках одного и того же обследования построить несколько различных стратификаций1. В этой связи важное значение приобретает пробное обследование, в рамках которого следует установить, какая из типологизаций единиц отбора наиболее тесно связана с изучаемыми признаками [50].
Серьезным препятствием при проектировании многоцелевой и многомерной стратифицированной выборки является отсутствие информации о признаках, подлежащих изучению. Для его преодоления можно воспользоваться имеющимися сведениями о тех признаках, которые могут условно заменять изучаемые признаки.
Использование многомерной стратификации вовсе не исключает значение вопросов, относящихся к размещению выборки между отдельными стратами, или таксонами. Нельзя игнорировать и в этом случае принципы «оптимального размещения». Очевидно, что разнородные таксоны могут быть представлены в выборке интенсивнее, чем другие, при условии, что во время исчисления характеристик выборочной совокупности будут учтены истинные «веса» таксонов1.
Использование многомерной стратификации в социологии только начинается, и в будущем многие еще неясные вопросы, видимо, найдут свое решение.