Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ШЛЯПЕНТОХ В. Э.Проблемы репрезентативности.DOC
Скачиваний:
1
Добавлен:
01.03.2025
Размер:
4.79 Mб
Скачать

Глава IV районированная выборка*

Пути модификации собственно-случайной выборки

До сих пор в основном речь шла о случайной выборке в ее «чистом» варианте, о так называемой собственно-случайной выборке, предполагающей наличие единого, не преобразованного каким-либо образом списка всех единиц генеральной совокупности и отборе с помощью различных процедур единиц наблюдения из этого списка.

Теория и практика выборочного метода, однако, по­казала, что собственно-случайную выборку применяют сравнительно редко, так как, с одной стороны, ее можно в большинстве случаев заметно улучшить, исходя из эко­номических критериев, а с другой стороны, во многих ситуациях ее нельзя использовать. Заметим в то же вре­мя, что использование именно собственно-случайной вы­борки предрешено тогда, когда исследователь не распо­лагает никакой информацией о структуре генеральной совокупности и когда информация о единицах исследо­вания может быть получена только в процессе самого обследования.

Основные модификации случайной выборки, позволя­ющие заметно повысить ее экономическую эффектив­ность и расширить сферу ее применения, связаны с рай­онированием (или стратификацией) выборки и с приме­нением многоступенчатого гнездового отбора.

Прогресс в применении выборочного метода в социо­логии, экономике потребовал предварительного (или ап­риорного) на основе накопленной ранее информации изу­чения объекта исследования. Априорное описание объек­та предполагает выделение и анализ структуры отдель­ных сегментов в изучаемой совокупности (страты, гнез-

68

да), выяснение характера связей между отдельными при­знаками, характеризующими эту совокупность.

Предварительное изучение объекта исследования на­чало осуществляться одновременно с 'внедрением выбо­рочного метода в науке. Однако описание объекта 'выде­лилось 'в 'специальную стадию при проектировании вы­борки 'сравнительно недавно. Теперь стала особенно оче­видной целесообразность увеличения затрат на стадии описания объекта для повышения экономической эффек­тивности выборки в целом (уменьшение общих затрат на выборку при одной 'и той же точности или 'повышение точности при данной величине затрат).

В конечном счете все модификации случайной выбор­ки опираются на известную теорему о сложении диспер­сии. Согласно этой теореме общая дисперсия может быть расчленена на отдельные компоненты, например на меж­групповую (или межгнездовую) и внутригрупповую (или внутригнездовую) дисперсии:

картинка

Улучшение случайной выборки в рамках первой мо­дификации означает, что ошибка уменьшается в первую очередь за счет сведения к нулю 'влияния на ошибку пер­вой компоненты—'межгрупповой дисперсии, а также за счет уменьшения и второй компоненты — внутригрупповой дисперсии (имея 'в виду, что автоматическое увеличе­ние в этих условиях первой компоненты не увеличивает ошибку).

Применение второй модификации предполагает, что исследователь приобретает преимущество организацион­но-экономического характера за счет примирения с тем, что дисперсия соотносится не со всем числом изучае­мых единиц, а только с числом гнезд, попавших в вы­борку (при том, что первая величина почти всегда на­много больше второй).

Заметим также, что если первая модификация слу­чайной выборки предполагает максимальное уменьшение второй компоненты в приведенном выше равенстве, т. е. внутригрупповой дисперсии, то вторая модифика­ция, наоборот, наиболее эффективна тогда, когда диспер-

69

сия внутри гнезд будет как можно большей. В последнем случае возрастание внутригрупповой дисперсии будет компенсировано уменьшением межгрупповой дисперсии.

Основные принципы построения стратифицированной выборки

Первая модификация случайного отбора получила название районированной (или стратифицированной) выборки4. Сущность стратифицированной выборки сво­дится, как уже отмечалось, к уменьшению ошибки за счет межгрупповой дисперсии.

Поясним это на примере. Ранее отмечался факт силь­ного влияния уровня образования человека на структуру его внерабочего времени. Поэтому исследователь, со­ставляющий прогнозы, касающиеся досуга в будущем, при проектировании выборки должен, естественно, осо­бое внимание уделить тому, чтобы в его выборке соотно­шение лиц с различным уровнем образования было при­мерно таким же, как в изучаемом им объекте. Конечно, он может положиться полностью на случайный отбор, обладающий свойством «самовзвешивания». Иначе го­воря, если объем выборки будет достаточно велик, то доля лиц с высоким и низким уровнем образования в выборке будет отличаться от истинных значений на ве­личину заранее прогнозируемой ошибки.

Можно, однако, свести ошибку по этому показателю до минимума. Для этого необходимо выделить отдель­ные страты, например, для лиц со средним и высшим об­разованием и лиц, не имеющих среднего образования, и из каждой страты уже производить случайный отбор. При этом общий объем выборки чаще всего следует распределить пропорционально численности людей в каждой страте. Предположим, выборка объемом в 2000 человек производится из взрослого населения города (старше 16 лет), насчитывающего 20 тыс. человек, из которых

4 Нередко используется также и другой термин — «типическая выборка». Однако использование понятия «типа» применительно к описываемому способу отбора вызывает возражение, так как вы­деляемые в генеральной совокупности группы, слои, страты далеко не всегда можно считать типическими группами, если сохранять за понятием «типа» его обычное значение. В то же время целесообразно с нашей точки зрения использовать этот термин, когда идет речь о методе типических единиц (об этом см. дальше).

70

картинка

Благодаря такому приему социолог гарантирует себе соответствие выборки генеральной совокупности по дан­ному показателю, сохраняя при этом в неприкосновенно­сти основной принцип случайной выборки — равенство всех единиц перед возможностью попасть в объектив ис­следователя.

Обеспечение жесткого контроля за такой переменной, как уровень образования, понадобилось исследователю не для того, чтобы получить из выборки точные данные о соотношении лиц, окончивших и не окончивших сред­нее учебное заведение. Ведь именно этими данными он располагал еще до начала самого исследования. Конт­роль за этой переменной обещает быть эффективным благодаря тому, что «образование» (в соответствии с накопленными ранее знаниями) сильно влияет как раз на те переменные, для изучения которых и проводится само исследование (в данном случае затраты времени на чтение, просмотр телепрограмм и т. п.) 1. Значит, ошибки репрезентативности для этих переменных будут (при том же объеме выборки) меньше, чем следовало бы ожидать из основной формулы случайной выборки2.

В общем виде принцип районированной выборки мо­жет быть описан следующим образом. Предположим, в объекте исследования выделены L однородных страт и вы­борка из каждой 1-й страты, осуществленная случайным

1 Заметим, что стратифицированная выборка в определенном смысле соприкасается с целенаправленной (и, в частности, квотной) выборкой. Ведь в обоих видах выборки исследователь жестко контро­лирует в процессе отбора некоторые переменные.

2 Имеются примеры, свидетельствующие о том, что действитель­ное соотношение случайной и стратифицированной выборок не впол­не понимается даже учеными, активно применяющими математиче­ские методы в социально-экономических исследованиях. Утверждает­ся, например, что «случайная выборка обеспечивает равную возмож­ность попасть в выборку для каждой единицы отбора (т. е. для каж­дого города), но не равную (курсив наш.—В. Ш.) репрезентатив­ность всех типов» [107; 19—20]. Между тем очевидно, что случайная выборка (в рамках ее объема) обеспечивает репрезентативное пред­ставительство всех типов единиц отбора.

71

картинка

Первый множитель представляет собой квадрат ошиб­ки случайной выборки, второй характеризует влияние стратификации, точнее, зависимости между стратифици­рующим и изучаемым признаками. При приближении р к единице ошибка стратифицированной выборки сильно уменьшается по сравнению с ошибкой чисто случайной выборки. При обратном движении эффект районирова­ния уменьшается1.

Следует отметить, что практики часто преувеличи­вают эффективность стратификации. Дело в том, что обычно используемые для стратификации признаки не в состоянии обеспечить формирование однородных с точ­ки зрения изучаемых признаков групп.

Эффект стратификации бывает особенно невелик, когда идет речь о качественных признаках. Если доля единиц, обладающих определенным признаком, колеблет­ся в отдельных стратах в пределах, скажем, 35—65%, то выигрыш из-за стратификации будет крайне мал. В интервале от 20 до 80% величина дисперсии р{1—р} весьма нечувствительна к сравнительно небольшим из­менениям. Иначе дело обстоит в отношении крайних зна­чений р (до 20 и более 80) [289; 88—89].

При использовании стратифицированной выборки в зависимости от того, как решается вопрос о репрезента­тивности выделяемых страт, могут возникнуть две ситуа­ции. Чаще всего исследователь, проявляя озабоченность по поводу -обеспечения высокой представительности для характеристик генеральной совокупности в целом, не проявляет беспокойства о репрезентативности данных, относящихся к отдельным стратам, выделяемым на ста­дии проектирования выборки. Так дело обстоит часто в обследованиях, проводящихся в масштабе страны. Объем выборки в таких обследованиях чаще всего не таков, что­бы обеспечить репрезентативность используемых в ка­честве страт регионов2.

' Влияние величины коэффициента корреляции между изучаемым и стратифицируемым признаками на ошибку выборки подробно рас­смотрена в [21; 65—78].

2 Такова была, например, ситуация во всесоюзных исследованиях центральных газет (1966—1970 гг.). В это же время в подготовленном под руководством автора книги проекте сравнительного исследования подписчиков «Правды» предполагалось обеспечение репрезентативно­сти данных для каждой из областей, отобранных на первой ступени.

73

Однако в некоторых обследованиях, особенно локаль­ных и монографических, положение иное, и социолог, оп­ределяя объем выборки и распределяя ее между страта-ми, принимает в расчет указанное обстоятельство.

Следует отметить, что стратификация выборки осуще­ствляется не только на стадии ее проектирования, но и после сбора информации. К апостериорной стратифика­ции приходится прибегать тогда, когда сведения о стра­тифицирующем признаке могут быть получены только в ходе опроса; когда исследователь был вынужден опи­раться на стихийную выборку; когда в ходе сбора инфор­мации произошли отклонения от модели выборки1.

Основные процедуры одномерной стратифицированной выборки

Выше был изложен общий принцип построения рай­онированной выборки. На основе этого принципа разра­ботаны различные процедуры, отличающиеся друг от друга прежде всего использованием при выделении страт одного или нескольких признаков, отбором из каждой страты числа единиц пропорционально или непропорцио­нально объему страты, формированием страты на основе примерных соображений или с использованием формаль­ных методов.

Простейшая процедура стратификации предполагает использование для выделения страт одного признака, формирование страт на основе эвристических соображе--ний и применение пропорционального отбора. Эта про­цедура называется одномерной пропорциональной рай­онированной выборкой.

В качестве исходных моментов при использовании данной процедуры выступает обычно ранжированный ряд, характеризующий вариацию 'в исходной совокупно­сти признака, используемого для стратификации. Не­редко этот ряд предварительно преобразуется в интер­вальный с тем, чтобы из каждой выделенной группы от­бирать число единиц пропорционально ее объему.

Одномерная районированная пропорциональная выборка до сих пор чаще всего применялась в отечест­венной социологии при стратифицированной выборке. Заметим при этом, что стратификация применяется на разных ступенях отбора, так что ее объектом оказыва­ются и непосредственные (или конечные) единицы на­блюдения, и так называемые промежуточные единицы (области, города, предприятия, вузы и т. д.).

Наиболее часто стратификация применяется именно по отношению к последним. В этих целях обычно исполь­зуют: для стратификации областей и городов — интен­сивность того или иного показателя, характеризующего уровень экономики или культуры; для стратификации предприятий — отрасли народного хозяйства, ведомст­венную принадлежность, численность рабочих и служа­щих, размер средней заработной платы, процент выпол­нения плана, удельный вес групп рабочих с различным содержанием труда и т. д.; для стратификации вузов— отрасль народного хозяйства или науки, число студен­тов и т. д.

Усовершенствование одномерной выборки может быть осуществлено несколькими способами: за счет отказа при определенных условиях от принципа пропорционально­сти при размещении выборки в стратах и за счет приме­нения более строгих приемов формирования страт. Во всех случаях прогресс в технике отбора опирается на ис­пользование априорной информации о дисперсии при­знака, служащего основой для стратификации, и о ха­рактере его связи с изучаемым признаком.

Если страта состоит из единиц, очень похожих друг на друга, и имеет, следовательно, небольшую дисперсию, то при прочих равных условиях она может быть пред­ставлена в выборке меньшим числом представителей, чем разнородная страта. Процедура стратифицированного от­бора, построенная на этих идеях и разработанная неза­висимо друг от друга А. А. Чупровым (1923 г.) и Е. Нейманом (1934 г.), получила название оптимально­го размещения. Эта процедура обеспечивает максималь­но экономное использование ресурсов,- выделяемых на обследование.

При простейшем варианте этого метода (он иногда называется методом минимальной дисперсии) исходят из предположения, что денежные и прочие затраты на изу-

75

картинка

Важно подчеркнуть, что оптимальное размещение, предусматривая непропорциональный объем выборки из каждой страты, предполагает в то же время как само со­бой разумеющееся применение весов страты при исчис­лении всех характеристик совокупности (средней, ошиб­ки средней и т. д.) 1.

Заметим также, что в условиях пропорционального отбора можно воспользоваться в качестве весов в итого­вых расчетах объемами выборки из каждой страты. Са­мовзвешивающийся характер пропорциональной выбор­ки гарантирует, что структура выборки будет соответ­ствовать структуре генеральной совокупности.

В условиях применения оптимального размещения или других способов непропорционального отбора (напри­мер, при размещении в каждой страте выборки равного объема) объем выборки из страты уже не может играть роль «веса», и нужны прямые данные об объеме страты. Это обстоятельство в известной мере увеличивает затра­ты на обработку материалов обследования.

Метод оптимального размещения можно рациональ­но использовать, как видно из сказанного выше, только тогда, когда имеется необходимая информация о диспер­сии стратифицирующего признака и если дисперсии это­го признака в отдельных стратах сильно отличаются друг от друга1.

Особое значение имеют сведения о тесноте связи меж­ду стратифицирующим и изучаемым признаками. «Опти­мальное размещение» оказывается «самым лучшим» при коэффициенте корреляции между указанными признака­ми, близком к единице. Если же этот коэффициент мал, то легко себе представить ситуацию, при которой «опти­мальное размещение» даст худший результат по сравне­нию с пропорциональной выборкой2.

Необходимо подчеркнуть еще одно принципиальное обстоятельство. Исследователь всегда работает в режи­ме неполной информации. Поэтому в лучшем случае со­циолог может рассчитывать на получение с помощью метода оптимального размещения высокорепрезентатив-ных данных только в отношении признаков, о которых он обладает какой-то априорной информацией. Что же касается других изучаемых признаков, то его отказ от механизма «самовзвешивания», присущий пропорцио­нальному отбору, означает готовность идти на известный

1 Именно поэтому эффективность рассматриваемого метода сильно снижается, если изучаются качественные признаки. И дело в том, что, как уже отмечалось, дисперсия р(\—р) малочувствитель­на к колебаниям между 0,2 и 0,8. Указанный метод невозможно при­менить и тогда, когда разность между значениями признака в край­них группах очень велика. В этом случае применение оптимального размещения требует выборки очень большого размера. См. об этом [226; 97], [89а; 119].

2 Представим себе, что мы, изучая интенсивность чтения книг, вновь воспользовались для стратификации уровнем образования. Мы, однако, не подозревали, что зависимость между интенсивностью чте­ния и образованием в данной совокупности была весьма слабой (на­пример, из-за влияния «третьей» переменной — возраста, семейного положения и т. д.). Руководствуясь, однако, предположениями о сильной зависимости между этими признаками, мы в соответствии с принципами оптимального размещения из группы лиц с закончен­ным высшим образованием отобрали для опроса гораздо меньше людей, чем из группы лиц, не имеющих среднего образования, пола­гая, что во второй группе разброс по уровню образования довольно большой, в то время как в первой он почти равен нулю. В дейст­вительности же в первой группе дисперсия изучаемого признака — интенсивности чтения — была намного выше, чем во второй группе, и избранная стратегия отбора оказалась крайне неудачной.

77

риск ухудшения репрезентативности указанных призна­ков1.

Все описанные выше обстоятельства объясняют, по­чему на практике оптимальное размещение использует­ся сравнительно редко. Вместе с тем разработка этого метода серьезно углубила понимание многих проблем применения выборки2.

Если первый путь улучшения стратификации основы­вается на манипулировании структурой выборки при за­данном расчленении совокупности на страты, то второй путь ориентирован на поиск лучших вариантов разделе­ния генеральной совокупности на страты.

картинка

Современные вычислительные средства позволяют эф­фективно формировать страты (если их число невелико) с помощью прямого перебора.

Само собой разумеется, что ориентация проектиров­щика выборки одновременно на оптимальную стратифи­кацию и оптимальное размещение теоретически обещает получение при заданном объеме выборки наилучших оце­нок. Однако и здесь следует напомнить, что такая стра­тегия предполагает теснейшую связь между изучаемым и стратифицирующим признаками. Если же эта связь яв­ляется слабой, то тогда в силу вступает так называемая схема Далениуса [21; 70—71], которая, решая вопрос о формировании страт и размещении между ними выборки, учитывает тесноту связи между соответствующими при­знаками и допускает отклонение от пропорционального

отбора только в той мере, в какой позволяет идти на этот риск конкретный коэффициент корреляции 1.

Практика применения оптимальной стратификации очень бедна. Один из немногих примеров — работа, про­деланная Ю. П. Вороновым 'при проектировании выбор­ки в исследовании аудитории «Литературной газеты» [40], [197]. В качестве признака стратификации исполь­зовался показатель плотности подписки на газету в рас­чете на 10 тыс. жителей. На первой ступени отбора 150 территориальных единиц были объединены в страты так, чтобы был обеспечен минимум дисперсии по ука­занному признаку.

Следует подчеркнуть, что эффективность стратифика­ции находится в определенной зависимости от числа страт. Увеличение числа страт выше определенного уров­ня приносит очень небольшой выигрыш.

С учетом этих соображений можно полагать, что чис­ло страт при использовании одного стратифицирующего признака может быть в интервале от 3 до 10 [289; 102].

Стратификация в многоцелевом исследовании

В предшествующих разделах вопросы районирования рассматривались при предположении, что целью иссле­дования является получение информации по одной пере­менной и что стратификация осуществляется только по одному признаку. И то и другое допущения являются с точки зрения практики малореалистичными, и потому уже давно начали предприниматься попытки освободить­ся от указанных ограничений.

Рассмотрим сначала проблемы, возникающие в связи с многоцелевым характером обычного социологического исследования. Эта проблема становится особенно острой, если исследователь пытается применить методы опти­мального размещения. В этом случае минимизация дис­персии для одной переменной может сопровождаться большими дисперсиями и, следовательно, ошибками для других переменных. Наиболее естественным выходом из этой конфликтной ситуации, как уже отмечалось, являет­ся обращение к пропорциональной выборке.

Многие исследователи предприняли попытку разра­ботать способы, которые позволили бы сохранить прин­ципы оптимального размещения в условиях многопере­менного исследования. Одно из направлений в этих по­исках получило название «компромиссного размещения». Речь идет о таком распределении выборки между стратами, при котором «интересы» всех переменных ущем­ляются в наименьшей степени.

Один из эвристических приемов предполагает, что вначале следует разместить выборку для обеспечения необходимой величины ошибки наиболее важной пере­менной. Если же в .распоряжении исследователя оста­нется «резерв», его следует использовать для пополне­ния выборки из тех страт, где дисперсия следующей пе­ременной особенно велика.

Формализация «компромиссного подхода» стала бо­лее реалистичной, когда для планирования выборки ис­пользовались методы оптимального программирования. Т. Далениус сформулировал задачу размещения выбор­ки в терминах линейного программирования

картинка

В правой части неравенств указываются величины, которые не должны быть превзойдены фактическими ошибками.

Известны лишь немногие попытки использовать мето­ды оптимального программирования при проектирова­нии выборки. Одна из них связана с работой Ю. П. Во­ронова .

Многомерная стратификация

До сих пор шла речь о поиске путей уменьшения ве­личины ошибок одновременно по многим переменным в рамках одномерной стратификации. Новый этап в разви­тии выборки как раз и связан с выходом на многомер­ную стратификацию.

81

В известном смысле первыми шагами в указанном на­правлении можно считать применение такого приема стратификации по двум или трем признакам, как метод «решетки»1.

В целом можно утверждать, что многомерная страти­фикация возникла не как развитие идей оптимального размещения и оптимальной стратификации, а как совер­шенно новый подход к проектированию выборки.

Сама идея многомерной стратификации возникла после появления аппарата распознавания образов [43], [73], [125]. Появление возможностей группировки объектов по мно­гим признакам породило надежду, что новые методы по­зволяют сформировать страты из похожих по многим при­знакам единиц отбора. Предполагалось, что однород­ность страты настолько велика, что практически между всеми переменными в пределах страты существует тесная корреляция и поэтому можно добиться высокого эффек­та районирования, даже не прибегая к таким сложным и малоприспособленным к многоцелевой выборке приемам, как оптимальное размещение и оптимальная стратифи­кация.

Методы многомерной стратификации для априорного описания объекта впервые были использованы в рабо­тах Ю. П. Воронова при планировании выборки для об­следования миграции сельского населения Западной Си­бири, проведенного под руководством Т. И. Заславской [41], [42], [49], [ИЗ].

Предварительно было построено многомерное описа­ние районов Новосибирской области по шести показате­лям. 29 районов Новосибирской области с помощью ше­сти указанных характеристик были разбиты на 14 групп. Далее из каждой группы было взято для обследования по одному району. В состав отобранных районов входи­ло 185 сельсоветов. Для отбора сельсоветов было пост-. роено их многомерное описание в терминах также шести характеристик. Полученное описание содержало 18 еди­ничных групп (каждая из 1 сельсовета) и 19 групп, со­держащих от 2 до 37 сельсоветов. Согласно опублико­ванным данным использование многомерной стратифика­ции в исследованиях новосибирцев дало в отношении не­которых переменных неплохие результаты [49; 48], [113;

69]. К сожалению, нам неизвестно, в каком соотношении находится эффективность использованной новосибирцами методики по сравнению с одномерной стратифика­цией.

Метод таксономии нашел применение и при проекти­ровании выборки в исследовании Ю. В. Арутюняна [9].

Существенное улучшение методики многомерной стра­тификации связано с включением в аппарат социологов, занимающихся проектированием выборки, факторного анализа. Он позволил заметно расширить совокупность признаков, из которой отбираются стратифицирующие переменные. Специальная процедура, основывающаяся на применении указанных методов, получила название структурной классификации.

Первая стадия исследования посвящается составле­нию перечня признаков, которые могут быть использо­ваны для стратификации. Отбор признаков осуществляет­ся с учетом, во-первых, соображений о предполагаемом влиянии этих признаков на переменные, подлежащие изучению, во-вторых, наличия и доступности соответст­вующей информации [67; 56].

В последнее время для отбора признаков часто при­влекаются эксперты. С помощью экспертов на основе ра­нее накопленной информации можно более • эффективно решить (кроме составления самого перечня показателей) такие задачи, как определение примерного «веса», зна­чимости признака, выяснение характера его связей с дру­гими признаками (и прежде всего для выделения отно­сительно зависимых и независимых признаков), опреде­ление «метрики», т. е. того, в каком виде признак будет

83

использован4, изучение степени сопоставимости призна­ков друг с другом исходя из временных и пространствен­ных критериев.

На второй стадии с помощью факторного анализа 2 вся совокупность признаков, которые исследователь ре­шил использовать как стратифицирующие, объединяется, исходя из их близости, в отдельные группы. При этом исследователю иногда удается дать содержательную ин-' терпретацию каждой группе признаков и выделить тот внутренний, латентный фактор, который и объединил данные признаки в одну группу. Например, Е. С. Петрен­ко [136], (137], [138] разбила 32 признака, характеризую­щие 74 города РСФСР .на 5 факторов. Первый фактор объединил данные о числе лиц с различным уровнем об­разования. Эта группа признаков 'в целом характеризует уровень образования жителей города. Во (второй груп­пе оказались объединенными показатели, характеризую­щие число рабочих, а также служащих, занятых в торгов­ле, общественном питании, транспорте и связи. По мне­нию исследователя, этот фактор дает представление об уровне развития сферы обслуживания.

Признаки, образующие третий фактор, дают пред­ставление о характере промышленности города, а обра­зующие четвертый фактор — о интенсивности строитель­ства, образующие пятый — о наличии в городе резервов рабочей силы.

В процессе типологизации по 22 признакам 171 сель­ского населенного пункта Новосибирской области Т. И. Заславская и И. Б. Мучник [72], [73] выделили

4 Так, например, данные об уровне 'образования населения могут быть представлены в виде доли лиц, имеющих образование опреде­ленного уровня, числа лиц с указанным образованием на 1000 жите­лей, среднего числа лет обучения на 1 жителя, соотношения числа лиц с разным уровнем образования и т. д.

2 В использованных ниже примерах типологизации применена такая разновидность факторного анализа, как метод экстремальных группировок, позволяющий формировать «чистые» факторы и обеспе­чивающий включение каждого признака только в один фактор [19], [20].

Несколько иной подход к стратификации применил О. В. Старо­веров и его соавторы [2; 223—229]. Ими был применен для образова­ния страт из городов метод главных компонент. Оказалось, что 5 глав­ных компонент могут объяснить 70% суммарной дисперсии по 32 при­знакам. На основе этих данных было осуществлено распределение 74 городов: на 5 страт.

84

4 фактора. В первый фактор вошло б признаков, в том числе расстояние села от ближайшего ателье по пошиву и ремонту одежды, расстояние от комбината бытового обслуживания, расстояние от районного центра. В целом этот фактор характеризует удаленность села от межсель­ских предприятий обслуживания.

Второй фактор, объединяющий показатели обеспечен­ности торговыми заведениями, учреждениями связи, ме­дицинской помощью, по мнению авторов, в целом харак­теризует уровень развития сферы обслуживания непо­средственно в селе. Интерпретацию получили также тре­тий и четвертый факторы.

На третьей стадии классификации происходит пост­роение частных классификаций. Единицы исследования (например, населенные пункты) разбиваются по каждо­му фактору на отдельные классы.

Расчленение единиц отбора на отдельные 'классы мо­жет быть осуществлено различными приемами. Простей­ший прием предполагает выделение признака, который в данном факторе имеет наибольший вес и который иг­рает чаще всего решающую роль при интерпретации со­держания фактора. Так, например, при типологизации сел среди признаков, объединенных во второй фактор, наибольший вес (0,839) имел индекс обеспеченности тор­говыми заведениями. Его-то и можно было бы использо­вать для выделения нескольких групп сел.

Второй прием основывается на возможности припи­сать каждой единице отбора вес исходя из данного обоб­щающего фактора. После этого не составляет труда раз­бить всю совокупность единиц отбора на группы.

Наконец, можно использовать для расчленения еди­ниц отбора на классы обычные методы таксономии, на­пример так называемую автоматическую классифика­цию. С 'помощью этого приема единицы отбора объединя­ются в таксоны 'исходя 'из близости их векторов, 'каждый из которых образуется «з переменных, объединенных одним фактором.

С помощью выделенного фактора можно разбить сово­купность единиц отбора на разное число классов. Обыч-, но исследователь, исходя из критерия «наполняемости» отдельных классов, сам определяет это число. Часто ог­раничиваются выделением двух-трех классов. Так, в упо­минавшейся стратификации городов все города по каж-

85

дому фактору были расчленены на три группы. По пер­вому фактору были выделены города с населением, име­ющим высокий средний и сравнительно низкий уровень образования. Сельские населенные пункты были разбиты по каждому фактору на два класса, например на села отдаленные и не очень отдаленные от общественных центров, со слабо или высокоразвитым обслуживание и т. п.

Таким образом, после завершения третьей стадии каждая единица исследования (а в данном случае она является и единицей отбора) оказывается приписанной к разным классам, число которых равно количеству выде­ленных факторов. Например, каждый город оказался включенным в 5 классов, а каждое село в 4 класса.

На четвертой стадии исследователь пытается свести частные классификации в одну общую типологию. Это осуществляется путем выделения таких сочетаний раз­личных классов, на которые приходится значительное число единиц отбора. В результате упоминавшейся клас­сификации каждый город получил пятизначный код, в ко­тором первая цифра характеризовала принадлежность города к одному из классов по первому фактору, вторая цифра — принадлежность города к одному из классов по второму фактору 'и т. д.

Формально в данном исследовании можно выделить 74 общих классов городов. Однако оказалось, что боль­шая часть городов (60%) распределяется между 10 об­щими классами. Первый общий класс, например, объеди­нил города, в которых население имеет средний (по сравнению .с другими городами) уровень образования, уровень обслуживания является высоким,'уровень разви­тия промышленности является средним, а строитель­ства — низким, доля нетрудоспособного населения вы­сокая.

Несколько иной подход, напоминающий технику кла­стерного анализа и сегментации, применили классифи­каторы сел. Вначале они прорайонировали факторы по их «силе». Затем в качестве исходного пункта они взяли классы, выделенные по самому значимому фактору, потом каждый из этих классов разбили на подклассы по второму по важности фактору и т. д. В результате было выделено 7 общих классов. В первый из этих классов, на­пример, вошли самые малые периферийные поселки, уда-

86

ленные от общественных центров, с преобладанием сель­ского типа застройки и слабым развитием обслужива­ния.

Выделенные общие классы городов и сел являются готовыми стратами для отбора из них единиц исследова­ния.

Первые опыты применения многомерной стратифика­ции во многом напоминали тот период в истории выбор­ки, когда использование оптимального размещения не предполагало в качестве обязательного условия предва­рительное изучение связей между стратифицирующим и исследуемым 'признаками. Новый этап в 'применении многомерной стратификации связан опять-таки с усиле­нием интереса к этой стороне дела.

Теоретически можно себе представить, что с учетом неодинакового характера связи изучаемых переменных со стратифицирующими признаками следует в рамках одно­го и того же обследования построить несколько различ­ных стратификаций1. В этой связи важное значение при­обретает пробное обследование, в рамках которого сле­дует установить, какая из типологизаций единиц отбора наиболее тесно связана с изучаемыми признаками [50].

Серьезным препятствием при проектировании много­целевой и многомерной стратифицированной выборки яв­ляется отсутствие информации о признаках, подлежащих изучению. Для его преодоления можно воспользоваться имеющимися сведениями о тех признаках, которые могут условно заменять изучаемые признаки.

Использование многомерной стратификации вовсе не исключает значение вопросов, относящихся к размеще­нию выборки между отдельными стратами, или таксонами. Нельзя игнорировать и в этом случае принципы «оп­тимального размещения». Очевидно, что разнородные таксоны могут быть представлены в выборке интенсив­нее, чем другие, при условии, что во время исчисления характеристик выборочной совокупности будут учтены истинные «веса» таксонов1.

Использование многомерной стратификации в социо­логии только начинается, и в будущем многие еще неяс­ные вопросы, видимо, найдут свое решение.