Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ШЛЯПЕНТОХ В. Э.Проблемы репрезентативности.DOC
Скачиваний:
1
Добавлен:
01.03.2025
Размер:
4.79 Mб
Скачать

Глава III случайная выборка

Сущность случайной выборки

Случайная выборка является эталоном для организа­торов социологических исследований. Некоторые ученые отказываются рассматривать неслучайный отбор как раз­новидность научной выборки. Авторитет случайной вы­борки в социологии так высок, что формулы и рекомен­дации, пригодные только для случайной выборки, неред­ко неправильно используются там, где, по сути, должны применяться другие способы отбора.

Далеко не всегда социологи отдают себе отчет в том, что жесткое соблюдение требований случайной выборки, строгая рендомизация отбора, как правило, является трудной задачей.

Нередко приходится сталкиваться со следующей си­туацией. Социолог, находясь, с одной стороны, в жест­ких финансовых, временных и других ограничениях, а с другой стороны, понимая важность проведения именно случайной выборки, организовывает вероятностный от­бор там, где это ему удается. Скажем, если надо изу­чить общественное мнение жителей города, он может при­бегнуть к случайному отбору лиц, оказавшихся на ули­цах, а если целью является выявление в том же городе вкусов читателей книг, то он может произвести случай­ную выборку из числа посетителей библиотек. Между тем очевидно, что ни в том, ни в другом случае исследовате­лю не удалось обеспечить рендомизацию, соответствую­щую целям исследований: ведь жители города ни в пер­вом, ни во втором обследовании не имели равных шансов попасть в выборку.

Использование, однако, случайного отбора создает ил­люзию применения вероятностной выборки строго в со­ответствии с ее принципами1. Данное замечание касает­ся также тех социологов, которые, решительно отвергая неслучайные методы отбора как ненаучные, сами в своей практике не реализуют требований случайной выборки и

4 Сложность обеспечения рендомизации видна и из того значе­ния, какое этой проблеме уделяется в теории эксперимента. Там разработаны специальные приемы, позволяющие решать указанную задачу [127; 50, 74].

51

незаконно оценивают ошибки своих результатов с по­мощью формулы, не применимой к их исследованиям.

Четкое понимание условий проведения собственно-случайной выборки должно помочь социологу "избрать другие виды выборки, если эти условия не могут быть реализованы. В такой ситуации осознанное применение неслучайной выборки может оказаться гораздо более эф­фективным, чем использование методики «лжеслучайно­го» отбора 1.

Уже отмечалось, что величина ошибки (при данном способе отбора) зависит от степени однородности сово­купности и от объема выборки. Применительно к случай-~ ной выборке эти зависимости могут быть строго описаны следующей основной формулой выборочного метода:

картинка

Согласно основной формуле при случайном отборе ошибка выборки прямо пропорциональна среднеквадра-тическому отклонению и обратно пропорциональна кор­ню квадратному из объема выборки.

Случайная выборка в зависимости от того, может ли единица совокупности, однажды попавшая в выборку, быть вновь в нее включенной, бывает повторной и беспов­торной. При бесповторной выборке величина ошибки ум-

52

ножается на коэффициент, характеризующий долю исход­ной совокупности, не попавшей в выборку, т. е.

картинка

где N — объем генеральной совокупности.

Очевидно, что этот коэффициент способен существен­но повлиять на величину средней ошибки (в сторону ее уменьшения), если для изучения отобрана значительная часть генеральной совокупности. Использование коэффи­циента для бесповторной выборки чаще всего целесооб­разно при проведении исследований на промышленных предприятиях, где объем выборки очень часто составляет значительную часть от генеральной совокупности1.

Значение величины ошибки выборки позволяет пред­положительно определить интервалы, в которых находит­ся «истинная» средняя, т. е. средняя генеральной сово­купности (при предположении отсутствия ошибок смеще­ния) [пропуск ф-лы]

Согласно данным Л. А. Гордона и Э. В. Клопова молодые незамужние женщины тратят еженедельно на телевидение в среднем 2 ч 15 мин. Средняя ошибка равна 19 мин. Если оставить в стороне вопрос о том, на какую генеральную совокупность распростра­няются приведенные данные, то «истинные» затраты вре­мени на этот вид деятельности находятся в интервале между следующими величинами: 2 ч 15 мин— 19 мин и 2 ч 15 мин + 19 мин, т. е. 1 ч 56 мин < х < 2 ч 34 мин или х = 2 ч 15 мин ± 19 мин.

Выше приводилась формула для исчисления ошибки репрезентативности выборочной средней. Теория дает возможность определить аналогичные ошибки для дру­гих характеристик совокупности (децилей, квартилей, ме­диан), моментов различного порядка2.

4 Так, например, в обследовании рабочих промышленного пред­приятия Н. Ф. Наумовой и М. А. Слюсарянского объем выборки со­ставил 25% всей совокупности рабочих [176; 147]. Еще большей (50%) была выборка во время обследования плавсостава Омского речного бассейна [178; 36]. В обследовании отношения к труду инже­нерно-технических работников 20 предприятий легкой промышленно­сти было опрошено 69% всех лиц этой категории [179; 202].

53

картинка

Исчисление дисперсии

В приведенной выше формуле по определению ошиб­ки случайной выборки предполагается, что а является характеристикой колеблемости изучаемого признака в ге­неральной совокупности. Однако очевидно, что это теоре­тическое требование в абсолютном большинстве случаев невыполнимо. Социолог не имеет информации на этот счет, как, впрочем, и о величине средней. Ведь именно для получения этих показателей он и намерен проводить выборочное обследование.

Как правило, в учебных пособиях по статистике вы­ход из этого положения предлагают искать в использо­вании выборочных характеристик колеблемости. Такая замена корректна, если существует уверенность в стро­гом соблюдении требований случайного отбора при полу­чении информации о данном показателе. Однако следует отметить, что и при соблюдении этих условий замена ха­рактеристик генеральной совокупности соответствующи­ми показателями выборочной совокупности не является тривиальной задачей.

Строго говоря, выборочные показатели могут высту­пать в качестве более или менее хороших оценок харак­теристик генеральной совокупности. Качество этих оце­нок зависит от того, насколько они являются состоятель­ными, несмещенными и эффективными.

Выше уже отмечалось, что состоятельность оценки предполагает ее приближение с увеличением объема вы­борки к истинному значению характеристики генеральной совокупности. Оценка считается эффективной тогда, ког­да она обладает необходимой для исследователя точ­ностью, т. е. содержит ошибку, не превышающую задан­ную величину. Очевидно, что состоятельные оценки, как правило, могут быть и эффективными, если исследова­тель в состоянии увеличить объем выборки до нужного уровня.

Особое значение имеет такое математическое свой­ство оценок, как несмещенность1. Наличие этого свой­ства предполагает, что выборочные оценки определенной характеристики отклоняются от ее истинного значения одинаково «в разные стороны» и не дают смещения, т. е. не носят систематического характера.

Выборочные оценки ряда характеристик действитель­но носят; без использования корректировки несмещенный характер. Так дело обстоит с оценками средней, которые получают при простом случайном отборе2. Математиче­ское ожидание выборочной средней (т. е. средняя из вы­борочных средних, взвешенных по вероятности их появ­ления) в точности совпадает при соблюдении правил случайного отбора с истинной средней, т. е.

картинка

стик генеральной совокупности получают с помощью бо­лее сложных коррективов1.

Признавая, что несмещенные оценки, как правило, явно предпочтительнее смещенных, следует, 'однако, иметь в виду, что неточность исходной информации, на­личие систематических ошибок выборки и регистрации обычно намного превосходят ошибки, возникающие из-за использования несмещенных в математическом смысле оценок.

К тому же в некоторых ситуациях можно предпочесть смещенную, но более эффективную (т. е. обладающую меньшим отклонением от истинной величины перемен­ной) ошибку несмещенной, но менее эффективной [306;

165—170], [324; 28—30].

Использование выборочной дисперсии с соответствую­щими коррективами в качестве оценки дисперсии гене­ральной совокупности возможно только в том случае, если при отборе не происходило своих систематических ошибок. Перед ошибками в отборе бессильны любые ма­тематические ухищрения.

Приведем такой условный пример. Из генеральной совокупности семей, характеризуемых числом выписы­ваемых газет, произведена выборка (отобранные вариан­ты подчеркнуты):(пропущена таблица чисел)

Генеральная средняя, которая исследователю не из­вестна, составляет примерно 3 газеты. Выборочная сред­няя, оказавшаяся 'в распоряжении социолога, составила 6 газет. Фактическая ошибка равна 3. Возникает воп­

рос: может ли исследователь, не имеющий сведений о ге­неральной совокупности, получить представление о дис­персии генеральной совокупности и, следовательно, об ошибке средней?

Произведем необходимые вычисления и получим G2==2,5. Средняя ошибка выборки |л=±0,4. Генеральная средняя должна находиться в этом случае в интервале между 5,6 и 6,4. Фактически генеральная средняя нахо­дится далеко внепределов данного интервала. Между тем социолог, доверившись полученным оценкам, мог ут­верждать, что он получил неплохие с точки зрения репре­зентативности результаты. Почему же его «подвел» тра­диционный аппарат? Дело объясняется просто.

В нашем примере отбор имел явно смещенный харак­тер. В выборку попали в основном семьи, выписывающие много газет (предположим, что мы проводили почтовое обследование, а анкеты вернули нам как раз особенно активные читатели газет). В рамках отобранного массива разброс оказался небольшим, а это произошло не пото­му, что исходная совокупность отличалась однород­ностью. Небольшие величины дисперсии и соответственно средней ошибки выборки оказались порождением непра­вильного отбора единиц совокупности для исследования. Фактически дисперсия в генеральной совокупности была равна 3,3, что значительно больше выборочной диспер­сии. Именно поэтому подчас и возникает парадоксаль­ная ситуация: небольшие ошибки могут свидетельство­вать не о хорошем качестве проведенного обследования, а скорее о плохом1.

Мы до сих пор рассуждали о том, насколько право­мерно использовать выборочную дисперсию при опреде­лении ошибки средней. Следует, однако, заметить, что при проектировании выборочного обследования социолог Не обладает информацией об этой дисперсии. В такой ситуации обычно поступают следующим образом.

Если идет речь о качественных признаках, то имеется возможность ориентироваться на максимальную величи­ну дисперсии, равную 0,25, если о количественных, то в

1 Иногда может возникнуть другая ситуация, при которой сме­щенная, например, из-за нарушений правил отбора выборка может дать Лучшую, более эффективную оценку средней, чем выборка не­смещенная, однако имеющая очень большую дисперсию.

57

этом случае исследователь должен опираться на мате­риалы прошлых исследований, пробного обследования, экспертные оценки.

Вероятностный характер ошибок

Рассуждая о величине ошибки выборки и о характере ее зависимости от дисперсии и объема изучаемой сово­купности, мы не должны забывать о том, что речь идет о теоретически возможной величине ошибки. Ведь реаль­ная фактическая ошибка может быть, как указывалось, установлена только в сравнительно редких случаях. По­этому у социолога не может быть полной уверенности в том, что найденная им выборочная средняя будет отли­чаться от не известной ему генеральной средней не более чем на величину средней ошибки. Очевидно, что может идти речь только о вероятностных, предположительных оценках этой величины.

В теории вероятностей разработаны принципы, позво­ляющие определить конкретную вероятность того, что фактическая не известная исследователю ошибка не пре­вышает средней стандартной ошибки.

Покажем это на примере со студентами. Предполо­жим, что выборку по 200 человек осуществляли в поряд­ке эксперимента независимо друг от друга 100 социоло­гов. Мы можем также считать, что выборка носила бес­повторный характер, и студент, включенный в одну вы­борку, уже автоматически не мог попасть в другую. В результате эксперимента было получено 100 выбороч­ных средних о возрасте, успеваемости, социальном про­исхождении, жилищных условиях и других характеристи­ках студентов. Согласно теории вероятностей выбороч­ные средние, полученные описанным выше путем, будут располагаться по кривой, которая при увеличении числа этих средних, будет приближаться к нормальному рас­пределению.

В соответствии с этим распределением основная масса выборочных средних (примерно 2/3 всех средних—68%) отклоняется от генеральной средней на величину, не пре­вышающую одной средней ошибки (^i). При этом одна половина этих средних (или 34% общего числа) больше генеральной средней (но на величину не более (л), а дру­гая половина — меньше, но опять-таки не более чем на ц.

58

Если же считать допустимым отклонение от истинной средней (или предельную ошибку), равное А=2|л, то ока­жется, что этому более мягкому требованию удовлетво­ряют уже 95% всех выборочных средних. И опять-таки здесь соблюдается симметрия: одна половина выбороч­ных средних будет больше истинной средней на величи­ну, не превышающую 2ц, а другая—соответственно меньше. Наконец, 'предельной ошибке, равной Зц, соот­ветствует вероятность, равная 99%.

Со снижением требовательности к точности, с возра­станием нашей готовности смириться с возможностью бо­лее крупной предельной ошибки возрастает число выбо­рочных средних, на которые мы можем положиться при указанных выше ограничениях. Если мы хотим, чтобы выборочная средняя отличалась от генеральной средней всего яа ц, то мы должны 'быть готовы к тому, что 32% всех средних (100%—68%) могут иметь более крупные ошибки. Но если нас устроит меньшая точность и пре­дельная ошибка, равная 2|х, для нас терпима, то мы мо­жем исходить из того, что только 5% (100%—95%) всех возможных выборочных средних могут отклоняться бо­лее чем на 2|л. Наконец, если мы будем 'мириться с пре­дельной ошибкой, равной 3{л, то тогда только 1 % всех выборочных средних может обладать еще более крупны­ми недостатками.

картинка

Итак, чем выше предельная ошибка, тем меньшее число средних может выйти за ее границы. Это важное положение математической статистики многим хорошо известно из практики: чем точнее должен быть результат измерения, тем труднее его достичь, и, наоборот, чем ме­нее жесткие требования, тем легче они могут быть удов­летворены.

59

Рассуждая о распределении выборочных средних во­круг истинной средней аналогичным образом, мы опери­ровали мысленным экспериментом, в котором множество социологов изучали один и тот же объект (в данном слу­чае студентов одного вуза) и измеряли одни и те же свойства. Поэтому и у нас появилась возможность срав­нивать друг с другом 100 выборочных средних.

Но в действительности так не бывает. Социолог имеет возможность по каждому показателю получить только одну выборочную среднюю. Тогда перед ним возникает вопрос о том, какова же возможная ошибка этой единст­венной средней, находящейся в его распоряжении. В этой ситуации упомянутые выше величины 68%, 95%, 99% превращаются для него в прогнозные, вероятностные оценки возможной ошибки его индивидуальной выбороч­ной средней.

В приведенном выше примере из исследования Л. А. Гордона и Э. В. Клопова средние затраты времени на просмотр телепрограмм у незамужних молодых жен­щин характеризовались величиной х=2 ч 15 мин ± ± 19 мин. Второй элемент этого выражения представляет среднюю (или стандартную ошибку), соответствующую, как отмечалось, уровню вероятности 0,68.

Если же мы хотим ориентироваться на более высокий уровень вероятности, например 0,95, то тогда нам придет­ся согласиться на предельную ошибку, равную 2|л, т. е. в данном случае 38 мин. Это означает существенное рас­ширение интервала, в котором может оказаться истинная средняя (теперь она находится между 1 ч 37 мин и 2 ч 51 мин), и заметное ухудшение точности результата.

Теория случайной выборки позволяет, как мы видим, заранее, еще на стадии проектирования исследования, предсказывать величину возможной ошибки выборки.

Некоторые социологи исходят из того, что теория слу­чайной выборки разрешает применение формул только тогда, когда изучаемые признаки распределяются в гене­ральной совокупности нормально [132; 49—52], [6; 45]. В действительности нормальное распределение выбороч­ных характеристик присуще большим выборкам в соот­ветствии с центральной предельной теоремой независимо от типа распределения изучаемых характеристик. В то же время несомненно, что близость распределения изу­чаемых признаков к нормальному распределению суще-

60

ственно повышает точность выборочных результатов, особенно, если объем выборки является небольшим.

В иной ситуации приходится прибегать к расчетам, опирающимся на распределение, не являющееся строго нормальным, например на распределение Стьюдента.

Очевидно, что каждому показателю, исчисленному по материалам выборочного обследования, присуща своя, конкретная величина ошибки. Так как абсолютное боль­шинство исследований оперирует десятками и даже сот­нями показателей, то число вычисленных ошибок в прин­ципе может быть таким же большим1.

Совершенно ясно, что ошибки репрезентативности од­ного и того же социологического исследования подверже­ны сильным колебаниям. В уже упоминавшейся книге «Человек после работы» величина ошибок, относящихся к данным о доле лиц, обладающих определенным при­знаком, колеблется от 1,2 до 4,5%.

Но возможно ли исчисление интегральной оценки ре­презентативности всей совокупности показателей, исполь­зованных в социологическом исследовании? Такой вопрос кажется вполне естественным. Однако даже в литера­туре он поставлен сравнительно недавно, а число попы­ток практически определить величину этой интегральной оценки невелико.

Данная методическая проблема тесно переплетается с более общим вопросом о соизмерении признаков раз­личного характера, который, в частности, играет столь важную роль в таксономии.

Одно из решений этой важной задачи было предло­жено П. Махалонобисом. Оно предполагает сопоставле­ние двух векторов — характеристик генеральной и выбо­рочной совокупностей — и исчисление показателя, харак­теризующего суммарное расстояние между всеми компо­нентами этих векторов.

Объем выборки при случайном отборе

Естественно, социолог не хочет ограничиться ролью прогнозиста своих будущих ошибок. Он стремится свести

4 Наиболее детально сведения об ошибках репрезентативности представлены в книге Л. А. Гордона и Э. В. Клопова «Человек после работы». Авторы приводят данные об ошибках почти 600 показате­лей [48; 62—65].

61

размеры этих ошибок к минимуму. Теория случайной вы­борки позволяет ему решать подобные задачи. В каче­стве главного инструмента управления размером ошибки выступают трудовые и денежные ресурсы, находящиеся в распоряжении исследователя, который в конечном сче­те стремится к тому, чтобы максимизировать точность ре­зультатов в расчете на единицу издержек.

Прибегая к упрощению, можно полагать, что сред­ства, вкладываемые в проведение выборочного исследо­вания, пропорциональны объему выборки и что поэтому число единиц, включенных в выборку, и отражает вели­чину затрат*. Теория случайной выборки позволяет зара­нее определить, какой объем выборки необходим при за­данной предельной ошибке, т. е. при необходимой точно-

картинка

Заметим, что при очень большом объеме совокупно­сти (скажем, свыше нескольких сотен тысяч единиц) не­обходимая численность выборки может составить деся­тые и сотые доли процента генеральной совокупности. Например, 62 тыс. семей рабочих, служащих и колхозни­ков, обследуемых бюджетными статистиками ЦСУ СССР, составляют 0,1% генеральной совокупности семей. Во время единовременных обследований доходов и жилищ­ных условий населения объем выборки составляет 0,5% [109; 24]. При исследовании аудитории «Правды» (1968г.) число проведенных интервью составило 0,02% общего числа подписчиков.

Следует указать, что явным заблуждением являются мнения о том, что объем выборки должен составлять оп­ределенный процент генеральной совокупности (соглас­но одним мнениям — 1%, другим — 10% и т. п.). В дей­ствительности при соблюдении правил случайного отбо­ра ошибка выборки, как это видно из формул, зависит при данной дисперсии только от абсолютной численности единиц в выборке. Доля выборки в генеральной совокуп­ности используется как корректировочный коэффициент в бесповторной выборке и то лишь тогда, когда эта доля достаточно велика1.

В реальной социологической практике объем выбор­ки определяется с учетом множества различных обстоя­тельств, среди которых наряду с дисперсией изучаемых признаков особое значение имеют экономическая сторо-

на дела, число выделяемых подгрупп (об этом подроб­нее позже), специфика задач исследования, его орга­низация, состав интервьюеров, число изучаемых призна­ков и многое другое. Поэтому приведенная формула (см. с. 62), ориентированная на одноступенчатую чисто случайную выборку, выступает, скорее, как некоторый эталон для сравнительной оценки реального объема вы­борки, формирующийся под влиянием многих обстоя­тельств4. Все эти и другие обстоятельства приводят к тому, что объем выборки довольно редко определяется социологом с помощью расчетов, опирающихся на приве­денные выше формулы. По данным контент-анализа со­циологических публикаций на такие расчеты .ссылаются только 2% всех авторов.

Следует отметить, что в современных конкретных со­циологических исследованиях появилась тенденция к уменьшению объема 'выборки2. Число опрошенных 'в кру­гу профессиональных социологов перестает быть показа­телем масштабов исследования. Дело, скорее, обстоит наоборот. Уровень профессионализма находится нередко в представлении ученых в обратной зависимости от ко­личества лиц или других объектов, которые пришлось изучить, чтобы 'получить серьезные, надежные выводы3.

1 Анализ 200 советских социологических обследований за 1970— 1973 гг., в которых применялось интервьюирование, показал, что при­мерно половина всех обследований (48%) опирались на выборку объ­емом от 500 до 2500 человек. При этом в 14% всех обследований объем выборки составил от 300 до 500 человек, а в 10%—более 3000.

2 За последнее время, например, объем национальной выборки в исследованиях английских радиослушателей сократился с 4000 до 2200 человек [117; 10]. Характерная эволюция произошла и в наших исследованиях аудитории центральных газет. В первом исследова­нии («Известия») было проинтервьюировано 8 тыс. человек. Во вре­мя опроса читателей «Правды» (1968 г.) число респондентов было сокращено до 4 тыс.

3 На сбор информации приходится значительная часть всех рас­ходов. Отсюда и стремление сократить их за счет уменьшения объ­ема выборки. По расчетам Г. Хаймена стоимость опроса по нацио­нальной выборке в США (объем выборки 1500—2000 человек) со­ставляет примерно 60 тыс. долларов (40% всех затрат связаны со сбором информации, 50—с анализом, 5—10% — расходы на машину и подготовка отчета). По его же данным для опроса необходимо прибегнуть к услугам не менее 60—70 интервьюеров. На сбор ин­формации и ее кодировку уходит обычно 3—4 месяца и даже более [286; 6—7].

64

В настоящее время ведутся активные пути дальнейше­го уменьшения объема выборки. Один из самых эффек­тивных из них связан с методом последовательного ана­лиза Вальда.

Определение объема выборки по фактически наблю­даемым данным позволяет, как правило, существенно со­кратить ее объем. Теоретическое обоснование этого ут­верждения нужно искать в том факте, что объем выбор­ки в одном случае устанавливается априори, в другом — на основе полученных эмпирических данных. Несомненно в то же время, что установление объема выборки с по­мощью последовательного анализа требует дополни­тельных затрат труда по сравнению с использованием традиционных методов1.

Механический отбор

Механический (или систематический) отбор являет­ся, вероятно, самым распространенным приемом2. Это объясняется, видимо, тем, что из всех приемов выбора данный прием является простейшим. В частности, он зна­чительно проще, чем случайный отбор, предполагающий умение пользоваться таблицами случайных чисел. К то­му же механический отбор тесно переплетается с про­порциональным стратифицированным отбором, что при­водит к снижению ошибки выборки.

Например, применение механического отбора из чле­нов жилищного кооператива списка, составленного в по­рядке поступления в данный кооператив, обеспечит про­порциональное представительство членов кооператива с разным стажем. Использование этого же приема для от­бора респондентов из списка лиц, составленного по алфа­виту, обеспечивает равные шансы для фамилий, начи­нающихся на разные буквы, и т. п., что может иметь зна­чение в тех случаях, если совокупность состоит из пред­ставителей различных национальностей или если идет речь о жителях одного и того же селения, где часто встречаются одни и те же фамилии. Использование та-

1 Об использовании метода последовательного анализа в выбо­рочных обследованиях см. [25], [339; 261—262]. Этот метод исполь­зовался нами при контроле за качеством кодировки анкет [142].

2 Одна часть ученых считает механический отбор особой про­цедурой случайной выборки, другая — трактует его как самостоя­тельную разновидность выборки [52; 60].

65

бельных списков на предприятиях может обеспечить не­обходимую пропорциональность в представительстве ра­ботников с разным стажем. Заметим, что некоторые со­циологи не понимают этой стороны механического отбора и без должных оснований полагают, что использование табелей как основы выборки всегда ведет к систематиче­ским ошибкам [150; 12].

Механический отбор можно осуществлять, и в этом его существенное преимущество по сравнению с обычны­ми процедурами случайной выборки, без предваритель-ного составления списка единиц исследования, исполь­зуя расположение единиц исследования на определенной территории «в натуре» или же географические карты. Так, механический отбор можно применить для отбора домов и квартир, учреждений культуры и т. д.

Механический отбор в силу отмеченных выше особен­ностей близко соприкасается с отбором из стратифици­рованного списка (или типическим отбором), и поэтому часто ошибки репрезентативности при этом отборе могут быть ниже, чем при случайной выборке.

Среди методических проблем этого вида отбора сле­дует выделить прежде всего решение вопроса о размере интервала. Если обозначить через / размер интервала, N — число единиц в генеральной совокупности, через kчисло интервалов, то при выборе интервала должно со­блюдаться следующее соотношение:

Например, если объем исходной совокупности 1820 единиц, 'примерный объем выборки 70, то интервал должен быть равен 26.

Возможен случай, когда первая единица окажется под номером 1+\ (т. е. в нашем примере 27), последняя единица получит номер kl+l, в данном случае 1846. Между тем в исходной совокупности единиц нет единиц с номерами 1821—"1846.

Отсутствие необходимых номеров в списке может быть компенсировано с помощью следующих приемов. Во-первых, можно продолжить список за счет единиц, отобранных случайным образом из самого списка. Во-вторых, можно рассматривать список как «круговой»:

после единицы с последним номером располагаются еди­ницы с первыми номерами. В-третьих, можно изменить

66

тактику отбора и обеспечить такое положение, чтобы ве­личине I точно соответствовал объем исходной совокуп­ности. Чтобы ее пополнить, можно опять-таки с помощью случайного отбора взять из первичного списка необхо­димое количество повторных единиц совокупности.

Механический отбор имеет не только преимущества, но и известные недостатки, которые представляются для некоторых социологов настолько серьезными, что они выражают сомнения в надежности этого метода отбора [274; 121]. Дело в том, что не так уж редко списки, ис­пользуемые для систематического отбора, содержат, как уже отмечалось, либо определенные тренды, либо коле­бания. В одних ситуациях существование трендов помо­гает улучшить выборку за счет приближения механиче­ского отбора к стратифицированному, однако в ряде других имеет 'место противоположная картина [89а].

Прежде всего отметим значение выбора первой еди­ницы. Неудачный выбор этой единицы может привести к серьезным ошибкам при отборе. Пусть необходимо произвести отбор из списка квартир пятиэтажных домов с интервалом, равным 20. Если в каждом подъезде на одной площадке находятся 4 квартиры и если первой единицей отбора будет квартира № 3 в первом доме, то тогда в выборку попадут квартиры под номерами (кро­ме № 3) 23, 43, 63, 83, 103 и т. д. Все они окажутся на первом этапе. Вполне возможно, что состав жителей на первых этажах по некоторым параметрам отличен от тех, кто живет выше (здесь могут преобладать пенсионе­ры, люди с больным сердцем и т. д.). Это обстоятельство может существенно повлиять на итоги некоторых опро­сов 1.

Опасность возникновения систематических ошибок при механическом отборе стимулировала поиск усовер­шенствований этого метода. Прежде всего следует ука­зать на необходимость использования таблиц случайных чисел для выбора первой единицы отбора. Известное применение находит также прием, заключающийся в из­менении начальной единицы через определенное число ин­тервалов. Можно также выбрать в начале списка не-

' Примеры возможных ошибок при систематическом отборе при­водит ряд авторов [218; 28], [225; 93].

67

сколько исходных единиц и осуществлять отбор через одинаковые или разные интервалы, как бы параллельно. Наконец, минусы механического отбора можно преодо­леть, используя метод «независимых выборок».