
- •Глава I
- •Глава II ошибки репрезентативности
- •Глава III случайная выборка
- •Глава IV районированная выборка*
- •Глава V многоступенчатая выборка
- •Метод типичных единиц в многоступенчатой выборке
- •Глава VI неслучайные методы отбора
- •Основные принципы квотного отбора
- •Глава VII формирование объекта исследования
- •Глава VIII
- •Причины смещения результатов почтового опроса
- •Глава IX проблемы многофазной выборки
- •6 И более 4
Глава III случайная выборка
Сущность случайной выборки
Случайная выборка является эталоном для организаторов социологических исследований. Некоторые ученые отказываются рассматривать неслучайный отбор как разновидность научной выборки. Авторитет случайной выборки в социологии так высок, что формулы и рекомендации, пригодные только для случайной выборки, нередко неправильно используются там, где, по сути, должны применяться другие способы отбора.
Далеко не всегда социологи отдают себе отчет в том, что жесткое соблюдение требований случайной выборки, строгая рендомизация отбора, как правило, является трудной задачей.
Нередко приходится сталкиваться со следующей ситуацией. Социолог, находясь, с одной стороны, в жестких финансовых, временных и других ограничениях, а с другой стороны, понимая важность проведения именно случайной выборки, организовывает вероятностный отбор там, где это ему удается. Скажем, если надо изучить общественное мнение жителей города, он может прибегнуть к случайному отбору лиц, оказавшихся на улицах, а если целью является выявление в том же городе вкусов читателей книг, то он может произвести случайную выборку из числа посетителей библиотек. Между тем очевидно, что ни в том, ни в другом случае исследователю не удалось обеспечить рендомизацию, соответствующую целям исследований: ведь жители города ни в первом, ни во втором обследовании не имели равных шансов попасть в выборку.
Использование, однако, случайного отбора создает иллюзию применения вероятностной выборки строго в соответствии с ее принципами1. Данное замечание касается также тех социологов, которые, решительно отвергая неслучайные методы отбора как ненаучные, сами в своей практике не реализуют требований случайной выборки и
4 Сложность обеспечения рендомизации видна и из того значения, какое этой проблеме уделяется в теории эксперимента. Там разработаны специальные приемы, позволяющие решать указанную задачу [127; 50, 74].
51
незаконно оценивают ошибки своих результатов с помощью формулы, не применимой к их исследованиям.
Четкое понимание условий проведения собственно-случайной выборки должно помочь социологу "избрать другие виды выборки, если эти условия не могут быть реализованы. В такой ситуации осознанное применение неслучайной выборки может оказаться гораздо более эффективным, чем использование методики «лжеслучайного» отбора 1.
Уже отмечалось, что величина ошибки (при данном способе отбора) зависит от степени однородности совокупности и от объема выборки. Применительно к случай-~ ной выборке эти зависимости могут быть строго описаны следующей основной формулой выборочного метода:
картинка
Согласно основной формуле при случайном отборе ошибка выборки прямо пропорциональна среднеквадра-тическому отклонению и обратно пропорциональна корню квадратному из объема выборки.
Случайная выборка в зависимости от того, может ли единица совокупности, однажды попавшая в выборку, быть вновь в нее включенной, бывает повторной и бесповторной. При бесповторной выборке величина ошибки ум-
52
ножается на коэффициент, характеризующий долю исходной совокупности, не попавшей в выборку, т. е.
картинка
где N — объем генеральной совокупности.
Очевидно, что этот коэффициент способен существенно повлиять на величину средней ошибки (в сторону ее уменьшения), если для изучения отобрана значительная часть генеральной совокупности. Использование коэффициента для бесповторной выборки чаще всего целесообразно при проведении исследований на промышленных предприятиях, где объем выборки очень часто составляет значительную часть от генеральной совокупности1.
Значение величины ошибки выборки позволяет предположительно определить интервалы, в которых находится «истинная» средняя, т. е. средняя генеральной совокупности (при предположении отсутствия ошибок смещения) [пропуск ф-лы]
Согласно данным Л. А. Гордона и Э. В. Клопова молодые незамужние женщины тратят еженедельно на телевидение в среднем 2 ч 15 мин. Средняя ошибка равна 19 мин. Если оставить в стороне вопрос о том, на какую генеральную совокупность распространяются приведенные данные, то «истинные» затраты времени на этот вид деятельности находятся в интервале между следующими величинами: 2 ч 15 мин— 19 мин и 2 ч 15 мин + 19 мин, т. е. 1 ч 56 мин < х < 2 ч 34 мин или х = 2 ч 15 мин ± 19 мин.
Выше приводилась формула для исчисления ошибки репрезентативности выборочной средней. Теория дает возможность определить аналогичные ошибки для других характеристик совокупности (децилей, квартилей, медиан), моментов различного порядка2.
4 Так, например, в обследовании рабочих промышленного предприятия Н. Ф. Наумовой и М. А. Слюсарянского объем выборки составил 25% всей совокупности рабочих [176; 147]. Еще большей (50%) была выборка во время обследования плавсостава Омского речного бассейна [178; 36]. В обследовании отношения к труду инженерно-технических работников 20 предприятий легкой промышленности было опрошено 69% всех лиц этой категории [179; 202].
53
картинка
Исчисление дисперсии
В приведенной выше формуле по определению ошибки случайной выборки предполагается, что а является характеристикой колеблемости изучаемого признака в генеральной совокупности. Однако очевидно, что это теоретическое требование в абсолютном большинстве случаев невыполнимо. Социолог не имеет информации на этот счет, как, впрочем, и о величине средней. Ведь именно для получения этих показателей он и намерен проводить выборочное обследование.
Как правило, в учебных пособиях по статистике выход из этого положения предлагают искать в использовании выборочных характеристик колеблемости. Такая замена корректна, если существует уверенность в строгом соблюдении требований случайного отбора при получении информации о данном показателе. Однако следует отметить, что и при соблюдении этих условий замена характеристик генеральной совокупности соответствующими показателями выборочной совокупности не является тривиальной задачей.
Строго говоря, выборочные показатели могут выступать в качестве более или менее хороших оценок характеристик генеральной совокупности. Качество этих оценок зависит от того, насколько они являются состоятельными, несмещенными и эффективными.
Выше уже отмечалось, что состоятельность оценки предполагает ее приближение с увеличением объема выборки к истинному значению характеристики генеральной совокупности. Оценка считается эффективной тогда, когда она обладает необходимой для исследователя точностью, т. е. содержит ошибку, не превышающую заданную величину. Очевидно, что состоятельные оценки, как правило, могут быть и эффективными, если исследователь в состоянии увеличить объем выборки до нужного уровня.
Особое значение имеет такое математическое свойство оценок, как несмещенность1. Наличие этого свойства предполагает, что выборочные оценки определенной характеристики отклоняются от ее истинного значения одинаково «в разные стороны» и не дают смещения, т. е. не носят систематического характера.
Выборочные оценки ряда характеристик действительно носят; без использования корректировки несмещенный характер. Так дело обстоит с оценками средней, которые получают при простом случайном отборе2. Математическое ожидание выборочной средней (т. е. средняя из выборочных средних, взвешенных по вероятности их появления) в точности совпадает при соблюдении правил случайного отбора с истинной средней, т. е.
картинка
стик генеральной совокупности получают с помощью более сложных коррективов1.
Признавая, что несмещенные оценки, как правило, явно предпочтительнее смещенных, следует, 'однако, иметь в виду, что неточность исходной информации, наличие систематических ошибок выборки и регистрации обычно намного превосходят ошибки, возникающие из-за использования несмещенных в математическом смысле оценок.
К тому же в некоторых ситуациях можно предпочесть смещенную, но более эффективную (т. е. обладающую меньшим отклонением от истинной величины переменной) ошибку несмещенной, но менее эффективной [306;
165—170], [324; 28—30].
Использование выборочной дисперсии с соответствующими коррективами в качестве оценки дисперсии генеральной совокупности возможно только в том случае, если при отборе не происходило своих систематических ошибок. Перед ошибками в отборе бессильны любые математические ухищрения.
Приведем такой условный пример. Из генеральной совокупности семей, характеризуемых числом выписываемых газет, произведена выборка (отобранные варианты подчеркнуты):(пропущена таблица чисел)
Генеральная средняя, которая исследователю не известна, составляет примерно 3 газеты. Выборочная средняя, оказавшаяся 'в распоряжении социолога, составила 6 газет. Фактическая ошибка равна 3. Возникает воп
рос: может ли исследователь, не имеющий сведений о генеральной совокупности, получить представление о дисперсии генеральной совокупности и, следовательно, об ошибке средней?
Произведем необходимые вычисления и получим G2==2,5. Средняя ошибка выборки |л=±0,4. Генеральная средняя должна находиться в этом случае в интервале между 5,6 и 6,4. Фактически генеральная средняя находится далеко внепределов данного интервала. Между тем социолог, доверившись полученным оценкам, мог утверждать, что он получил неплохие с точки зрения репрезентативности результаты. Почему же его «подвел» традиционный аппарат? Дело объясняется просто.
В нашем примере отбор имел явно смещенный характер. В выборку попали в основном семьи, выписывающие много газет (предположим, что мы проводили почтовое обследование, а анкеты вернули нам как раз особенно активные читатели газет). В рамках отобранного массива разброс оказался небольшим, а это произошло не потому, что исходная совокупность отличалась однородностью. Небольшие величины дисперсии и соответственно средней ошибки выборки оказались порождением неправильного отбора единиц совокупности для исследования. Фактически дисперсия в генеральной совокупности была равна 3,3, что значительно больше выборочной дисперсии. Именно поэтому подчас и возникает парадоксальная ситуация: небольшие ошибки могут свидетельствовать не о хорошем качестве проведенного обследования, а скорее о плохом1.
Мы до сих пор рассуждали о том, насколько правомерно использовать выборочную дисперсию при определении ошибки средней. Следует, однако, заметить, что при проектировании выборочного обследования социолог Не обладает информацией об этой дисперсии. В такой ситуации обычно поступают следующим образом.
Если идет речь о качественных признаках, то имеется возможность ориентироваться на максимальную величину дисперсии, равную 0,25, если о количественных, то в
1 Иногда может возникнуть другая ситуация, при которой смещенная, например, из-за нарушений правил отбора выборка может дать Лучшую, более эффективную оценку средней, чем выборка несмещенная, однако имеющая очень большую дисперсию.
57
этом случае исследователь должен опираться на материалы прошлых исследований, пробного обследования, экспертные оценки.
Вероятностный характер ошибок
Рассуждая о величине ошибки выборки и о характере ее зависимости от дисперсии и объема изучаемой совокупности, мы не должны забывать о том, что речь идет о теоретически возможной величине ошибки. Ведь реальная фактическая ошибка может быть, как указывалось, установлена только в сравнительно редких случаях. Поэтому у социолога не может быть полной уверенности в том, что найденная им выборочная средняя будет отличаться от не известной ему генеральной средней не более чем на величину средней ошибки. Очевидно, что может идти речь только о вероятностных, предположительных оценках этой величины.
В теории вероятностей разработаны принципы, позволяющие определить конкретную вероятность того, что фактическая не известная исследователю ошибка не превышает средней стандартной ошибки.
Покажем это на примере со студентами. Предположим, что выборку по 200 человек осуществляли в порядке эксперимента независимо друг от друга 100 социологов. Мы можем также считать, что выборка носила бесповторный характер, и студент, включенный в одну выборку, уже автоматически не мог попасть в другую. В результате эксперимента было получено 100 выборочных средних о возрасте, успеваемости, социальном происхождении, жилищных условиях и других характеристиках студентов. Согласно теории вероятностей выборочные средние, полученные описанным выше путем, будут располагаться по кривой, которая при увеличении числа этих средних, будет приближаться к нормальному распределению.
В соответствии с этим распределением основная масса выборочных средних (примерно 2/3 всех средних—68%) отклоняется от генеральной средней на величину, не превышающую одной средней ошибки (^i). При этом одна половина этих средних (или 34% общего числа) больше генеральной средней (но на величину не более (л), а другая половина — меньше, но опять-таки не более чем на ц.
58
Если же считать допустимым отклонение от истинной средней (или предельную ошибку), равное А=2|л, то окажется, что этому более мягкому требованию удовлетворяют уже 95% всех выборочных средних. И опять-таки здесь соблюдается симметрия: одна половина выборочных средних будет больше истинной средней на величину, не превышающую 2ц, а другая—соответственно меньше. Наконец, 'предельной ошибке, равной Зц, соответствует вероятность, равная 99%.
Со снижением требовательности к точности, с возрастанием нашей готовности смириться с возможностью более крупной предельной ошибки возрастает число выборочных средних, на которые мы можем положиться при указанных выше ограничениях. Если мы хотим, чтобы выборочная средняя отличалась от генеральной средней всего яа ц, то мы должны 'быть готовы к тому, что 32% всех средних (100%—68%) могут иметь более крупные ошибки. Но если нас устроит меньшая точность и предельная ошибка, равная 2|х, для нас терпима, то мы можем исходить из того, что только 5% (100%—95%) всех возможных выборочных средних могут отклоняться более чем на 2|л. Наконец, если мы будем 'мириться с предельной ошибкой, равной 3{л, то тогда только 1 % всех выборочных средних может обладать еще более крупными недостатками.
картинка
Итак, чем выше предельная ошибка, тем меньшее число средних может выйти за ее границы. Это важное положение математической статистики многим хорошо известно из практики: чем точнее должен быть результат измерения, тем труднее его достичь, и, наоборот, чем менее жесткие требования, тем легче они могут быть удовлетворены.
59
Рассуждая о распределении выборочных средних вокруг истинной средней аналогичным образом, мы оперировали мысленным экспериментом, в котором множество социологов изучали один и тот же объект (в данном случае студентов одного вуза) и измеряли одни и те же свойства. Поэтому и у нас появилась возможность сравнивать друг с другом 100 выборочных средних.
Но в действительности так не бывает. Социолог имеет возможность по каждому показателю получить только одну выборочную среднюю. Тогда перед ним возникает вопрос о том, какова же возможная ошибка этой единственной средней, находящейся в его распоряжении. В этой ситуации упомянутые выше величины 68%, 95%, 99% превращаются для него в прогнозные, вероятностные оценки возможной ошибки его индивидуальной выборочной средней.
В приведенном выше примере из исследования Л. А. Гордона и Э. В. Клопова средние затраты времени на просмотр телепрограмм у незамужних молодых женщин характеризовались величиной х=2 ч 15 мин ± ± 19 мин. Второй элемент этого выражения представляет среднюю (или стандартную ошибку), соответствующую, как отмечалось, уровню вероятности 0,68.
Если же мы хотим ориентироваться на более высокий уровень вероятности, например 0,95, то тогда нам придется согласиться на предельную ошибку, равную 2|л, т. е. в данном случае 38 мин. Это означает существенное расширение интервала, в котором может оказаться истинная средняя (теперь она находится между 1 ч 37 мин и 2 ч 51 мин), и заметное ухудшение точности результата.
Теория случайной выборки позволяет, как мы видим, заранее, еще на стадии проектирования исследования, предсказывать величину возможной ошибки выборки.
Некоторые социологи исходят из того, что теория случайной выборки разрешает применение формул только тогда, когда изучаемые признаки распределяются в генеральной совокупности нормально [132; 49—52], [6; 45]. В действительности нормальное распределение выборочных характеристик присуще большим выборкам в соответствии с центральной предельной теоремой независимо от типа распределения изучаемых характеристик. В то же время несомненно, что близость распределения изучаемых признаков к нормальному распределению суще-
60
ственно повышает точность выборочных результатов, особенно, если объем выборки является небольшим.
В иной ситуации приходится прибегать к расчетам, опирающимся на распределение, не являющееся строго нормальным, например на распределение Стьюдента.
Очевидно, что каждому показателю, исчисленному по материалам выборочного обследования, присуща своя, конкретная величина ошибки. Так как абсолютное большинство исследований оперирует десятками и даже сотнями показателей, то число вычисленных ошибок в принципе может быть таким же большим1.
Совершенно ясно, что ошибки репрезентативности одного и того же социологического исследования подвержены сильным колебаниям. В уже упоминавшейся книге «Человек после работы» величина ошибок, относящихся к данным о доле лиц, обладающих определенным признаком, колеблется от 1,2 до 4,5%.
Но возможно ли исчисление интегральной оценки репрезентативности всей совокупности показателей, использованных в социологическом исследовании? Такой вопрос кажется вполне естественным. Однако даже в литературе он поставлен сравнительно недавно, а число попыток практически определить величину этой интегральной оценки невелико.
Данная методическая проблема тесно переплетается с более общим вопросом о соизмерении признаков различного характера, который, в частности, играет столь важную роль в таксономии.
Одно из решений этой важной задачи было предложено П. Махалонобисом. Оно предполагает сопоставление двух векторов — характеристик генеральной и выборочной совокупностей — и исчисление показателя, характеризующего суммарное расстояние между всеми компонентами этих векторов.
Объем выборки при случайном отборе
Естественно, социолог не хочет ограничиться ролью прогнозиста своих будущих ошибок. Он стремится свести
4 Наиболее детально сведения об ошибках репрезентативности представлены в книге Л. А. Гордона и Э. В. Клопова «Человек после работы». Авторы приводят данные об ошибках почти 600 показателей [48; 62—65].
61
размеры этих ошибок к минимуму. Теория случайной выборки позволяет ему решать подобные задачи. В качестве главного инструмента управления размером ошибки выступают трудовые и денежные ресурсы, находящиеся в распоряжении исследователя, который в конечном счете стремится к тому, чтобы максимизировать точность результатов в расчете на единицу издержек.
Прибегая к упрощению, можно полагать, что средства, вкладываемые в проведение выборочного исследования, пропорциональны объему выборки и что поэтому число единиц, включенных в выборку, и отражает величину затрат*. Теория случайной выборки позволяет заранее определить, какой объем выборки необходим при заданной предельной ошибке, т. е. при необходимой точно-
картинка
Заметим, что при очень большом объеме совокупности (скажем, свыше нескольких сотен тысяч единиц) необходимая численность выборки может составить десятые и сотые доли процента генеральной совокупности. Например, 62 тыс. семей рабочих, служащих и колхозников, обследуемых бюджетными статистиками ЦСУ СССР, составляют 0,1% генеральной совокупности семей. Во время единовременных обследований доходов и жилищных условий населения объем выборки составляет 0,5% [109; 24]. При исследовании аудитории «Правды» (1968г.) число проведенных интервью составило 0,02% общего числа подписчиков.
Следует указать, что явным заблуждением являются мнения о том, что объем выборки должен составлять определенный процент генеральной совокупности (согласно одним мнениям — 1%, другим — 10% и т. п.). В действительности при соблюдении правил случайного отбора ошибка выборки, как это видно из формул, зависит при данной дисперсии только от абсолютной численности единиц в выборке. Доля выборки в генеральной совокупности используется как корректировочный коэффициент в бесповторной выборке и то лишь тогда, когда эта доля достаточно велика1.
В реальной социологической практике объем выборки определяется с учетом множества различных обстоятельств, среди которых наряду с дисперсией изучаемых признаков особое значение имеют экономическая сторо-
на дела, число выделяемых подгрупп (об этом подробнее позже), специфика задач исследования, его организация, состав интервьюеров, число изучаемых признаков и многое другое. Поэтому приведенная формула (см. с. 62), ориентированная на одноступенчатую чисто случайную выборку, выступает, скорее, как некоторый эталон для сравнительной оценки реального объема выборки, формирующийся под влиянием многих обстоятельств4. Все эти и другие обстоятельства приводят к тому, что объем выборки довольно редко определяется социологом с помощью расчетов, опирающихся на приведенные выше формулы. По данным контент-анализа социологических публикаций на такие расчеты .ссылаются только 2% всех авторов.
Следует отметить, что в современных конкретных социологических исследованиях появилась тенденция к уменьшению объема 'выборки2. Число опрошенных 'в кругу профессиональных социологов перестает быть показателем масштабов исследования. Дело, скорее, обстоит наоборот. Уровень профессионализма находится нередко в представлении ученых в обратной зависимости от количества лиц или других объектов, которые пришлось изучить, чтобы 'получить серьезные, надежные выводы3.
1 Анализ 200 советских социологических обследований за 1970— 1973 гг., в которых применялось интервьюирование, показал, что примерно половина всех обследований (48%) опирались на выборку объемом от 500 до 2500 человек. При этом в 14% всех обследований объем выборки составил от 300 до 500 человек, а в 10%—более 3000.
2 За последнее время, например, объем национальной выборки в исследованиях английских радиослушателей сократился с 4000 до 2200 человек [117; 10]. Характерная эволюция произошла и в наших исследованиях аудитории центральных газет. В первом исследовании («Известия») было проинтервьюировано 8 тыс. человек. Во время опроса читателей «Правды» (1968 г.) число респондентов было сокращено до 4 тыс.
3 На сбор информации приходится значительная часть всех расходов. Отсюда и стремление сократить их за счет уменьшения объема выборки. По расчетам Г. Хаймена стоимость опроса по национальной выборке в США (объем выборки 1500—2000 человек) составляет примерно 60 тыс. долларов (40% всех затрат связаны со сбором информации, 50—с анализом, 5—10% — расходы на машину и подготовка отчета). По его же данным для опроса необходимо прибегнуть к услугам не менее 60—70 интервьюеров. На сбор информации и ее кодировку уходит обычно 3—4 месяца и даже более [286; 6—7].
64
В настоящее время ведутся активные пути дальнейшего уменьшения объема выборки. Один из самых эффективных из них связан с методом последовательного анализа Вальда.
Определение объема выборки по фактически наблюдаемым данным позволяет, как правило, существенно сократить ее объем. Теоретическое обоснование этого утверждения нужно искать в том факте, что объем выборки в одном случае устанавливается априори, в другом — на основе полученных эмпирических данных. Несомненно в то же время, что установление объема выборки с помощью последовательного анализа требует дополнительных затрат труда по сравнению с использованием традиционных методов1.
Механический отбор
Механический (или систематический) отбор является, вероятно, самым распространенным приемом2. Это объясняется, видимо, тем, что из всех приемов выбора данный прием является простейшим. В частности, он значительно проще, чем случайный отбор, предполагающий умение пользоваться таблицами случайных чисел. К тому же механический отбор тесно переплетается с пропорциональным стратифицированным отбором, что приводит к снижению ошибки выборки.
Например, применение механического отбора из членов жилищного кооператива списка, составленного в порядке поступления в данный кооператив, обеспечит пропорциональное представительство членов кооператива с разным стажем. Использование этого же приема для отбора респондентов из списка лиц, составленного по алфавиту, обеспечивает равные шансы для фамилий, начинающихся на разные буквы, и т. п., что может иметь значение в тех случаях, если совокупность состоит из представителей различных национальностей или если идет речь о жителях одного и того же селения, где часто встречаются одни и те же фамилии. Использование та-
1 Об использовании метода последовательного анализа в выборочных обследованиях см. [25], [339; 261—262]. Этот метод использовался нами при контроле за качеством кодировки анкет [142].
2 Одна часть ученых считает механический отбор особой процедурой случайной выборки, другая — трактует его как самостоятельную разновидность выборки [52; 60].
65
бельных списков на предприятиях может обеспечить необходимую пропорциональность в представительстве работников с разным стажем. Заметим, что некоторые социологи не понимают этой стороны механического отбора и без должных оснований полагают, что использование табелей как основы выборки всегда ведет к систематическим ошибкам [150; 12].
Механический отбор можно осуществлять, и в этом его существенное преимущество по сравнению с обычными процедурами случайной выборки, без предваритель-ного составления списка единиц исследования, используя расположение единиц исследования на определенной территории «в натуре» или же географические карты. Так, механический отбор можно применить для отбора домов и квартир, учреждений культуры и т. д.
Механический отбор в силу отмеченных выше особенностей близко соприкасается с отбором из стратифицированного списка (или типическим отбором), и поэтому часто ошибки репрезентативности при этом отборе могут быть ниже, чем при случайной выборке.
Среди методических проблем этого вида отбора следует выделить прежде всего решение вопроса о размере интервала. Если обозначить через / размер интервала, N — число единиц в генеральной совокупности, через k— число интервалов, то при выборе интервала должно соблюдаться следующее соотношение:
Например, если объем исходной совокупности 1820 единиц, 'примерный объем выборки 70, то интервал должен быть равен 26.
Возможен случай, когда первая единица окажется под номером 1+\ (т. е. в нашем примере 27), последняя единица получит номер kl+l, в данном случае 1846. Между тем в исходной совокупности единиц нет единиц с номерами 1821—"1846.
Отсутствие необходимых номеров в списке может быть компенсировано с помощью следующих приемов. Во-первых, можно продолжить список за счет единиц, отобранных случайным образом из самого списка. Во-вторых, можно рассматривать список как «круговой»:
после единицы с последним номером располагаются единицы с первыми номерами. В-третьих, можно изменить
66
тактику отбора и обеспечить такое положение, чтобы величине I точно соответствовал объем исходной совокупности. Чтобы ее пополнить, можно опять-таки с помощью случайного отбора взять из первичного списка необходимое количество повторных единиц совокупности.
Механический отбор имеет не только преимущества, но и известные недостатки, которые представляются для некоторых социологов настолько серьезными, что они выражают сомнения в надежности этого метода отбора [274; 121]. Дело в том, что не так уж редко списки, используемые для систематического отбора, содержат, как уже отмечалось, либо определенные тренды, либо колебания. В одних ситуациях существование трендов помогает улучшить выборку за счет приближения механического отбора к стратифицированному, однако в ряде других имеет 'место противоположная картина [89а].
Прежде всего отметим значение выбора первой единицы. Неудачный выбор этой единицы может привести к серьезным ошибкам при отборе. Пусть необходимо произвести отбор из списка квартир пятиэтажных домов с интервалом, равным 20. Если в каждом подъезде на одной площадке находятся 4 квартиры и если первой единицей отбора будет квартира № 3 в первом доме, то тогда в выборку попадут квартиры под номерами (кроме № 3) 23, 43, 63, 83, 103 и т. д. Все они окажутся на первом этапе. Вполне возможно, что состав жителей на первых этажах по некоторым параметрам отличен от тех, кто живет выше (здесь могут преобладать пенсионеры, люди с больным сердцем и т. д.). Это обстоятельство может существенно повлиять на итоги некоторых опросов 1.
Опасность возникновения систематических ошибок при механическом отборе стимулировала поиск усовершенствований этого метода. Прежде всего следует указать на необходимость использования таблиц случайных чисел для выбора первой единицы отбора. Известное применение находит также прием, заключающийся в изменении начальной единицы через определенное число интервалов. Можно также выбрать в начале списка не-
' Примеры возможных ошибок при систематическом отборе приводит ряд авторов [218; 28], [225; 93].
67
сколько исходных единиц и осуществлять отбор через одинаковые или разные интервалы, как бы параллельно. Наконец, минусы механического отбора можно преодолеть, используя метод «независимых выборок».