Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
УМК стат оценивание.doc
Скачиваний:
5
Добавлен:
23.08.2019
Размер:
3.01 Mб
Скачать

Тема «Организация выборочных обследований»

Выборочное наблюдение представляет собой один из наиболее широко применяемых видов несплошного наблюдения. При проведении выборочного наблюдения обследуются не все единицы изучаемого объекта (генеральной совокупности), а лишь некоторая, тем или другим случайным образом отобранная часть этих единиц (выборочная совокупность).

Таким образом, вся совокупность единиц, из которой осуществляется отбор, составляет генеральную совокупность.

Часть совокупности, случайным образом отобранная из генеральной совокупности, представляет собой выборочную совокупность – выборку.

Выборочное обследование осуществляется с меньшими затратами труда и средств и в более короткие сроки, чем сплошное наблюдение, что повышает оперативность статистической информации, уменьшает ошибки регистрации. В проведении ряда исследований выборочный метод является единственно возможным, например, при контроле качества продукции, сопровождающимся разрушением проверяемого изделия.

Хорошо организованное выборочное обследование дает достаточно точные результаты, поэтому выборка может применяться для проверки данных сплошного наблюдения. Минимальная численность обследуемых единиц позволяет провести исследование более тщательно и квалифицированно. Например, при переписях населения практикуются выборочные контрольные обходы для проверки правильности записей сплошного наблюдения.

Проведение выборочных исследований статистической информации состоит из следующих этапов:

– формулировка объекта и целей выборочного наблюдения;

– обоснование целесообразности выборочного наблюдения;

– отграничение генеральной совокупности;

– выбор схемы отбора единиц для наблюдения;

– определение числа единиц, подлежащих отбору;

– проведение отбора единиц;

– наблюдение отобранных единиц по установленной программе;

– расчет выборочных характеристик и их ошибок;

– распространение выборочных данных на генеральную совокупность;

- анализ полученных результатов.

Конечная задача выборочного наблюдения состоит в том, чтобы распространить полученные в ходе выборочного наблюдения результаты на всю совокупность единиц данного рода, находящихся в сходных условиях (генеральную совокупность).

Отбор единиц из генеральной совокупности в выборку производится таким образом, чтобы выборочная совокупность по своему составу и величине обобщающих статистических характеристик (средних, долей, дисперсий) представляла бы (репрезентировала) генеральную совокупность. Поэтому английские статистики иногда называют выборочный метод репрезентативным (representative method).

Для того чтобы выборка была представительной (репрезентативной), необходимо обеспечить выполнение принципа случайности отбора единиц из генеральной совокупности в выборку. Случайная выборка - это выборка, при которой каждая из единиц генеральной совокупности имеет равную вероятность быть отобранной в выборку.

Невыполнение принципа случайности отбора приводит к тому, что выборка становится непредставительной (нерепрезентативной) как по своему составу, так и по величине обобщающих статистических характеристик. Следовательно, ее результаты нельзя распространять на генеральную совокупность.

Степень представительности выборки зависит от способа организации выборки и от ее объема. В силу того, что часть (выборка) заведомо не вполне точно представляет целое (генеральную совокупность), полной репрезентативности выборки достичь не удается. Поэтому необходима оценка надежности результатов выборки и возможности их распространения на генеральную совокупность.

Принцип случайности обеспечивается с помощью различных способов отбора единиц генеральной совокупности в выборку. Существуют 4 основных способа отбора:

- собственно-случайный (простой случайный);

- механический (систематический);

- серийный (гнездовой);

- типический (стратифицированный, районированный).

На практике могут также использоваться комбинация нескольких способов отбора (комбинированный отбор), отбор в несколько этапов (многоступенчатый отбор), отбор в несколько этапов с сохранением единицы наблюдения (многофазный отбор), комбинирование выборочного и сплошного наблюдения. Выбор схемы отбора зависит от характера изучаемого объ­екта.

Вне зависимости от способа отбора он может быть повторным и бесповторным. При повторном отборе (схема возвращенного шара) отобранная единица после извлечения из генеральной совокупности регистрируется и вновь возвращается в генеральную совокупность, откуда опять может быть извлечена случайным образом. При бесповторном отборе (схема невозвращенного шара) - отобранная единица в выборку обратно не возвращается.

Собственно–случайный отбор состоит в отборе единиц из всей генеральной совокупности в целом посредством жеребьевки или на основании таблиц случайных чисел.

Жеребьевка состоит в том, что на каждую единицу отбора составляется карточка, которой присуждается порядковый номер. После тщательного перемешивания по очереди извлекаются карточки, пока не будет отобрано требуемое число единиц.

Случайными числами называются ряды чисел, являющихся реализациями последовательности взаимно независимых и одинаково распределенных случайных величин. Эти последовательности чисел получаются либо с помощью физических генераторов (подбрасывание кубиков с нанесенными на их сторонами цифрами; вытягиванием из урны карточек с написанными на них цифрами, преобразованием случайных сигналов и использованием др. физико–технических процессов), либо с помощью программных генераторов (аналитическим методом с помощью программ для ЭВМ).

Числа, являющиеся результатами соответствующей вычислительной процедуры, называются псевдослучайными числами. Последовательность псевдослучайных чисел носит детерминированный характер, но в определенных границах она удовлетворяет свойствам равномерного распределения и свойству случайности.

Случайные числа могут быть выбраны по таблице случайных чисел. Существует несколько таблиц случайных чисел, одна из них приведена в приложении 1.

Данная таблица содержит 2500 случайных чисел, объединенных для удобства пользования таблицей в 500 блоков по 5 значений.

Таблица случайных чисел может использоваться несколькими разными способами, и в каждом случае необходимо принять три решения. Во-первых, следует решить, сколько разрядов мы будем использовать, во-вторых, необходимо разработать решающее правило для их использования; в-третьих, нужно выбрать исходную точку и способ прохождения по таблице.

Первое решение определяется просто количеством объектов в совокупности. Если совокупность состоит из менее чем 10 объектов, используются однозначные числа; при числе объектов от 10 до 99 – двузначные числа; от 100 до 999 – трехзначные и т.д. В каждом случае мы должны позаботиться о том, чтобы каждый перенумерованный объект имел возможность быть выбранным.

Как только это сделано, мы должны разработать правило, которое бы связывало числа в таблице с номерами наших объектов. Здесь существуют две возможности. Самый простой способ (хотя и не обязательно самый правильный) – использовать лишь те числа, которые попадают в число номеров, приписанных нашим объектам. Так, если мы имеем совокупность, состоящую из 250 объектов (и, таким образом, используем трехзначные числа), и решаем начать с левого верхнего угла таблицы и двигаться вниз по столбцам, мы включим в нашу выборку объекты с номерами 100, 084 и 128 и пропустим числа 375 и 990, не соответствующие нашим объектам. Этот процесс будет продолжаться до тех пор, пока не будет определено число объектов, нужных для нашей выборки.

Более трудоемкая, однако, методически более правильная процедура основывается на положении, что для сохранения случайности, характерной для таблицы, должно быть использовано каждое число данной размерности (например, каждое трехзначное число). Следуя данной логике и вновь имея дело с совокупностью из 250 объектов, мы должны разбить область трехзначных чисел от 000 до 999 на 250 одинаковых промежутков. Поскольку таких чисел 1000, мы делим 1000 на 250 и находим, что каждая из частей содержит четыре числа. Таким образом, числа таблицы от 000 до 003 будут соответствовать объекту 1, от 004 до 007 – объекту 2 и т.д. Теперь, чтобы установить, какой номер объекта соответствует числу таблицы, следует разделить трехзначное число из таблицы и округлить до ближайшего целого числа. С помощью данного метода тот же фрагмент таблицы, которым мы пользовались раньше, позволит нам включить в выборку объекты 025 (100:4), 093 (375:4, округлено в меньшую сторону), 021 (084:4), 247 (990:4, округлено в меньшую сторону) и 032 (128:4) и не пропустить ни одного числа из таблицы.

И, наконец, мы должны выбрать в таблице исходную точку и способ прохождения. Исходной точкой может быть верхний левый угол (как в предыдущем примере), нижний правый угол, левый край второй строки или любое другое место. Этот выбор абсолютно произволен. Однако, работая с таблицей, мы должны действовать систематически. Мы могли бы взять три первых знака из каждой пятизначной последовательности, три средних знака, три последних знака или даже первый, второй и четвертый знаки. (Из первой пятизначной последовательности с помощью этих различных процедур получаются, соответственно, числа 100, 009, 097 и 109.) Мы могли бы применить эти процедуры в направлении справа налево, получив 790, 900, 001 и 791. Мы могли бы идти вдоль рядов, рассматривая поочередно каждую следующую цифру и игнорируя разбиение на пятерки (для первого ряда будут получены числа 100, 973, 253, 376 и 520). Мы могли бы иметь дело лишь с каждой третьей группой цифр (например, с 10097, 99019, 04805, 99970). Существует множество самых разнообразных возможностей, и каждая следующая ничуть не хуже предыдущей. Однако как только мы приняли решение о том или ином способе работы, мы должны систематически следовать ему, чтобы в максимальной степени соблюдать случайность элементов в таблице.

Механический отбор заключается в том, что составляется список единиц генеральной совокупности и в зависимости от числа отбираемых единиц устанавливается шаг отбора, т.е. через какой интервал следует брать для наблюдения единицы. Например, в простейшем случае, при 10%–м отборе, отбирается каждая десятая единица по этому списку, т.е. если первой взята единица за № 1, то следующими отбираются 11–я, 21–я и т.д. В такой последовательности производится отбор, если единицы совокупности расположены в списке без учета их «рангов», т.е. значимости по изучаемым признакам. Начало отбора в этом случае не имеет значения, его можно начать в приведенном примере от любой единицы из первого десятка. При расположении единиц совокупности в ранжированном порядке за начало отбора должна быть принята середина интервала (шага отбора) во избежание систематической ошибки выборки.

При достаточно большой совокупности этот способ отбора близок к собственно случайному, при условии, что применяемый список не составлен таким образом, чтобы какие-то единицы совокупности имели больше шансов попасть в выборку.

Механический способ отбора используется тогда, когда мы хотим исследовать сравнительно большую совокупность, каждый член которой занесен в единый список, такой, как, например, телефонная книга, список зарегистрированных избирателей и т.п. Процедура выглядит следующим образом.

Подсчитайте (или оцените) количество объектов в совокупности и разделите его на желательное количество объектов в выборке. Если обозначить результат через k, то фактически можно сказать, что мы хотим выбрать один из каждых k объектов, или, говоря по-другому, каждый k-й объект.

Предположим, что из совокупности в 10 000 единиц, мы хотим сформировать выборку размером в 500 единиц. Чтобы отобрать механическую выборку:

1. Мы делим количество объектов в совокупности на желательный размер выборки, чтобы определить число k (в данном случае k = 10 000:500 = 20).

2. С помощью таблицы случайных чисел мы выбираем номер объекта между 1 и k (в нашем примере между 1 и 20) для включения в нашу выборку.

3. Мы движемся по списку документов, выбирая каждый k-й (двадцатый) объект.

Таким образом, если k равно 20, и мы пользуемся таблицей случайных чисел, представленной в приложении 1, начиная с верхнего левого угла таблицы, рассматривая двузначные числа (k в данном случае находится между 10 и 99) и, используя только те элементы таблицы, которые соответствуют реальным номерам объектов (т.е. только те, которые находятся между 01 и 20), первым выбранным объектом будет 10. Мы, таким образом, включаем в нашу выборку объекты 10, 30 (10+k), 50 (10+2k), 70 (10+3k) и т.д., и так вплоть до объекта 9900 (10+499k). Эту верхнюю границу выборки можно задать в виде общей формулы j+(n–1)*k, где j – первое случайное число, a n – желаемый объем выборки.

Техника формирования механической выборки по сравнению с формированием собственно-случайной выборки имеет два важных преимущества: ее удобно применять по отношению к большим совокупностям, отвечающим условию наличия единого списка, и у нее много потенциальных возможностей использования. Тем не менее, применяя эту процедуру, мы должны иметь в виду одну очень важную ее особенность. Поскольку механическая выборка менее случайна, чем собственно-случайная, в результате может быть получена менее репрезентативная выборка.

Прежде всего, вспомним, что случайная выборка – это выборка, в которой каждый конкретный объект и каждое возможное сочетание из п объектов имеют равную вероятность быть выбранными. В механической выборке выполняется только одно из этих условий. Поскольку формирование такой выборки начинается с выбора по таблице случайных чисел первого объекта, любой объект из совокупности, в конечном счете, имеет равные возможности войти в выборку (хотя и не обязательно при первой попытке, так как она осуществляется в пределах от 1 до k). Однако поскольку далее мы выбираем лишь объекты, отстоящие на k номеров один от другого, не всякое возможное сочетание оказывается допустимым. Так, в примере при k =20 в качестве первого можно выбрать любой объект от 1 до 20, но, как только выбран объект с номером 10, мы уже не можем включить объекты с номерами 9, 14, 237 и 5 724 просто потому, что номера этих объектов не отличаются от 10 на целое число k. Следовательно, механическая выборка – это в лучшем случае лишь приближение к истинной случайной выборке.

Данное наблюдение особенно важно, когда список, из которого производится выборка, характеризуется систематической направленностью. Для алфавитных и хронологических списков это обычно не существенно, однако для других типов списков может оказаться важным. Например, мы хотим измерить уровень умственных способностей в выборке, состоящей из учеников школы, в каждом классе которой 20 детей. В школе 100 классов, т.е. всего 2000 учеников. В ответ на нашу просьбу директор предоставляет список всех учеников школы, из которого мы собираемся извлечь выборку объемом в 100 человек. Однако перед нами не алфавитный список, а последовательность списков отдельных классов. Более того, список каждого класса дан не в алфавитном порядке, а соответствует положению, занимаемому учеником в классе: лучшие ученики идут вначале, и списки продолжаются в порядке убывания успехов. При таком положении дел, если выбирать каждого двадцатого (2000:100), начиная со случайным образом выбранного объекта под номером 1, мы получим выборку, состоящую из 100 лучших (и, возможно, самых умных) учеников школы. Если случайным образом будет выбран объект 10, в выборку попадут одни середняки. А если начать с объекта 20, то мы выберем лишь самых плохих учеников школы. Иными словами, внутренняя направленность, характеризующая список, на котором основана наша выборка, окажется причиной получения нерепрезентативной выборки. В конце концов все это приведет к тому, что мы либо не сможем обобщить наши результаты на генеральную совокупность, либо (если возникшая ситуация останется незамеченной) придем к потенциально неверным выводам, к систематической ошибке, и, следовательно, - к смещению в оценках.

При серийной (гнездовой) выборке генеральная совокупность разбивается на группы («гнезда»), внутри которых содержатся разнородные единицы наблюдения. Выделенные группы должны быть максимально похожи друг на друга, тогда как единицы совокупности внутри групп - максимально друг от друга отличаться (группы должны быть максимально однородными «снаружи» и максимально разнородными – «внутри»). В качестве таких «гнезд» могут выступать предприятия, семьи, коллективы, партии деталей и т.п. Затем путем случайного или механического отбора выделяют определенную часть этих серий и внутри серий обследуют все единицы совокупности. По сути дела, серийный отбор представляет собой случайный или механический отбор, осуществленный для укрупненных элементов исходной совокупности.

Используя серийный отбор, исследователь должен руководствоваться двумя основными положениями:

1) все единицы генеральной совокупности должны быть распределены между «гнездами»;

2) основные характеристики «гнезд» должны быть максимально идентичными по заданным параметрам.

Классический пример серийного отбора – контроль качества кирпичей. Партии кирпичей максимально похожи друг на друга: они содержат одинаковое количество кирпичей, причем, в каждой партии есть качественно разнородные кирпичи (условно говоря, - хорошие, перепеченные, недопеченные). В этой ситуации можно производить отбор партий (серий) кирпичей, а внутри партии – обследовать все кирпичи.

При типическом способе отбора генеральная совокупность разбивается на типические группы единиц по какому–либо признаку (формируются однородные совокупности), а затем из каждой из них производится собственно–случайный или механический отбор. В отличие от серийного отбора, выделенные группы должны быть максимально непохожи друг на друга, тогда как единицы совокупности внутри групп - максимально друг на друга похожи (группы должны быть максимально разнородными «снаружи» и максимально однородными – «внутри»). В основу группировки закладывается признак (или совокупность признаков), по которому единицы совокупности существенно отличаются друг от друга. Наиболее удачными, как правило, оказываются группировки, в основе которых лежит качественный признак.

Например, при изучении отношения к приватизации можно предположить, что тип предприятия, на котором работают респонденты (государственное или частное), будет существенно сказываться на их отношении к приватизации. В таком случае все предприятия разделяются на группы в зависимости от формы собственности, а потом из каждого типа отбираются респонденты, например, пропорционально численности данного контингента в генеральной совокупности.

Типический отбор организовать сложнее, чем собственно случайный, так как необходимы определенные знания о составе и свойствах генеральной совокупности, но зато он дает более точные результаты.

Отбор единиц из типических групп производится двумя методами:

- пропорционально объему (численности единиц) типических групп;

- непропорционально объему (численности единиц) типических групп,

в т.ч. - пропорционально колеблемости признака в типических группах (оптимальное размещение).