Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
СТ 07 - выборочное наблюдение и проверка гипоте...docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
98.01 Кб
Скачать

7.2. Виды выборок.

7.2.1. Вероятностные выборки.

В вероятностных выборках каждый объект генеральной совокупности (например, респондент) имеет равные шансы (вероятность) попасть в выборочную совокупность. Статистический расчет объема и ошибки выборки можно выполнить только для вероятностных выборок.

Случайная выборка.

Главный принцип случайной выборки – равенство шансов каждой единицы генеральной совокупности попасть в выборочную совокупность. Требование случайности отбора достигается на практике с помощью жребия или таблицы случайных чисел.

Пример. Предположим, что нам нужно провести 5%-ную выборку из 9540 студентов университета. Объем выборки составит: n =477 студентов. Ввиду того, что объем генеральной совокупности выражается четырехзначным числом, код каждого студента должен быть четырехзначным: от 0001 – для первого студента до 9540 – для последнего студента в списке. Для того чтобы провести отбор по таблице случайных чисел, нужно выбрать начальную точку: можно закрыть глаза и поставить наугад точку в таблицу карандашом. Предположим, мы попали в 12-ю строку в 1-й столбец

Следовательно, единица с номером 8535 является первой в выборке. Если двигаться по строке, то единица с номером 6514 будет второй, 0088 – третьей, 5029 – четвертой, 8267 – пятой и т.д. Если появится код с номером, большим чем число исследуемой генеральной совокупности студентов, то его пропускаем, так как у нас нет студента с таким номером. Когда закончится двенадцатая строка, переходим на следующую, тринадцатую, а потом на четырнадцатую. Процедура продолжается, пока число отобранных номеров не составит требуемый объем выборки (n = 477).

Механическая выборка (систематический отбор)

Механическая выборка является упрощенным вариантом случайной выборки. Единицам генеральной совокупности не приписываются номера, как в случайной выборке, они упорядочиваются в соответствии с фамилиями, адресами, телефонами (основываясь на алфавитных списках, картотеках, схемах и т. п.) Из полученного таким образом списка единицы отбираются через равные интервалы (шаг выборки) в выборку. Шаг выборки рассчитывается путём деления размера генеральной совокупности на объём выборки.

Схема отбора принимается такой, чтобы отразить основные свойства и пропорции генеральной совокупности. Простейший способ – по спискам единиц генеральной совокупности, составленным так, чтобы упорядочивание единиц было бы не связано с изучаемыми свойствами, проводится механический отбор единиц с шагом, равным N/n. Обычно отбор начинают не с первой единицы, а отступив полшага, чтобы уменьшить возможность смещения выборки. Частота появления единиц с теми или иными особенностями, например студентов с тем или иным уровнем успеваемости, живущих в общежитии, и т.д., будет определяться той структурой, которая сложилась в генеральной совокупности. Для большей уверенности в том, что выборка отразит структуру генеральной совокупности, последняя подразделяется на типы, и проводится случайный или механический отбор из каждого типа. Общее число единиц, отобранных, из разных типов, должно соответствовать объему выборки. Особые трудности возникают, когда нет списка единиц, а отбор нужно провести либо на местности, либо из образцов продукции на складе готовой продукции. В этих случаях важно детально разработать схему ориентации на местности и схему отбора и следовать ей, не допуская отклонений.

Например, счетчик получает указание двигаться от определенной автобусной остановки на север по четной стороне улицы и, отсчитав два дома от первого угла, войти в третий и провести опрос в каждом пятом жилом помещении. Неукоснительное следование принятой схеме обеспечивает выполнение главного условия формирования репрезентативной выборки – объективность отбора единиц.

Хотя среднее систематической выборки является несмещенной оценкой среднего генеральной совокупности (т.е. не является постоянно завышенным или заниженным), применение такого метода связано с определенными серьезными проблемами. Невозможно определить, насколько удовлетворительной является оценка, так как для нее нет надежной стандартной ошибки. Особенно серьезные проблемы могут возникнуть, если элементы генеральной совокупности упорядочены в основе выборки особым образом или если в основе выборки есть повторяющиеся группы элементов. В связи с тем, что построение случайной выборки обходится, как правило, не намного дороже, чем построение механической выборки, использования систематической выборки желательно избегать.

Стратифицированная выборка

При стратифицированном отборе генеральная совокупность разделяется на однородные группы (страты) по какому-либо признаку. Поскольку группы однородны, внутригрупповая дисперсия мала, а межгрупповая – велика. Это значит, что объекты в группе очень похожи друг на друга, а сами группы сильно различаются между собой. Из выделенных страт производится случайный отбор единиц по принципам случайной или механической выборок.

Стратифицированная выборка в любом случае оказывается точнее собственно-случайной. Этот метод особенно хорош, когда генеральная совокупность неоднородна. В этом случае собственно-случайный отбор крайне неэффективен (требует большого объема выборки).

Однако стратифицированная выборка может быть применена лишь при наличии дополнительной информации о генеральной совокупности (например, нам необходимо процентное соотношение мужчин и женщин, в случае, если мы хотим стратифицировать выборку по полу). Отсутствие такой информации делает применение стратифицированной выборки невозможным. Еще один недостаток стратифицированного отбора – это возможность систематической ошибки, например, из-за неточной информации о параметрах генеральной совокупности.

Гнездовая выборка

Принципы построения гнездовой выборки противоположны принципам стратифицированной выборки. Единицами гнездовой выборки являются не индивиды, а группы, гнезда (например, населенные пункты, районы, предприятия, школы). Единицы исследования здесь размещены компактно. Группы отбираются случайно (равновероятностно). Объекты, отобранные в группу, подлежат сплошному обследованию. Например, городские микрорайоны отбираются по равновероятностной (случайной) процедуре, а далее проводится сплошной опрос жителей микрорайонов, т.е. опрашиваются все жители отобранных в выборку микрорайонов. Межгрупповая дисперсия здесь меньше, чем в стратифицированной выборке, а внутригрупповая не имеет значения, поскольку обследуются все единицы совокупности (группы).

Главный "козырь" этого типа отбора в том, что он гораздо проще в организационном плане. Действительно, гораздо проще выбрать несколько групп и опросить их целиком, чем бегать за каждым респондентом. Это дает выигрыш в средствах и во времени. Но при этом необходимо следить, чтобы количество групп в генеральной совокупности было достаточно большим, иначе ни о каком принципе случайности не может быть и речи. Более того, возможны перекосы из-за того, что на момент опроса не удается застать всех членов группы. К тому же объем выборки при гнездовом отборе обычно больше, чем при случайном отборе, то есть это выборка менее эффективная со статистической точки зрения.

Многоступенчатая и многофазная выборка

Построение многоступенчатой выборки основывается на описанных выше принципах. Обычно этот тип выборки применяется в исследованиях, когда возникает необходимость произвести поэтапный отбор единиц из разных совокупностей. Например, в общеукраинских исследованиях. Совокупность, из которой осуществляется отбор, изменяется на каждом этапе отбора. В общеукраинских исследованиях, как правило, вначале отбираются области, затем города, затем районы, далее избирательные участки, а на последнем этапе отбирают респондентов, проживающих в пределах избирательного участка.

Использование многоступенчатой выборки улучшает организацию выборки, но увеличивает ее ошибку. При многофазовой выборке одни сведения собираются по всем единицам выборки, а другие – только по подвыборке из первоначальной выборки.