
Ошибки выборки
Ошибки выборки – это вызванное различными причинами отклонение статистической структуры выборочной совокупности от структуры генеральной совокупности.
По происхождению ошибки выборки можно подразделить на:
теоретические, возникающие на стадии формирования концептуального представления об объекте исследования (например, неправильно выбран тип выборки);
процедурные, связанные с построением выборочной модели (например, формирование выборки на основе неверных данных);
полевые, возникающие на этапе проведения исследования (опросили больше студентов, чем указано в квотной выборке).
По характеру воздействия на выборочную оценку различают:
случайные ошибки
ошибки смещения (систематические ошибки).
Случайные ошибки – это статистические погрешности выборки (они поддаются исчислению) и случайные ошибки при сборе информации.
Первый вид ошибки называется ошибкой репрезентативности.
Случайные ошибки второго ряда могут возникать по следующим причинам:
1.отступление от инструкции и замена запланированных единиц наблюдения другими, более доступными.
2.неполный охват намеченной выборочной совокупности.
3.невнимательность респондента, анкетера или интервьюера.
Предположим, что проводится телефонный экспресс-опрос населения крупного города на предмет согласия или несогласия с решением властей о строительстве метро в центре города. По завершении исследования выясняется, что опрошено 2500 человек, из них – 45% мужчин и 55% - женщин. В соответствии со статистической информацией, население данного города представлено в следующих пропорциях: 48% - мужчины, 52% - женщины. Таким образом, отклонение результатов исследования по данному признаку (пол респондента) составляет 3%. Это говорит о том, что в даннос случае имеет место случайная ошибка выборки. Принято считать, что если ошибка выборки составляет менее 5%, то выборочная совокупность является репрезентативной (отражающей характеристики генеральной совокупности).
Наряду со случайными ошибками различают ошибки смещения, которые носят неслучайный характер и нарушают точность выборочной совокупности.
Систематические ошибки (или ошибки смещения) – это неадекватное воспроизведение выборки генеральной совокупности.
Например, фирма по производству электроприборов хочет выяснить, какой процент взрослого мужского населения большого города пользуется электрической бритвой. С этой целью методом случайного отбора из телефонной книги выписывают 1000 домашних адресов. По полученным таким образом адресам рассылаются просьбы письменно ответить: сколько человек мужского пола старше 18 лет имеется в семье; сколько из них бреются электрической бритвой и какую мару они используют? В данном случае используется предубежденная выборка, так как вместо правильной исходной совокупности «всех семей» выбираются лишь те из них, кто имеет телефон. Это значит, что результаты исследования будут искажены вследствие ограничения генеральной совокупности семьями, имеющими телефон.
Ошибки смещения бывают обычно следствием:
неверных статистических данных о контрольных признаках генеральной совокупности;
малого (статистически незначимого) объема выборочной совокупности;
неверного применения способа отбора единиц анализа (например, неудачный выбор места и времени проведения опроса, отбор на основании неверно составленного списка).
Избежать ошибок смещения поможет точное соблюдение правил отбора единиц анализа, а также предварительные сведения о структуре генеральной совокупности. В качестве источников таких сведений могут выступать: документы ведомственного учета, данные опроса экспертов, сведения органов государственной статистики, данные разведывательного (пилотажного) исследования и т.д.
Иногда требуется повышенная надежность, как это имеет место в экономических и демографических обследованиях, например, при переписи населения. Здесь существенные ошибки оборачиваются миллионными потерями материальных ресурсов и просчетами планирования. Гораздо чаще социологические обследования проводятся для уяснения общих тенденций, общей ориентировки в сфере социальной политики.
Весьма полезна следующая приблизительная оценка надежности результатов выборочного обследования:
повышенная надежность допускает ошибку выборки до 3%,
обыкновенная – до 3-10% (доверительный интервал распределений на уровне 0,03-0,1),
приближенная – от 10 до 20%,
ориентировочная – от 20 до 40%,
а прикидочная – более 40%.
Во многих случаях необходимы целевые выборки. Особенно это важно в исследовании экспериментального плана. Скажем, проверяется эффективность введения новой формы организации труда. Ясно, что для этого следует отобрать подразделения, где введена новая организация, и для сравнения – аналогичные, где работа идет по-старому. Следует гарантировать в выборке равную численность экспериментальных организаций и контрольных, работающих по прежней системе. При этом важно так подобрать эти подразделения, чтобы они были аналогичны по всем существенным характеристикам, кроме факта наличия или отсутствия новой формы организации труда.
Используя статистический критерий Стьюдента, можно рассчитать объем выборок в зависимости от заданного уровня доверительного интервала ошибки вывода (т.е. от уровня надежности).
Объем подвыборок по их численности |
Значимая разность в % при ошибке не более 5% |
Объем подвыборок по их численности |
Значимая разность в % при ошибке не более 5% |
50 |
20 |
300 |
8 |
100 |
14 |
500 |
6,3 |
150 |
11,5 |
1000 |
4,5 |
200 |
10 |
5000 |
2 |