
- •Материалы к лекционному курсу
- •Тема 1. Основные статистические показатели
- •Тема 2. Основы описательной (дескриптивной) статистики
- •Тема 3. Выборочный метод
- •Тема 4. Анализ статистической взаимосвязи
- •Тема 5. Анализ взаимосвязи качественных признаков
- •Тема 6. Многомерный статистический анализ
- •Тема 7. Анализ динамических рядов
- •Тема 8. Булева алгебра в сравнительных исследованиях
- •Тема 9. Контент-анализ текстов в гуманитарных исследованиях
- •Тесты для контроля остаточных знаний
Тема 3. Выборочный метод
Всю совокупность изучаемых в конкретном исследовании с помощью количественных методов объектов принято называть генеральной совокупностью. В тех случаях, когда генеральная совокупность включает в себя слишком большое число объектов, или когда эмпирические данные об этих объектах фрагментарны, применяется выборочный метод статистического исследования, при котором обобщающие показатели генеральной совокупности определяются с помощью данных некоторой ее части, выделенной на основе случайного отбора. Эта отобранная из генеральной совокупности часть данных называется выборочной совокупностью или выборкой. При выборочном обследовании обычно исследуются: либо средний размер того или иного признака у единиц совокупности, либо доля единиц, обладающих тем или иным признаком, т.е. удельный вес определенных единиц в совокупности.
Важнейшим научным требованием к применению выборочного метода является репрезентативность – свойство выборки отражать основные характеристики генеральной совокупности. Для соблюдения этого требования все объекты генеральной совокупности должны иметь равную возможность попасть в выборку. Достигается репрезентативность через случайность отбора данных, например, путем механического отбора (каждый десятый или двадцатый объект генеральной совокупности) или с помощью генератора случайных чисел. Также используется типическое (или районированное) выборочное наблюдение, для проведения которого, изучаемая генеральная совокупность предварительно подразделяется на качественно-однородные по существенному признаку группы, из которых в дальнейшем производится случайный отбор.
Результаты отдельных выборочных наблюдений по одной и той же генеральной совокупности обычно расходятся не только между собой, но и с характеристиками самой генеральной совокупности. Подобное расхождение называется ошибкой выборки. Ошибки выборки могут быть как случайными, например, в результате погрешности внесения данных при регистрации или случайного неравномерного включения в выборку объектов генеральной совокупности, так и систематическими, причиной которых стало нарушение репрезентативности при отборе данных. Систематические ошибки приводят к искажению результатов всего исследования, в то время как случайные могут быть отслежены с помощью специальных процедур анализа.
Величина случайной ошибки выборки зависит от принятого способа формирования выборочной совокупности, от объема выборки, от размера дисперсии изучаемого признака в генеральной совокупности. Чем больше разброс значений, тем больше будет величина ошибки. Для определения количественной характеристики отклонения показателя выборочной совокупности от показателя генеральной совокупности рассчитывается стандартная ошибка выборки – (Мю).
,
где
– среднее квадратичное (стандартное) отклонение;
n – объем выборочной совокупности.
Полученная величина стандартной ошибки представляет из себя интервал (± ), который имеет свою доверительную вероятность, т.е. вероятность того, что реальная характеристика генеральной совокупности будет находиться в интервале равном размеру стандартной ошибки выборки. Однако в каждом конкретном случае расхождение между выборочным и генеральным показателем, т.е. Δ, может быть больше или меньше средней ошибки μ. Поэтому Δ называют предельной ошибкой выборки и рассматривают ее как t-кратное μ, т.е.:
Δ= t μ , где
t – статистический коэффициент, равный 1 для вероятности 68% (t=1); равный 2 для вероятности 95% (t=2); равный 3 для вероятности 99,7% (t=3).
Однако, чем большую вероятность включения в доверительный интервал значения генеральной совокупности исследователь хочет получить, тем шире и неопределенней становится сам интервал. Поэтому, наиболее часто используется t=2. Таким образом, доверительный интервал, в котором находится изучаемое значение генеральной совокупности, выглядит следующим образом:
выборки – t μ ≤ ген. совокуп. ≥ выборки + t μ
Доверительный интервал позволяет 1) распространить выборочные данные на итоговые величины генеральной совокупности, для чего необходимо знать объем генеральной совокупности; 2) сравнивать различные выборки между собой. Если средние значения двух выборок при t=3 находятся в одном доверительном интервале, то различия этих значений случайны, а если они не совпадают (не пересекаются), то эти различия статистически значимы.
Когда требуется изучить удельный вес определенных единиц в генеральной совокупности используется другая формула расчета и, следовательно, доверительного интервала:
,
где
q – доля каждого значения в выборке;
n – объем выборки.
В этом случае доверительный интервал оказывается в диапазоне:
q выборки – t μ ≤ Q ген. совокуп. ≥ q выборки + t μ