
- •Лабораторная работа №2.1. Проверка статистических гипотез: гипотеза о равенстве средних для двух выборки
- •Проверка статистических гипотез о равенстве средних
- •Формулировка гипотезы
- •Зависимые или независимые выборки
- •Объем выборок
- •Тест на равенство двух дисперсий. (Критерий Ливиня)
- •Выбор критерия
- •Уровень значимости и определение области допустимых значений
- •Нормальное распределение: критическая область для уровня значимости 0.05 (двусторонний критерий)
- •Нормальное распределение: критическая область для уровня значимости 0.05 (односторонний критерий)
- •Распределение Стьюдента: критическая область для уровня значимости 0.05 и числа степеней свободы равного 9. (двусторонний критерий)
- •Вычисление значения t и z критериев
- •Вычисление в spss
Тест на равенство двух дисперсий. (Критерий Ливиня)
Дисперсионный
анализ – достаточно большой раздел
статистики. Здесь мы не будем останавливаться
на нем подробно, а лишь в общих чертах
опишем F-критерий,
который используется для проверки
гипотезы о равенстве дисперсий. Он
вычисляется по следующей формуле:
,
где
– большая выборочная дисперсия, а
– меньшая, а
рассчитывается так:
.
Проверяемая
(нулевая) гипотеза: сравниваемые
выборочные дисперсии характеризуют
вариацию признака в совокупностях,
взятых из нормально распределенных
генеральных совокупностей с одинаковыми
дисперсиями
.
Для
того чтобы отвергнуть или принять
проверяемую нами гипотезу, мы пользуемся
F-распределением
Фишера и соответствующими таблицами.
В этих таблицах указываются предельные
значения F-критерия
для различных комбинаций числа степеней
свободы числителя и знаменателя, которые
могут быть превзойдены с вероятностью
0,05 или 0,01. Число степеней свободы
,
соответствующее
большей дисперсии (
)
определяет
столбец таблицы, число степеней свободы
(
)
соответствующее
дисперсии
,
строку таблицы (см. приложение: таблица
№1).
Рассчитанная по фактическим данным величина дисперсионного отношения сопоставляется с соответствующей данному сочетанию числа степеней свободы числителя и знаменателя и принятому уровню значимости табличной величиной дисперсионного отношения.
Если фактическое дисперсионное отношение будет больше табличного, то лишь с вероятностью 0,05 или 0,01 можно утверждать, что различие между дисперсиями определяется случайными факторами. Иными словами, при фактическом F-критерии превышающем табличный мы отвергаем нулевую гипотезу и считаем, что выборочные дисперсии взяты из генеральных совокупностей с различными дисперсиями.
Допустим,
,
а
;
.
Тогда
,
при уровне значимости =0,05.
Значит, мы принимаем нулевую гипотезу
и считаем дисперсии равными, так как
.
То
есть, несмотря на видимое различие между
и
,
статистически
это различие не значимо.
Выбор критерия
На основе сказанного в пунктах 2 и 3, мы выбираем критерий для проверки выдвинутой нами гипотезы. Вернемся опять к нашим примерам (см. таблицу №1). Для проверки гипотезы из первого примера мы воспользуемся t-критерием (каким именно t-критерием, мы здесь считать не будем), для проверки гипотезы из третьего примера мы воспользуемся z-критерием для независимых выборок, для проверки гипотезы из второго примера мы воспользуемся z-критерием для парных выборок.
Уровень значимости и определение области допустимых значений
Уровень
значимости – вероятность ошибочно
отвергнуть основную проверяемую
гипотезу, когда она верна. В социологии
обычно используется уровень значимости
,
,
а2.
Критическую
область для любого уровня значимости
можно найти в таблице: если мы пользуемся
z-критерием,
то это будет таблица для стандартизированного
нормального распределения (см. приложение:
таблица №2), если мы пользуемся t-критерием,
то это будет таблица для распределения
Стьюдента (см. приложение: таблица №3).
Приведем более конкретный пример – для
начала поговорим о нормальном
распределении, а потом о распределении
Стьюдента.
Нормальное распределение. Возьмем уровень значимости . На графике критическая область будет выглядеть следующим образом.