- •Тема 5. Проверка статистических гипотез
- •5.1 Основные понятия, используемые при проверке гипотез
- •5.1.1 Статистические гипотезы
- •5.1.2 Уровень значимости и мощность критерия. Ошибки при проверке гипотез
- •5.1.3 Статистические критерии
- •5.1.3 Общая схема проверки гипотез
- •5.1.4 Односторонние и двусторонние критерии
- •5.2 Проверка однородности выборок в прикладных задачах
- •5.2.1 Однородность выборок
- •5.2.2 Независимость выборок
- •5.2.3 Параметрические и непараметрические гипотезы
- •5.3 Параметрические методы проверки однородности выборок
- •5.3.1 Традиционный метод проверки однородности двух независимых выборок (критерий Стьюдента)
- •5.3.2 Классические условия применимости критерия Стьюдента
- •5.3.3 Использование критерия Крамера-Уэлча при проверке равенства математических ожиданий двух независимых выборок
- •5.3.4 Сравнение среднего с нормативом (t-тест одной выборки)
- •5.3.5 Сравнение двух зависимых выборок при помощи t-критерия Стьюдента
- •5.4 Непараметрические методы проверки однородности выборок
- •5.5 Сравнение двух независимых выборок
- •5.5.2 Сравнение двух независимых выборок. Критерий серий Вальда—Вольфовица
- •X1, x2, x3, x4, x5 и y1, y2, y3, y4, y5, y6.
- •X1, x2, x3, x4, x5, y1, y2, y3, y4, y5, y6
- •X1, x2, y1, y3, x4, y2, y3, y4, y5, x5, y6.
- •5.5.3 Сравнение двух независимых выборок. Тест Колмогорова-Смирнова
- •5.6 Сравнение двух зависимых выборок
- •5.6.1 Сравнение двух зависимых выборок с использованием теста знаков
- •5.6.2 Сравнение двух зависимых выборок с использованием теста Уилкоксона (Вилкоксона)
- •5.7 Сравнение нескольких выборок
- •5.7.1 Сравнение нескольких независимых выборок. Критерий Крускала-Уоллиса
- •5.7.2 Сравнение нескольких зависимых выборок. Критерий Фридмана
- •5.8 Использование критерия согласия Пирсона
- •5.9 Проверка статистических гипотез применительно к таблицам сопряженности
- •Для уровней статистической значимости
- •Критические значения статистики Колмогорова-Смирнова
5.7 Сравнение нескольких выборок
Для сравнения нескольких выборок используется:
дисперсионный анализ для случая нормально распределенных переменных с однородными дисперсиями;
непараметрические критерии – для распределений, отличных от нормальных и для малых выборок.
Для сравнения более чем двух независимых выборок по уровню выраженности переменных применяется несколько критериев: Н-критерий Крускала (Краскала(-Уоллеса (Уоллиса), критерий медиан, критерий Джонкира-Терспта. Из них наибольшей чувствительностью к различиям обладает критерий Крускала-Уоллиса. Этот критерий является непараметрическим аналогом дисперсионного анализа. Отличия состоят в том, что:
сравниваются не средние значения переменных, а средние значения их рангов;
используется не F-критерий Фишера, а критерий хи-квадрат.
Дисперсионный анализ обеспечивает более точные результаты, но условием его применения является нормальное распределение значений признака и однородность дисперсий или достаточно большой размер выборок.
Для малых выборок и распределений, отличающихся от нормальных рекомендуется использовать критерий Крускала-Уоллиса.
5.7.1 Сравнение нескольких независимых выборок. Критерий Крускала-Уоллиса
Критерий Краскела — Уоллиса предназначен для проверки равенства медиан нескольких выборок. Он является обобщением U-критерия Манна-Уитни на случай несвязанных выборок () и предназначен для оценки различий по уровню какого-либо признака одновременно между тремя и более выборками.
Критерий Краскела — Уоллиса является ранговым, поэтому он инвариантен по отношению к любому монотонному преобразованию шкалы измерения.
Нулевая гипотеза H0={между выборками существует лишь случайные различия по уровню исследуемого признака}.
Альтернативная гипотеза Н1={между выборками имеются существенные различия}.
Значения признака ранжируются для всех выборок, как для одной, в порядке возрастания. Далее рассчитывают суммы рангов для каждой выборки отдельно. Выборки могут быть как разных, так и равных объемов.
Эмпирическое значение критерия Крускала-Уоллиса рассчитывается по следующей формуле:
,
где – общее количество испытуемых,– сумма рангов в-ой выборке,– число испытуемых в-ой выборке.
Нулевая гипотеза сдвига отклоняется на уровне значимости , если, где — критическое значение, вычисляемое при (количество выборок) ипо специальным таблицам. При бо́льших значениях применимы различные аппроксимации, например, присправедлива аппроксимация распределения статистики распределениемсо степенями свободы, то есть нулевая гипотеза отклоняется, если.
Схема применения критерия Крускала-Уоллиса выглядит следующим образом
Рис 1 Алгоритм применения критерия Крускала-Уоллиса
Пример использования критерия Крускала-Уоллиса
Одинакова ли степень освоения нового материала младших и старших школьников и учителей.
Таблица 1
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
Младшие подростки |
2.8 |
2.8 |
2.9 |
3.1 |
2.9 |
2.5 |
2.7 |
2.8 |
2.7 |
Старшие подростки |
3.8 |
3.1 |
4.0 |
3.2 |
3.8 |
2.5 |
3.8 |
2.9 |
2.8 |
Учителя |
3.7 |
3.7 |
2.8 |
3.9 |
3.9 |
3.6 |
2.6 |
3.7 |
2.7 |
Значения признака ранжируется для всех выборок, как для одной, в порядке возрастания. Далее вычисляются суммы рангов для каждой выборки отдельно (т.е. произведём суммирование рангов по строкам, см. таблицу).
Таблица 2
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
Сумма рангов |
Младшие подростки |
2.8 |
2.8 |
2.9 |
3.1 |
2.9 |
2.5 |
2.7 |
2.8 |
2.7 |
- |
Ранг (мл.подростков) |
9 |
9 |
13 |
15.5 |
13 |
1.5 |
5 |
9 |
5 |
80 |
Старшие подростки |
3.8 |
3.1 |
4.0 |
3.2 |
3.8 |
2.5 |
3.8 |
2.9 |
2.8 |
- |
Ранг (ст. подростки) |
23 |
15.5 |
27 |
17 |
23 |
1.5 |
23 |
13 |
9 |
152 |
Учителя |
3.7 |
3.7 |
2.8 |
3.9 |
3.9 |
3.6 |
2.6 |
3.7 |
2.7 |
- |
Ранг (учителя) |
20 |
20 |
9 |
25.5 |
25.5 |
18 |
3 |
20 |
5 |
146 |
Эмпирическое значение критерия:
В рассматриваемом примере количество испытуемых во всех группах одинаково и равно 9. На практике выборки могут быть разных объёмов.
Критическое значение критерия по уровню значимости и степени свободы. При этом степень свободы рассчитывается как разность количества групп и единицы, то есть. Прикритическое значение. В данном случае нулевая гипотеза на уровне значимости 0.05 не отвергается, выборки не имеют существенных отличий по исследуемому признаку.