- •Тема 5. Проверка статистических гипотез
- •5.1 Основные понятия, используемые при проверке гипотез
- •5.1.1 Статистические гипотезы
- •5.1.2 Уровень значимости и мощность критерия. Ошибки при проверке гипотез
- •5.1.3 Статистические критерии
- •5.1.3 Общая схема проверки гипотез
- •5.1.4 Односторонние и двусторонние критерии
- •5.2 Проверка однородности выборок в прикладных задачах
- •5.2.1 Однородность выборок
- •5.2.2 Независимость выборок
- •5.2.3 Параметрические и непараметрические гипотезы
- •5.3 Параметрические методы проверки однородности выборок
- •5.3.1 Традиционный метод проверки однородности двух независимых выборок (критерий Стьюдента)
- •5.3.2 Классические условия применимости критерия Стьюдента
- •5.3.3 Использование критерия Крамера-Уэлча при проверке равенства математических ожиданий двух независимых выборок
- •5.3.4 Сравнение среднего с нормативом (t-тест одной выборки)
- •5.3.5 Сравнение двух зависимых выборок при помощи t-критерия Стьюдента
- •5.4 Непараметрические методы проверки однородности выборок
- •5.5 Сравнение двух независимых выборок
- •5.5.2 Сравнение двух независимых выборок. Критерий серий Вальда—Вольфовица
- •X1, x2, x3, x4, x5 и y1, y2, y3, y4, y5, y6.
- •X1, x2, x3, x4, x5, y1, y2, y3, y4, y5, y6
- •X1, x2, y1, y3, x4, y2, y3, y4, y5, x5, y6.
- •5.5.3 Сравнение двух независимых выборок. Тест Колмогорова-Смирнова
- •5.6 Сравнение двух зависимых выборок
- •5.6.1 Сравнение двух зависимых выборок с использованием теста знаков
- •5.6.2 Сравнение двух зависимых выборок с использованием теста Уилкоксона (Вилкоксона)
- •5.7 Сравнение нескольких выборок
- •5.7.1 Сравнение нескольких независимых выборок. Критерий Крускала-Уоллиса
- •5.7.2 Сравнение нескольких зависимых выборок. Критерий Фридмана
- •5.8 Использование критерия согласия Пирсона
- •5.9 Проверка статистических гипотез применительно к таблицам сопряженности
- •Для уровней статистической значимости
- •Критические значения статистики Колмогорова-Смирнова
5.5.3 Сравнение двух независимых выборок. Тест Колмогорова-Смирнова
Данный критерий позволяет оценить существенность различий между двумя выборками. Его применение возможно также для сравнения эмпирического распределения с теоретическим.
Объёмы рассматриваемых выборок должны быть достаточно большими: ≥50,≥50. Для использования теста выборки должны быть представлены в виде частотного распределения, при этомчисло категорий должно быть небольшим (до 7-9).
Нулевая гипотеза H0={различия между двумя распределениями недостоверны}.
Критерий позволяет найти категорию, в которой сумма частот расхождений между двумя распределениями является наибольшей, и оценить достоверность этого расхождения.
Алгоритм проверки:
Определяются категории значений признака.
Строится частотное распределение каждой выборки по выделенным категориям.
Вычисляются относительные частоты , равные частному от деления частот на объём выборки, для каждой из имеющихся выборок.
Определяется модуль разности соответствующих относительных частот.
Определяется наибольший модуль, который обозначается .
Вычисляется эмпирическое значение критерия :
Определяется критическое значение критерия для выбранного уровня значимости.
Если эмпирическое значение критерия больше критического, то нулевая гипотеза отвергается, и группы по рассмотренному признаку отличаются существенно.
Схематично алгоритм применения критерия Колмогорова-Смирнова можно представить следующим образом:
Пример сравнения двух независимых выборок с использованием теста Колмогорова-Смирнова
Являются ли значимыми различия между творческой активностью контрольной и экспериментальной группами студентов?
Уровень усвоения |
Частота в экспериментальной группе |
Частота в контрольной группе |
Хороший |
172 чел. |
120 чел. |
Приблизительный |
36 чел. |
49 чел. |
Плохой |
15 чел. |
36 чел. |
Объём выборки |
=172+36+15=223 |
=120+49+36=205 |
Вычисляем относительные частоты , равные частному от деления частот на объём выборки, для каждой из имеющихся выборок.
Определяем модуль разности соответствующих относительных частот для контрольной и экспериментальной выборок.
В результате исходная таблица примет следующий вид:
Относительная частота экспериментальной группы (fэксп) |
Относительная частота контрольной группы (fконтр) |
Модуль разности частот |fэксп – fконтр| |
172/223≈0.77 |
120/205≈0.59 |
0.18 |
36/223≈0.16 |
49/205≈0.24 |
0.08 |
15/223≈0.07 |
36/205≈0.17 |
0.1 |
Среди полученных модулей разностей относительных частот выбираем наибольший модуль, который обозначается =0.18.
Эмпирическое значение критерия λэмп определяется с помощью формулы:
Считая, что , по таблице (приложение 4) определяем критическое значение критерия: . , следовательно, нулевая гипотеза отвергается, и группы по рассмотренному признаку отличаются существенно.
5.6 Сравнение двух зависимых выборок
Имеются данные обследования, полученные в двух опытах (или в двух замерах), но на одной и той же группе единиц совокупности. Две выборки считаются зависимыми, если каждому значению одной выборки однозначно ставится в соответствие ровно одно значение другой выборки.
Зависимые (связанные, попарно сопряженные) выборки - это выборки, представляющие собой параметры одной и той же совокупности до и после воздействия некоторого фактора.
Чаще всего зависимые выборки – это измерения одной и той же группы объектов в разные моменты времени (например, до и после воздействия какого-либо фактора). Таким образом, зависимые выборки всегда должны содержать одинаковое количество наблюдений. Для того чтобы доказать эффективность воздействия, необходимо выявить статистически значимую тенденцию в смещении (сдвиге) показателей. Сдвигом называется разность между значениями измеряемого параметра «после» и «до» проведения эксперимента.
Наиболее часто для сравнения зависимых выборок используют параметрический тест – -критерий Стьюдента и непараметрические тесты – критерий знаков и критерий Уилкоксона.
Критерий знаков - это непараметрический тест, использующийся фактически для сравнения медианы распределения с каждым конкретным значением. Критерий знаков предъявляет к тестируемой выборке только одно требование: шкала измерений должна быть порядковой, интервальной или относительной (т.е. тест нельзя применять к номинальным переменным). Других ограничений (в том числе и на форму распределения) нет. С одной стороны, это делает тест настолько широко применимым, насколько это вообще возможно. С другой - снижает его мощность, поскольку тест не может опираться в своей работе на какие-либо предположения о свойствах анализируемого распределения.
Невысокая мощность критерия знаков особенно сильно проявляется на небольших выборках. Это является следствием того, что тест использует информацию только о положении элементов выборки относительно предполагаемой медианы: слева или справа. Информация об их сравнительной величине тестом не используется. В то же время, есть более мощный тест - W-критерий Уилкоксона, использующий информацию о ранге элементов в выборке. К сожалению, сфера применения этого теста ограничена распределениями, симметричными относительно медианы. Для несимметричных распределений он дает некорректные результаты, так что в нашем распоряжении остается только менее мощный критерий знаков.