- •Тема 5. Проверка статистических гипотез
- •5.1 Основные понятия, используемые при проверке гипотез
- •5.1.1 Статистические гипотезы
- •5.1.2 Уровень значимости и мощность критерия. Ошибки при проверке гипотез
- •5.1.3 Статистические критерии
- •5.1.3 Общая схема проверки гипотез
- •5.1.4 Односторонние и двусторонние критерии
- •5.2 Проверка однородности выборок в прикладных задачах
- •5.2.1 Однородность выборок
- •5.2.2 Независимость выборок
- •5.2.3 Параметрические и непараметрические гипотезы
- •5.3 Параметрические методы проверки однородности выборок
- •5.3.1 Традиционный метод проверки однородности двух независимых выборок (критерий Стьюдента)
- •5.3.2 Классические условия применимости критерия Стьюдента
- •5.3.3 Использование критерия Крамера-Уэлча при проверке равенства математических ожиданий двух независимых выборок
- •5.3.4 Сравнение среднего с нормативом (t-тест одной выборки)
- •5.3.5 Сравнение двух зависимых выборок при помощи t-критерия Стьюдента
- •5.4 Непараметрические методы проверки однородности выборок
- •5.5 Сравнение двух независимых выборок
- •5.5.2 Сравнение двух независимых выборок. Критерий серий Вальда—Вольфовица
- •X1, x2, x3, x4, x5 и y1, y2, y3, y4, y5, y6.
- •X1, x2, x3, x4, x5, y1, y2, y3, y4, y5, y6
- •X1, x2, y1, y3, x4, y2, y3, y4, y5, x5, y6.
- •5.5.3 Сравнение двух независимых выборок. Тест Колмогорова-Смирнова
- •5.6 Сравнение двух зависимых выборок
- •5.6.1 Сравнение двух зависимых выборок с использованием теста знаков
- •5.6.2 Сравнение двух зависимых выборок с использованием теста Уилкоксона (Вилкоксона)
- •5.7 Сравнение нескольких выборок
- •5.7.1 Сравнение нескольких независимых выборок. Критерий Крускала-Уоллиса
- •5.7.2 Сравнение нескольких зависимых выборок. Критерий Фридмана
- •5.8 Использование критерия согласия Пирсона
- •5.9 Проверка статистических гипотез применительно к таблицам сопряженности
- •Для уровней статистической значимости
- •Критические значения статистики Колмогорова-Смирнова
5.7.2 Сравнение нескольких зависимых выборок. Критерий Фридмана
Критерий Фридмана является непараметрическим аналогом однофакторного дисперсионного анализа для повторных измерений. Он позволяет проверять гипотезы о различии более чем двух повторных измерений по уровню выраженности изучаемой переменной. Критерий более эффективен, чем дисперсионный анализ в случае малых выборок и распределений, отличных от нормального. Он основан на ранжировании повторных измерений для каждого объекта выборки. Проверяется при помощи критерия . Критерий применяется для сопоставления показателей, измеренных в разных условиях () на одной и той же выборке изиспытуемых. Критерий Фридмана позволяет установить, что величины показателей от условия к условию изменяются, но при этом не указывает на направление изменений и в этом смысле он похож на критерий знаков.
Критерий Фридмана является обобщением критерия Вилкоксона на большее, чем два, количество условий измерения, при этом ранжируются не абсолютные величины сдвигов, а сами индивидуальные значения измерений.
Нулевая гипотеза H0={между полученными в разных условиях показателями существуют лишь случайные различия}.
Альтернативная гипотеза H1={между полученными в разных условиях показателями имеются существенные различия}.
Ранжируются индивидуальные значения показателей (повторные измерения) для каждого экземпляра выборки в порядке убывания признака (ранжирование параметров каждой строки).
Полученные ранги суммируются по столбцам (ранги показателей, полученных по всем экземплярам выборки при одних и тех же условиям).
Эмпирическое значение критерия по формуле:
,
где – количество условий (тестов),,– количество экземпляров выборки,,– сумма рангов всех значений при -ом условии.
Критическое значение критерия зависит от уровня значимости α и степени свободы.
Нулевая гипотеза не отвергается, если критическое значение превосходит эмпирическое. В этом случае различия значений показателя в разных условиях можно считать несущественными.
Схема применения критерия имеет вид:
Рис 2 Алгоритм применения критерия Фридмана
Пример использования критерия Фридмана
Пять учащихся исследуются по четырём тестам. Являются ли результаты тестирования случайными?
Таблица 3
|
Оценки в баллах по проведённым тестам | |||
Номер испытуемого |
Тест A |
Тест B |
Тест C |
Тест D |
1 |
3.6 |
4.1 |
2.9 |
3.5 |
2 |
3.8 |
4.2 |
3.7 |
4.6 |
3 |
3.3 |
3.8 |
3 |
3.7 |
4 |
3.8 |
3.3 |
3.4 |
2.7 |
5 |
4 |
3.6 |
1.9 |
3.1 |
Проранжируем индивидуальные значения показателей для каждого испытуемого в порядке убывания признака. Т.е. производим ранжирование параметров каждой строки представленной таблицы.
Найдём суммы рангов по столбцам. В результате получаем:
Таблица 4
|
Ранги тестов (по строкам) | |||
Номер испытуемого |
Тест A |
Тест B |
Тест C |
Тест D |
1 |
2 |
1 |
4 |
3 |
2 |
3 |
2 |
4 |
1 |
3 |
3 |
1 |
4 |
2 |
4 |
1 |
3 |
2 |
4 |
5 |
1 |
2 |
4 |
3 |
Сумма рангов: |
10 |
9 |
18 |
13 |
Эмпирическое значение критерия:
Критическое значение критерия , зависит от уровня значимости α и степени свободы. Дляикритическое значение. Нулевая гипотеза не отвергается, так как критическое значение превосходит эмпирическое..