
- •Тема 5. Проверка статистических гипотез
- •5.1 Основные понятия, используемые при проверке гипотез
- •5.1.1 Статистические гипотезы
- •5.1.2 Уровень значимости и мощность критерия. Ошибки при проверке гипотез
- •5.1.3 Статистические критерии
- •5.1.3 Общая схема проверки гипотез
- •5.1.4 Односторонние и двусторонние критерии
- •5.2 Проверка однородности выборок в прикладных задачах
- •5.2.1 Однородность выборок
- •5.2.2 Независимость выборок
- •5.2.3 Параметрические и непараметрические гипотезы
- •5.3 Параметрические методы проверки однородности выборок
- •5.3.1 Традиционный метод проверки однородности двух независимых выборок (критерий Стьюдента)
- •5.3.2 Классические условия применимости критерия Стьюдента
- •5.3.3 Использование критерия Крамера-Уэлча при проверке равенства математических ожиданий двух независимых выборок
- •5.3.4 Сравнение среднего с нормативом (t-тест одной выборки)
- •5.3.5 Сравнение двух зависимых выборок при помощи t-критерия Стьюдента
- •5.4 Непараметрические методы проверки однородности выборок
- •5.5 Сравнение двух независимых выборок
- •5.5.2 Сравнение двух независимых выборок. Критерий серий Вальда—Вольфовица
- •X1, x2, x3, x4, x5 и y1, y2, y3, y4, y5, y6.
- •X1, x2, x3, x4, x5, y1, y2, y3, y4, y5, y6
- •X1, x2, y1, y3, x4, y2, y3, y4, y5, x5, y6.
- •5.5.3 Сравнение двух независимых выборок. Тест Колмогорова-Смирнова
- •5.6 Сравнение двух зависимых выборок
- •5.6.1 Сравнение двух зависимых выборок с использованием теста знаков
- •5.6.2 Сравнение двух зависимых выборок с использованием теста Уилкоксона (Вилкоксона)
- •5.7 Сравнение нескольких выборок
- •5.7.1 Сравнение нескольких независимых выборок. Критерий Крускала-Уоллиса
- •5.7.2 Сравнение нескольких зависимых выборок. Критерий Фридмана
- •5.8 Использование критерия согласия Пирсона
- •5.9 Проверка статистических гипотез применительно к таблицам сопряженности
- •Для уровней статистической значимости
- •Критические значения статистики Колмогорова-Смирнова
Какую работу нужно написать?
5.1.4 Односторонние и двусторонние критерии
Пусть цель исследования в том, чтобы выявить различие параметров двух генеральных совокупностей, которые соответствуют различным ее естественным условиям (условия жизни, возраст испытуемых и т. п.). Зачастую неизвестно, в какой из совокупностей рассматриваемый параметр будет больше, а какой меньше. Например, если сравнивают средние оценки учащихся в контрольной и экспериментальной группах, то заранее неизвестно, в какой группе средняя оценка будет больше. В этом случае нулевая гипотеза состоит в том, что средние равны между собой, а цель исследования — доказать обратное, т.е. наличие выявить различие между средними. При этом допускается, что различие может быть любого знака. Такие гипотезы называются двусторонними.
Но
иногда задача состоит в том, чтобы
доказать увеличение или уменьшение
параметра; например, средний результат
в экспериментальной группе выше (ниже),
чем в контрольной. При этом уже не
допускается, что различие может быть
другого знака. Тогда альтернативная
гипотеза
при нулевой
(или
,
если нулевая
).
Такие гипотезы называются односторонними.
Критерии значимости, служащие для проверки двусторонних гипотез, называются двусторонними, а для односторонних гипотез — односторонними.
Выбор односторонней или двусторонней гипотезы находится за пределами формальных статистических методов и полностью зависит от целей исследования.
Например,
необходимо доказать различие средних
значений генеральных совокупностей
(средних значений некоторого результата
исследований) при двух различных
методиках применяемых в контрольной и
экспериментальной группах. Если
неизвестно, какая группа покажет в
среднем лучший результат, то нужно
выдвинуть нулевую гипотезу
против двусторонней альтернативы
.
Различие доказывается по разности
средних арифметических результант в
контрольной и экспериментальной группах
(
).
Распределение разности
при условии, что верна нулевая гипотеза
Н0 схематично представлено на рис. 4.2,
а.
Рис. 6.2. Уровни значимости при двустороннем (а) и одностороннем (б) критериях
Решение
об отклонении гипотезы Н0 принимается
в том случае, если разность
выходит за пределы некоторого значения
двустороннего критерия (допустимы
отклонения в обе стороны от нуля). Ошибка,
которая при этом допускается, равна,
как известно, уровню значимости
.
Но поскольку отклонения возможны в обе
стороны, то при симметричном распределении
вероятности отклонений, больших Кдвух
и меньших Кдвух, будут одинаковы и
составят
/2.
Если
предположить, что в экспериментальной
группе будут показаны в среднем более
высокие результаты, то можно выдвинуть
одностороннюю альтернативу
.
В этом случае при той же нулевой гипотезе
распределение разности
будет таким же, как и для двустороннего
критерия (см. рис. 4.2, б). Но теперь
представляют интерес только положительные
значения разности
.
Решение об отклонении Н0 принимается,
когда
окажется больше некоторого значения
одностороннего критерия. При том же
уровне значимости
Кодн будет всегда меньше Кдвух, поэтому
нулевая гипотеза будет при одностороннем
критерии отклоняться чаще.
Таким образом, двусторонние критерии оказываются более консервативными, чем односторонние.
В этом нет никакого противоречия или доказательства несостоятельности статистических методов. Просто в первом случае, используя двустороннюю гипотезу, мы допускали и отрицательный эффект в экспериментальной группе. В такой ситуации выводы должны быть более осторожными, чем в случае односторонней гипотезы, когда имеется дополнительная информация, позволяющая сделать предположение о положительном эффекте новой программы, что, естественно, дает возможность сделать более точный вывод. Правда, следует отметить, что если превышение критического значения в каком либо исследовании незначительно, то в достоверности вывода о наличии положительного эффекта можно усомниться. В такой ситуации следует провести дополнительные исследования.