
Критическая область и область допустимых значений
Все возможное множество выборок объема п можно разделить на два непересекающихся подмножества (обозначим их через О и W), таких, что проверяемая гипотеза H0 должна быть отвергнута, если наблюдаемая выборка попадет в подмножество W, и принята, если выборка принадлежит подмножеству О.
Определение 14.4. Подмножество W выборок таких, что проверяемая гипотеза Н0 должна быть отвергнута, называют критической областью; О выборок таких, что проверяемая гипотеза Н0 должна быть принята,— областью допустимых значений.
Так как подмножество О состоит из всех тех выборок, которые не вошли в подмножество W, то подмножество W однозначно определяет подмножество О, и наоборот, т.е. необходимо определить одно подмножество, второе же получается автоматически единственным образом.
Возникает вопрос о том, какими принципами следует руководствоваться при построении критической области W. Эти принципы были сформулированы в работах известных математиков Е. Неймана и Э. Пирсона. При выборе критической области следует иметь в виду, что принимая или отклоняя гипотезу Н0, можно допустить ошибки двух видов.
Определение 14.5. Ошибка первого рода состоит в том, что нулевая гипотеза Н0 отвергается, т.е. принимается гипотеза в то время как в действительности все же верна гипотеза Н0.
Определение
14.6. Ошибка
второго рода состоит
в том, что
гипотеза
Н0
принимается,
в то время как верна гипотеза
Рассмотренные случаи наглядно иллюстрирует следующая таблица:
Гипотеза Н0 |
Верна |
Неверна |
Отвергается |
Ошибка 1-го рода |
Правильное решение |
Принимается |
Правильное решение |
Ошибка 2-го рода |
Вероятности
ошибок первого и второго рода однозначно
определяются
выбором
критической области W.
Для
любой заданной
критической области W
условимся
обозначать через
вероятность
ошибки первого рода (уровень значимости),
через β — вероятность ошибки второго
рода (мощность критерия).
При большом количестве выборок можно сказать, что доля ложных заключений равна а, если верна гипотеза Н0, и β, если верна гипотеза .
В
теории статистической проверки гипотез
доказывается, что
при фиксированном объеме выборки
соответствующий выбор
критической области ^позволяет сделать
как угодно малой либо
либо
При фиксированном
объеме выборки принято задавать
вероятность
ошибки первого рода
=
1 -
,
где
— вероятность
значимости гипотезы HQ.
Если
вероятность, с которой мы
хотим определить достоверность
предположения Н0,
= 0,95, то
уровень значимости равен 0,05. Обычно
уровень значимости а не превышает
0,1.
Методы оценки статистических гипотез
Проверка статистических гипотез осуществляется с помощью выбранного статистического критерия.
Определение 14.7. Статистическим критерием называют правило, которое позволяет оценить меру расхождения результатов, полученных при оценке выборочного наблюдения и основной выдвинутой гипотезы Н0
Статистический
критерий подбирается в каждом отдельном
случае таким образом, чтобы он
соответствовал принципу
отношения
правдоподобия.
Критерий К
с известной
функцией плотности f(k)
позволяет
при заданном уровне значимости определить
критическую
точку
распределения
f(k),
которая
разделяет область значений критерия
на две
части: область
допустимых значений, в
которой результаты
выборочного исследования выглядят
более правдоподобно, и критическую
область, в
которой результаты выборочного
наблюдения менее правдоподобны в
отношении гипотезы H0.
Обычно
определяется по таблице соответствующего
распределения.
Значение критерия на основе выборочного наблюдения определяется по специальным правилам и называется наблюдаемым значением критерия Кнабл
Определение 14.8. Если наблюдаемое значение критерия попадает в область допустимых значений О, значит, на основе выборочных данных на принятом уровне значимости можно принять нулевую гипотезу Н0 как более правдоподобную для результатов выборочного исследования, и отклонить альтернативную.
Определение 14.9. Если же наблюдаемое значение критерия попадает в критическую область W, то нулевая гипотеза отклоняется в пользу альтернативной гипотезы .
Критическая область может быть односторонней (левосторонней и правосторонней) или двухсторонней в зависимости от того, как задана конкурирующая гипотеза .
В том случае, когда
конкурирующая гипотеза
.
— правосторонняя, то и критическая
область — правосторонняя (рис 14.1). Тогда,
если Кнабл
попадает в
интервал от
до
, то нулевая гипотеза принимается, а альтернативная отклоняется. Если же Кнабл > , то нулевая гипотеза отклоняется в пользу альтернативной.
В том случае, когда конкурирующая гипотеза Н1 левосторонняя, то и критическая область левосторонняя (рис. 14.2). Тогда, если Кнабл лежит в интервале от до , то нулевая гипотеза отклоняется в пользу альтернативной. Если же Кнабл > , то нулевая гипотеза принимается, а альтернативная отклоняется.
Если конкурирующая гипотеза Н1 двухсторонняя, то и критическая область, двухсторонняя (рис. 14.3). Тогда нулевая гипотеза принимается, если – < Кнабл< ,и отклоняется в противном случае в пользу альтернативной.
Проверка выдвинутого в процессе анализа или исследования предположения выполняется обычно по следующему плану:
выдвигается нулевая гипотеза Н0;
формулируется альтернативная гипотеза Н1;
задается уровень значимости , удовлетворяющий исследователя;
4) подбирается наиболее мощный критерий оценки гипотезы по статистическим данным. Чаще всего это:
и — нормальное распределение;
2
—
распределение Пирсона хи- квадрат;
t — распределение Стьюдента;
F— распределение Фишера- Снедекора;
вычисляется экспериментальное значение критерия на основе выборочных данных;
определяется табличное значение критерия. В зависимости от вида альтернативной гипотезы в соответствующей таблице выбирают квантили критерия для двусторонней
и
или односторонней области (
или
);
табличное значение критерия определяет точку , которая отделяет критическую область W от области допустимых значений;
если значение Кнаб находится в области допустимых значений О, то на уровне значимости а нулевая гипотеза принимается, а конкурирующая отклоняется;
если вычисленное по выборочным данным значение Кнаб , попадает в критическую область, то нулевая гипотеза отклоняется в пользу конкурирующей гипотезы.
Вопросы для самоконтроля
Когда и с какой целью используется проверка статистических гипотез?
Какую гипотезу называют нулевой?
Определите правила, которыми следует руководствоваться при построении критической области.
Какую гипотезу называют конкурирующей?
Что такое уровень значимости?
Объясните смысл ошибок первого и второго рода.
Как определяются ошибки статистической проверки гипотез?
8 Что называют наблюдаемым значением критерия?
9 Какие виды статистических критериев вам известны?
Какие распределения используются в качестве критериев?
По каким формулам вычисляются наблюдаемые значения критерия, полученные на основе выборочных данных?
Если найдена левосторонняя критическая область, то при каком условии нулевую гипотезу принимают?
Какая из случайных величин служит для проверки гипотезы о нормальном законе распределения генеральной совокупности?
Если найдена правосторонняя критическая область, то при каком условии нулевая гипотеза отклоняется?
Какая из случайных величин служит для проверки гипотезы о равенстве генеральной средней нормальной совокупности, дисперсия которой известна предполагаемому значению?
В том случае если конкурирующая гипотеза — правосторонняя, то где определяется критическая область?
Если Гнабл попадает в интервал от до при левосторонней конкурирующей гипотезе, то принимается или отклоняется нулевая гипотеза?
Какой критерий следует использовать при проверке гипотезы о нормальном распределении?
Как вычисляется наблюдаемое значение критерия, если надо проверить гипотезу о том, что неизвестная генеральная средняя нормальной совокупности точно равна определенному числу, когда дисперсия генеральной совокупности не известна при малой выборке?
Как проверить гипотезу о том, что неизвестная генеральная средняя нормальной совокупности точно равна числовому значению, когда дисперсия генеральной совокупности известна при большой выборке?
Какой критерий служит для сравнения двух средних нормально распределенных генеральных совокупностей, генеральные дисперсии которых известны и независимые выборки большие?
Опишите метод сравнения двух средних нормально распределённых генеральных совокупностей при неизвестных генеральных дисперсиях.
Как проверить гипотезу о том, что неизвестная генеральная доля точно равна определенному числу?
Какой критерий служит для сравнения двух средних нормально распределенных совокупностей, генеральные дисперсии которых известны и независимы выборки большие?
Опишите метод сравнения двух средних нормально распределенных генеральных совокупностей при неизвестных генеральных дисперсиях.
Как проверить гипотезу о том, что неизвестная генеральная доля точно равна определенному числу?