- •Тема: Статистическая проверка гипотез
- •Понятие статистической гипотезы.
- •Гипотеза о значении математического ожидания нормально распределённой генеральной совокупности при известной дисперсии.
- •Гипотеза о значении математического ожидания нормально распределённой генеральной совокупности при неизвестной дисперсии.
- •Гипотеза о дисперсии нормально распределённой генеральной совокупности.
Тема: Статистическая проверка гипотез
-
Понятие статистической гипотезы.
Статистическая гипотеза – это утверждение относительно распределения случайных величин генеральной совокупности. Часто гипотезы формулируются как предложения о неизменности некоторого параметра совокупности, об отсутствии его смещения или же относительно изменения этого параметра в нескольких совокупностях. Например, можно рассмотреть гипотезу о размерах изготовляемых деталей, об эффективности лекарства и т.д.
Гипотеза, подлежащая проверке, называется нулевой или основной и обозначается . Запись означает, что выдвинута гипотеза о том, что элемент принадлежит .
Наряду с нулевой гипотезой рассматривают так называемую альтернативную гипотезу, заключающуюся в том, что если нулевая гипотеза отвергается, то принимается альтернативная, которая обозначается . Например, для нулевой гипотезы альтернативной является гипотеза .
Гипотеза называется простой, если она точно определяет распределение случайной величины, в противном случае гипотеза называется сложной. Например, гипотеза , простая. Гипотеза же или определяет область значений параметра и, следовательно, является сложной.
Процедура проверки гипотез – это процесс, позволяющий для любого множества значений получить решение: принять или отклонить проверяемую гипотезу . Правило, согласно которому проверяется гипотеза , называется статистической проверкой гипотезы .
Принимая или отклоняя гипотезу , можно допустить ошибки двух родов: 1) ошибка первого рода имеет место тогда, когда отвергается гипотеза , в то время как в действительности она верна; 2) при ошибке второго рода принимается гипотеза , в то время как верна на самом деле какая-то другая гипотеза .
Пусть – вероятность ошибки первого рода, а – вероятность ошибки второго рода. Тогда можно сказать, что при большом количестве выборок доля ложных заключений равна , если верна гипотеза , и равна , если верна гипотеза . Например, в радиолокации принято, что гипотеза – отсутствие цели, а гипотеза – наличие цели. Тогда принятие гипотезы , когда на самом деле верна гипотеза , называют пропуском сигнала, а вероятность принятия такого решения называется вероятностью пропуска . Величина называется вероятностью правильного обнаружения. Принятие гипотезы , т.е. решение о том, что цель присутствует, когда эта гипотеза несправедлива и цели в действительности нет, называется вероятностью ложной тревоги
Предположим, что рассматриваются основная и альтернативная гипотезы. Тогда ошибки первого и второго рода можно изобразить в виде следующей таблицы:
|
верна |
не верна |
Отвергнуть |
Ошибка первого рода с вероятностью |
Верное решение с вероятностью |
Принять |
Верное решение с вероятностью |
Ошибка второго рода с вероятностью |
Правило, по которому принимается решение принять или отклонить гипотезу , называется критерием . Так как решение принимается на основе выборки наблюдений с.в. , то необходимо выбрать подходящую статистику (оценку), называемую в этом случае статистикой критерия . Как правило, при проверки гипотезы в качестве статистики критерия выбирается оценка .
Статистическая проверка гипотезы основывается на том принципе, что маловероятные события считаются невозможными, а события с большой вероятностью считаются достоверными. Этот принцип реализуется следующим образом. Перед анализом выборки фиксируется уровень значимости – вероятность ошибочного отклонения нулевой гипотезы. Обычно задаются значениями .
Критерий, основанный на использовании заранее заданного уровня значимости, называется критерием значимости. Множество всех значений статистики , при которых принимаются решения, отклоняющие гипотезу и принимающие гипотезу , называется критической областью. Совокупность же значений статистики , при которых принимают гипотезу , называется областью принятия гипотезы. Точки, отделяющие критическую область от области принятия решений, называются критическими.
Для определения критической области статистики используют уровень значимости и учитывают вид альтернативной гипотезы . Основная гипотеза о значении неизвестного параметра распределения выглядит так:
.
Альтернативная гипотеза может при этом иметь следующий вид:
, или .
Соответственно можно получить левостороннюю, правостороннюю или двустороннюю критические области (рис. 1). Граничные точки критических областей определяют по таблицам распределения статистики.
Рис. 1.1. Критические области: а – левосторонняя; б – правосторонняя; в – двусторонняя |
-
Схема статистической проверки гипотезы.
Статистическая проверка гипотезы состоим из следующих этапов:
1) формулировка нулевой и альтернативной гипотез;
2) выбор соответствующего уровня значимости ;
3) определение объёма выборки ;
4) выбор статистики критерия для проверки гипотезы ;
5) определение (по таблицам, по уровню значимости и по альтернативной гипотезе ) критической области и области принятия гипотезы;
6) формулировка правила проверки гипотезы;
7) принятие статистического решения: если значения статистики не входит в критическую область, то принимается гипотеза и отвергается гипотеза , а если входит в критическую область, то отвергается гипотеза и принимается .
Результаты проверки статистической гипотезы нужно интерпретировать так: если приняли гипотезу , то можно считать ее доказанной, а если приняли гипотезу , то признали, что гипотеза не противоречит результатам наблюдений. Однако этим свойством наряду с могут обладать и другие гипотезы. Следует помнить, что, принимая гипотезу , следует проводить ещё дополнительные исследования.