
- •Тема: Статистическая проверка гипотез
- •Понятие статистической гипотезы.
- •Гипотеза о значении математического ожидания нормально распределённой генеральной совокупности при известной дисперсии.
- •Гипотеза о значении математического ожидания нормально распределённой генеральной совокупности при неизвестной дисперсии.
- •Гипотеза о дисперсии нормально распределённой генеральной совокупности.
Тема: Статистическая проверка гипотез
-
Понятие статистической гипотезы.
Статистическая гипотеза – это утверждение относительно распределения случайных величин генеральной совокупности. Часто гипотезы формулируются как предложения о неизменности некоторого параметра совокупности, об отсутствии его смещения или же относительно изменения этого параметра в нескольких совокупностях. Например, можно рассмотреть гипотезу о размерах изготовляемых деталей, об эффективности лекарства и т.д.
Гипотеза, подлежащая
проверке, называется нулевой
или основной
и обозначается
.
Запись
означает, что выдвинута гипотеза
о том, что элемент
принадлежит
.
Наряду с нулевой
гипотезой рассматривают так называемую
альтернативную
гипотезу,
заключающуюся в том, что если нулевая
гипотеза отвергается, то принимается
альтернативная, которая обозначается
.
Например, для нулевой гипотезы
альтернативной является гипотеза
.
Гипотеза называется
простой,
если она точно определяет распределение
случайной величины, в противном случае
гипотеза называется сложной.
Например, гипотеза
,
простая. Гипотеза же
или
определяет область значений параметра
и, следовательно, является сложной.
Процедура проверки
гипотез – это процесс, позволяющий для
любого множества значений
получить решение: принять или отклонить
проверяемую гипотезу
.
Правило, согласно которому проверяется
гипотеза
,
называется статистической
проверкой гипотезы
.
Принимая или
отклоняя гипотезу
,
можно допустить ошибки двух родов: 1)
ошибка первого
рода имеет
место тогда, когда отвергается гипотеза
,
в то время как в действительности она
верна; 2) при ошибке
второго рода принимается
гипотеза
,
в то время как верна на самом деле
какая-то другая гипотеза
.
Пусть
– вероятность ошибки первого рода, а
– вероятность ошибки второго рода.
Тогда можно сказать, что при большом
количестве выборок доля ложных заключений
равна
,
если верна гипотеза
,
и равна
,
если верна гипотеза
.
Например, в радиолокации принято, что
гипотеза
– отсутствие цели, а гипотеза
– наличие цели. Тогда принятие гипотезы
,
когда на самом деле верна гипотеза
,
называют пропуском сигнала, а вероятность
принятия такого решения называется
вероятностью пропуска
.
Величина
называется вероятностью правильного
обнаружения. Принятие гипотезы
,
т.е. решение о том, что цель присутствует,
когда эта гипотеза несправедлива и цели
в действительности нет, называется
вероятностью ложной тревоги
Предположим, что
рассматриваются основная
и альтернативная
гипотезы. Тогда ошибки первого и второго
рода можно изобразить в виде следующей
таблицы:
|
|
|
Отвергнуть
|
Ошибка первого рода с
вероятностью
|
Верное решение с
вероятностью
|
Принять
|
Верное решение с
вероятностью
|
Ошибка второго рода с
вероятностью
|
Правило, по которому
принимается решение принять или отклонить
гипотезу
,
называется критерием
.
Так как решение принимается на основе
выборки наблюдений с.в.
,
то необходимо выбрать подходящую
статистику (оценку), называемую в этом
случае статистикой
критерия
.
Как правило, при проверки гипотезы
в качестве статистики критерия выбирается
оценка
.
Статистическая
проверка гипотезы основывается на том
принципе, что маловероятные события
считаются невозможными, а события с
большой вероятностью считаются
достоверными. Этот принцип реализуется
следующим образом. Перед анализом
выборки фиксируется уровень значимости
– вероятность ошибочного отклонения
нулевой гипотезы. Обычно задаются
значениями
.
Критерий, основанный
на использовании заранее заданного
уровня значимости, называется критерием
значимости.
Множество всех значений статистики
,
при которых принимаются решения,
отклоняющие гипотезу
и принимающие гипотезу
,
называется критической
областью. Совокупность
же значений статистики
,
при которых принимают гипотезу
,
называется областью
принятия гипотезы.
Точки, отделяющие критическую область
от области принятия решений, называются
критическими.
Для определения
критической области статистики используют
уровень значимости
и учитывают вид альтернативной гипотезы
.
Основная гипотеза
о значении неизвестного параметра
распределения выглядит так:
.
Альтернативная
гипотеза
может при этом иметь следующий вид:
,
или
.
Соответственно можно получить левостороннюю, правостороннюю или двустороннюю критические области (рис. 1). Граничные точки критических областей определяют по таблицам распределения статистики.
Рис. 1.1. Критические области: а – левосторонняя; б – правосторонняя; в – двусторонняя |
-
Схема статистической проверки гипотезы.
Статистическая проверка гипотезы состоим из следующих этапов:
1) формулировка
нулевой
и альтернативной
гипотез;
2) выбор соответствующего
уровня значимости
;
3) определение
объёма выборки
;
4) выбор статистики
критерия
для проверки гипотезы
;
5) определение (по
таблицам, по уровню значимости
и по альтернативной гипотезе
)
критической области и области принятия
гипотезы;
6) формулировка правила проверки гипотезы;
7) принятие
статистического решения: если значения
статистики не входит в критическую
область, то
принимается гипотеза
и отвергается гипотеза
,
а если входит
в критическую область,
то отвергается гипотеза
и принимается
.
Результаты проверки
статистической гипотезы нужно
интерпретировать так: если
приняли гипотезу
,
то можно считать ее доказанной,
а если приняли
гипотезу
,
то признали, что гипотеза
не противоречит
результатам наблюдений.
Однако этим свойством наряду с
могут обладать и другие гипотезы. Следует
помнить, что, принимая
гипотезу
,
следует
проводить ещё дополнительные исследования.