Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции_ФЭТиП_ПБРС (4 семестр) / Word / Лекция №08 (4 семестр).doc
Скачиваний:
41
Добавлен:
12.02.2015
Размер:
911.36 Кб
Скачать

Тема: Статистическая проверка гипотез

  1. Понятие статистической гипотезы.

Статистическая гипотеза – это утверждение относительно распределения случайных величин генеральной совокупности. Часто гипотезы формулируются как предложения о неизменности некоторого параметра совокупности, об отсутствии его смещения или же относительно изменения этого параметра в нескольких совокупностях. Например, можно рассмотреть гипотезу о размерах изготовляемых деталей, об эффективности лекарства и т.д.

Гипотеза, подлежащая проверке, называется нулевой или основной и обозначается . Запись означает, что выдвинута гипотеза о том, что элемент принадлежит .

Наряду с нулевой гипотезой рассматривают так называемую альтернативную гипотезу, заключающуюся в том, что если нулевая гипотеза отвергается, то принимается альтернативная, которая обозначается . Например, для нулевой гипотезы альтернативной является гипотеза .

Гипотеза называется простой, если она точно определяет распределение случайной величины, в противном случае гипотеза называется сложной. Например, гипотеза , простая. Гипотеза же или определяет область значений параметра и, следовательно, является сложной.

Процедура проверки гипотез – это процесс, позволяющий для любого множества значений получить решение: принять или отклонить проверяемую гипотезу . Правило, согласно которому проверяется гипотеза , называется статистической проверкой гипотезы .

Принимая или отклоняя гипотезу , можно допустить ошибки двух родов: 1) ошибка первого рода имеет место тогда, когда отвергается гипотеза , в то время как в действительности она верна; 2) при ошибке второго рода принимается гипотеза , в то время как верна на самом деле какая-то другая гипотеза .

Пусть – вероятность ошибки первого рода, а – вероятность ошибки второго рода. Тогда можно сказать, что при большом количестве выборок доля ложных заключений равна , если верна гипотеза , и равна , если верна гипотеза . Например, в радиолокации принято, что гипотеза – отсутствие цели, а гипотеза – наличие цели. Тогда принятие гипотезы , когда на самом деле верна гипотеза , называют пропуском сигнала, а вероятность принятия такого решения называется вероятностью пропуска . Величина называется вероятностью правильного обнаружения. Принятие гипотезы , т.е. решение о том, что цель присутствует, когда эта гипотеза несправедлива и цели в действительности нет, называется вероятностью ложной тревоги

Предположим, что рассматриваются основная и альтернативная гипотезы. Тогда ошибки первого и второго рода можно изобразить в виде следующей таблицы:

верна

не верна

Отвергнуть

Ошибка первого рода

с вероятностью

Верное решение

с вероятностью

Принять

Верное решение

с вероятностью

Ошибка второго рода

с вероятностью

Правило, по которому принимается решение принять или отклонить гипотезу , называется критерием . Так как решение принимается на основе выборки наблюдений с.в. , то необходимо выбрать подходящую статистику (оценку), называемую в этом случае статистикой критерия . Как правило, при проверки гипотезы в качестве статистики критерия выбирается оценка .

Статистическая проверка гипотезы основывается на том принципе, что маловероятные события считаются невозможными, а события с большой вероятностью считаются достоверными. Этот принцип реализуется следующим образом. Перед анализом выборки фиксируется уровень значимости – вероятность ошибочного отклонения нулевой гипотезы. Обычно задаются значениями .

Критерий, основанный на использовании заранее заданного уровня значимости, называется критерием значимости. Множество всех значений статистики , при которых принимаются решения, отклоняющие гипотезу и принимающие гипотезу , называется критической областью. Совокупность же значений статистики , при которых принимают гипотезу , называется областью принятия гипотезы. Точки, отделяющие критическую область от области принятия решений, называются критическими.

Для определения критической области статистики используют уровень значимости и учитывают вид альтернативной гипотезы . Основная гипотеза о значении неизвестного параметра распределения выглядит так:

.

Альтернативная гипотеза может при этом иметь следующий вид:

, или .

Соответственно можно получить левостороннюю, правостороннюю или двустороннюю критические области (рис. 1). Граничные точки критических областей определяют по таблицам распределения статистики.

Рис. 1.1. Критические области:

а – левосторонняя; б – правосторонняя; в – двусторонняя

  1. Схема статистической проверки гипотезы.

Статистическая проверка гипотезы состоим из следующих этапов:

1) формулировка нулевой и альтернативной гипотез;

2) выбор соответствующего уровня значимости ;

3) определение объёма выборки ;

4) выбор статистики критерия для проверки гипотезы ;

5) определение (по таблицам, по уровню значимости и по альтернативной гипотезе ) критической области и области принятия гипотезы;

6) формулировка правила проверки гипотезы;

7) принятие статистического решения: если значения статистики не входит в критическую область, то принимается гипотеза и отвергается гипотеза , а если входит в критическую область, то отвергается гипотеза и принимается .

Результаты проверки статистической гипотезы нужно интерпретировать так: если приняли гипотезу , то можно считать ее доказанной, а если приняли гипотезу , то признали, что гипотеза не противоречит результатам наблюдений. Однако этим свойством наряду с могут обладать и другие гипотезы. Следует помнить, что, принимая гипотезу , следует проводить ещё дополнительные исследования.