
Тема 8. Критерии проверки параметрических гипотез. Различение двух простых гипотез.
1. Критерии проверки параметрических гипотез.
Пусть наблюдение
имеет неизвестную функцию распределения
,
зависящую от параметра
,
где
– множество допустимых значений
параметра
.
Пусть
– множество функций распределения
,
получаемых при всевозможных допустимых
значениях параметра
:
.
Основная гипотеза
заключается в том, что неизвестная
функция распределения
принадлежит некоторому заданному,
фиксированному подмножеству
:
:
.
Поскольку каждой функции из множества
соответствуют определенное значение
параметра
,
то множеству функций
соответствует подмножество параметров
такое, что:
.
Отсюда следует, что гипотеза
может быть переформулирована в терминах
параметра
:
гипотеза
заключается в том, что значение параметра
:
:
.
Именно поэтому гипотезу
принято называть параметрической.
Альтернативная гипотеза
в данном случае образована множеством
всех функций
,
которые не попали в множество
:
:
,
.
В терминах параметра
альтернативная гипотеза
заключается в том, что:
:
,
.
Предположим, что имеется статистический
критерий проверки гипотезы
,
тогда для каждой реализации наблюдения
критерий либо принимает гипотезу
,
либо отклоняет гипотезу
(принимает гипотезу
).
Пусть
– выборочное пространство (множество
всех возможных реализаций наблюдения):
,
тогда в множестве
можно выделить подмножество реализаций
,
для которых критерий принимает гипотезу
,
и подмножество реализаций
,
для которых критерий принимает гипотезу
.
Фактически задание любого критерия
сводится к заданию разбиения множества
на множества
и
:
,
,
поэтому для обозначения критерия далее
будем использовать обозначение
.
С каждым критерием связаны две ошибки:
ошибка первого рода – критерий отклоняет
гипотезу
в том случае, когда она верна, ошибка
второго рода – критерий принимает
гипотезу
в том случае, когда она не верна (верна
альтернативная гипотеза
).
Определение 8.1.
Для критерия
вероятностью ошибки первого рода
называется вероятность:
,
.
где вероятность вычисляется при условии,
что функция распределения наблюдения
есть функция
.
Действительно, если гипотеза
верна, то истинное значение параметра
,
и критерий отклоняет гипотезу
,
если наблюдение
попадает в множество
,
поэтому вероятность ошибки первого
рода
есть вероятность того, что наблюдение
окажется в множестве
,
которая вычисляется с функцией
распределения
при значении параметра
.
Заметим, что вероятность ошибки первого
рода
,
вообще говоря, зависит от значения
параметра
,
и поэтому может оказаться различной
при различных значениях параметра.
Определение 8.2.
Для критерия
вероятностью ошибки второго рода
называется вероятность:
,
,
где вероятность вычисляется при условии,
что функция распределения наблюдения
есть функция
.
Действительно, если гипотеза
не верна, тогда истинное значение
параметра
,
и критерий принимает гипотезу
,
если наблюдение
попадает в множество
,
поэтому вероятность ошибки второго
рода
есть вероятность того, что наблюдение
окажется в множестве
,
которая вычисляется с функцией
распределения
при значении параметра
.
Заметим, что опять же вероятность ошибки
второго рода
зависит от значения параметра
и поэтому может оказаться различной
при различных значениях параметра.
Поскольку каждый критерий однозначно
определяет разбиение выборочного
пространства
на подмножества
и
,
то с каждым критерием однозначно связаны
функции ошибок первого и второго родов.
Крайне желательно, чтобы вероятности
ошибок были как можно меньше, поэтому
следует стремиться построить такой
критерий, для которого вероятности
принимают наименьшее значение.
В общем случае функции вероятностей
ошибок первого и второго родов не связаны
каким-либо строгим соотношением,
поскольку вычисляются при различных
функциях распределения
и
,
которые могут быть никак не связаны
между собой. Тем не менее, как правило,
попытки уменьшения значений вероятностей
одной ошибки приводят к увеличению
значений вероятностей другой ошибки.
Этот эффект возникает из-за того, что
функции вероятности ошибок связаны
через множества
и
.
Уменьшение вероятностей ошибок первого
рода
в большинстве случаев возможно только
за счет «сужения» множества
,
которое приводит к «расширению» множества
,
и как следствие, совершенно точно не
приводит к уменьшению вероятностей
ошибок второго рода
,
а в большинстве случаев приводит к
увеличению.
В силу невозможности одновременного
уменьшения вероятностей ошибок первого
и второго рода иногда поступают следующим
образом: изначально задаются некоторым
уровнем значимости
и рассматривают множество критериев
,
для которых функция вероятности ошибки
первого рода
не превосходит значения
:
.
Далее сравнивают функции вероятностей
ошибок второго рода всех критериев из
множества
.
В общем случае критерии
и
из множества
могут оказаться несравнимыми, поскольку
вполне возможно при одних значениях
параметра
имеет место неравенство
,
а при других значениях параметра
наоборот
,
тем не менее некоторые критерии все же
оказываются сравнимыми.
Определение 8.3.
Критерий
равномерно мощнеекритерия
,
если:
1)
:
,
2)
:
.
Определение 8.4.
Критерий
называетсяравномерно наиболее мощнымкритерием, если критерий
равномерно мощнее любого другого
критерия в классе
.
В случае если множество
состоит из одной точки
,
то равномерно наиболее мощный критерий
иногда называютнаиболее мощным
критерием(опуская слово равномерно).
В некоторых случаях равномерно наиболее мощного критерия может не существовать.