
Конспект лекций Глазова / 10. Испыт гипотез конкрет задачи
.doc10. Испытание гипотез: конкретные задачи.
В п. 9 рассмотрены элементы общей теории испытания статистических гипотез. В данном пункте рассматриваются сравнительно простые и, в то же время, достаточно важные для приложений конкретные задачи испытания гипотез. Все они относятся к самому простому классу двухальтернативных испытаний простых гипотез, в котором достигнута полная теоретическая ясность.
10.1. Испытание простых гипотез
с нормальными распределениями.
Постановка
задачи.
Решающая
статистика.
Рассмотрим испытание гипотез Н0:
N(m0,
)
и Н1:
N(m1,
),
где m0,
m1,
известны.
Это не самый общий случай простых
нормальных гипотез, т. к. дисперсии в
гипотезах одинаковы. Не ограничивая
общности, можно считать, что
=1
(например, можно перед испытанием гипотез
разделить все выборочные значения на
,
или соответствующим образом изменить
отношение правдоподобия и порог). Тогда
Н0:
N(m0,
1), H1:
N(m1,
1), т.
е. плотности одного выборочного значения
в гипотезах:
,
,
плотности вероятности выборки в гипотезах:
отношение правдоподобия
.
Возводя круглые скобки в квадрат и приводя подобные, приводим выражение в квадратных скобках к виду:
[...]=,
а выражение для J(x) к виду:
|
(10.1.1) |
Подставляя сюда выражение выборочного среднего
|
(10.1.2) |
получаем
|
(10.1.3) |
Любая комбинация выборочных значений называется статистикой. Мы получили решающую статистику, т. е. статистику, которую нужно сравнивать с порогом и принимать решения. Замечательно, что выборочные значения входят только в величину m*, которая есть однородная функция (т. е. сумма одинаковых степеней) выборочных значений. Такая величина называется достаточной статистикой. Не всякая задача испытания гипотез имеет достаточную статистику, но если она имеется, то предоставляет два преимущества:
1) решающее правило можно сформулировать как сравнение достаточной статистики с некоторым (уже другим) порогом; от этого решающее правило становится проще;
2) порог для достаточной статистики найти проще, чем для решающей статистики J, которая в общем случае не является однородной функцией выборочных значений.
Решающее правило. Переведем неравенство для решающей статистики J (см. (9.3.4))
J |
(10.1.4) |
в неравенство для достаточной статистики m*. Прологарифмировав (10.1.4) и решив полученное неравенство относительно m*, получим искомое неравенство:
|
(10.1.5) |
где
|
(10.1.6) |
Понятно, почему возникли два варианта: гипотезы отличаются только математическими ожиданиями генеральной СВ, и в этом смысле варианты симметричны с точностью до обозначений. Поэтому можно рассмотреть лишь один вариант. Выберем вариант m0<m1, тогда второе неравенство (10.1.5) порождает решающее правило:
если
, то решение «Н1»;
если
, то решение «Н0».
Критическая
поверхность и критическая область.
Поскольку в данной задаче существует
достаточная статистика и, соответственно,
найдено пороговое решающее правило,
для дальнейшего решения задачи форма
и положение критической области не
нужны. Однако, этот вопрос полезно
прояснить для лучшего понимания задачи
и, вообще, характера испытания простых
гипотез. Из вида решающего правила
(10.1.5) при m0<m1
и выражения (10.1.2) видно, что критическая
поверхность представляет собой
гиперплоскость в n-мерном
выборочном пространстве W.
Из вида выражения (10.1.6) для порога видно,
что эта плоскость перпендикулярна
прямой, соединяющей точки математических
ожиданий в гипотезах Н0,
Н1
, т. е. точки m0=(m0,
m0,...,
m0)
и
m1=(m1,
m1,...,
m1).
Полученное ниже выражение для порога
показывает, что от фиксированного
значения
форма и ориентация критической поверхности
не зависит; при изменении
критическая поверхность остается
гиперплоскостью, перпендикулярной
указанной прямой, меняется только точка
пересечения плоскости и прямой: она
находится между m0
и
m1
, и с
увеличением
придвигается ближе к m0
.
Критическая область w
занимает ту часть пространства W,
которая находится по одну сторону от
критической плоскости, а именно, на
стороне точки m0.
Вычисление
порога. Мы
получили пороговое решающее правило,
однако порог
пока не определен. Его следует определять
по фиксированному значению
(см. п. 9.3). Поскольку решающее правило
отвергает Н0
при совершении события
, то условная вероятность этого события
.
Вероятность в
левой части равенства легко найти:
поскольку в гипотезе Н0
распределение каждого выборочного
значения есть N(m0,
1), то
m*
имеет
распределение (см. п. 5.3) N(m0,
)
c плотностью
.
Теперь
|
(10.1.7) |
Интеграл в правой части не выражается конечной комбинацией элементарных функций, выразим его через специальную функцию «интеграл вероятности» (см. п. 3.8):
|
(10.1.8) |
Сделав в интеграле (10.1.7) замену переменной
,
получаем его в виде
,
и сравнивая его с (10.1.8), получаем (10.1.7) в виде
|
(10.1.9) |
Учитывая свойство
|
(10.1.10) |
запишем (10.1.9) проще:
|
(10.1.11) |
и вводя обозначение
|
(10.1.12) |
находим
|
(10.1.13) |
Учитывая, что
выражается через порог
, видим, что нашли выражение фиксируемой
вероятности ложной тревоги
через порог; но нам нужно обратное
выражение порога через
.
Чтобы его получить, введем функцию
(.),
обратную функции
(.),
тогда из (10.1.13) находим
|
(10.1.14) |
Окончательно,
выражая
из (10.1.12) и подставляя (10.1.14), получаем
|
(10.1.15) |
Порог найден,
(10.1.15) позволяет вычислить его по заданному
.
Для этого используются таблицы функции
(.),
или таблицы функции
(.),
или любой компьютерный статистический
пакет. Пусть, например, m0=2,
n=25,
зафиксируем
на уровне
=0.05.
С помощью таблиц функции
(.)
находим
(0.05)=-1.6449,
и из
(10.1.15) получаем порог
.
Вычисление
мощности критерия.
В этой задаче мощность критерия (см. п.
9.1)
можно выразить через параметры задачи
и порог в явном виде, что бывает не
всегда. Из (9.1.5)
|
(10.1.16) |
однако вычисление
таким способом очень сложно. Согласно
полученному решающему правилу, гипотеза
Н1
принимается тогда, когда совершается
событие
. Мощность критерия как условная
вероятность принятия Н1
при условии, что на самом деле справедлива
Н1
, равна
.
Сравнивая это
выражение с (10.1.7), видим, что можем сразу
получить
,
если в выражении для
заменить m0
на m1
.
Поэтому, сделав эту замену в (10.1.11), сразу
находим
|
(10.1.17) |
Зададим вопрос:
как зависит мощность критерия от
параметров задачи m0,
m1,
n?
«Различие» между гипотезами Н0
и Н1
возрастает с увеличением разности m1-m0
, а
«информативность» выборки возрастает
с увеличением n,
поэтому интуитивно ясно, что мощность
критерия будет монотонно расти с
увеличением как разности m1-m0
, так
и величины n.
Учитывая монотонно возрастающий характер
функций
и формулы (10.1.15), (10.1.16), можно легко
убедиться, что это предположение верно.
Сформулируем теперь конкретный алгоритм испытания двух простых нормальных гипотез.
1) Задаем критическое
значение
.
2) По формуле
(10.1.15) находим порог
.
3) По формуле (10.1.2) находим статистическое среднее m*, играющее в данном случае роль решающей статистики в пороговом решающем правиле.
4) Сравнивая m* с порогом, принимаем решение «Н1» или «Н0».
5) По формуле
(10.1.17) находим мощность критерия
.
6) Находим вероятность
пропуска как
.
10.2. Испытание гипотез с распределениями Коши.
В задаче об испытании
простых нормальных гипотез критическая
поверхность имела одну и туже форму и
ориентацию при любом фиксированном
,
менялось только ее положение. То же
относилось к форме критической области.
В общем случае это не так, что показывает
рассматриваемая в этом пункте задача.
Рассмотрим испытание простых гипотез
H0:
,
Н1:
,
т. е. генеральная
величина распределена в гипотезе Н0
по закону Коши с параметром
= 0, а в гипотезе Н1
- по закону Коши с параметром
= 1. Обычно n>>1,
но в данном случае, для простоты
теоретического рассмотрения, примем
n=1.
Отношение правдоподобия
J(x)=f(x/H0)/f(x/H1)=[1+(x-1)2]/[1+x2].
Неравенство для критической области
[1+(x-1)2]/[1+x2]
,
где
- порог. Собирая члены с одинаковыми
степенями х,
приведем это неравенство к виду
x2(-1)+2x+(
-2)
0.
Мы видим, что сам
вид критической области w
зависит от
.
Например, если
=1,
то неравенство принимает вид 2х
1,
т. е. х
1/2
и
критическая область - бесконечный
полуинтервал
w:
x
;
а если
=1/2,
то неравенство принимает вид x2-4x+3
0,
и критическая область -
конечный
интервал w:
x
[1,
3].
При n=1 в этой задаче, так же как в предыдущей, имеется достаточная статистика: это само выборочное значение х, его можно использовать как решающую статистику вместо J. Дальнейшие действия проведем только для названных частных случаев.
А)
=1.
Фиксированное значение
равно
,
мощность критерия
.
Б)
=1/2.
,
.
10.3. Испытание нормальной гипотезы
против гипотезы с распределением Лапласа.
До сих пор гипотезы Н0 , Н1 предполагали распределения одинакового вида, но с разными параметрами. Лемма Неймана-Пирсона справедлива в любом случае двух простых гипотез, в том числе и таком, когда вид распределения в гипотезах разный.
Рассмотрим испытание двух простых гипотез
Н0:
(N(0, 1)),
Н1:
,
,
т. е. генеральная
СВ распределена в гипотезе Н0
по каноническому нормальному закону,
а в гипотезе Н1
- по закону Лапласа с единичной дисперсией.
Заметим, кстати, что в обоих случаях
mx=0
и
=1.
Опять для простоты математических
выкладок рассматриваем случай n=1.
Отношение правдоподобия
J(x)=f(x/H0)/f(x/H1)=;
неравенство для критической области
J(x)
после логарифмирования приводится к виду
,
и критическая область имеет вид
Решающее правило:
если xw,
то
решение «Н1»,
если хw,
то
решение «Н0».