
Конспект лекций Глазова / 10.5. Испыт гипот биномиал
.doc10.5. Испытание простых гипотез
с биномиальными распределениями.
Пусть получена простая выборка объема n, в которой каждое выборочное значение есть результат N последовательных независимых испытаний над событием А. Испытываются две гипотезы о параметре этих последовательных испытаний: Н0 - что вероятность «успеха» в одном испытании равна р0, против Н1 - что эта вероятность равна р1. Как видим, это простые параметрические гипотезы.
Выборка
представляет собой n-мерный
вектор k=(k1,
k2,...,
kn)
c целочисленными
компонентами, удовлетворяющими условиям
0ks
N.
Распределения одного выборочного значения в гипотезах:
Пусть, для определенности, р1>p0.
Распределения выборки в гипотезах:
,
,
где
.
Отношение правдоподобия:
.
Неравенство для критической области в n-мерном пространстве W целочисленных векторов k:
J(k)
,
где
- порог.
Неравенство для критической области в одномерном пространстве. Как видно из выражения для J(k), все выборочные данные содержатся в единственной величине G, следовательно, эта величина (и любая однозначная функция от нее) - достаточная статистика, и можно построить пороговое решающее правило. Выразив, с помощью логарифмирования, G через J:
,
где
=lnp0-lnp1,
=lnq0-lnq1,
<0,
получаем неравенство для критической области в одномерном пространстве величины G:
.
Для понимания результатов рассмотрения задачи более удобно перейти от G к статистике m*=G/n, имеющей ясный смысл: это выборочное среднее
.
Тогда неравенство для критической области в одномерном пространстве величины m* :
,
где
- новый
порог.
Решающее правило имеет вид:
если
, то решение «Н1»,
если
,то решение «Н0».
Распределение решающей статистики в гипотезах. Для вычисления вероятностей ошибок, порога и мощности критерия необходимо знать распределение решающей статистики, в данном случае - величины m*, в гипотезах. Поскольку выборочные значения имеют дискретное распределение, то и m* - дискретная СВ. Однако, более удобно использовать непрерывную аппроксимацию распределения величины m*. Сначала найдем первые два момента этого распределения. Распределение выборочного значения - биномиальное с параметром р0 в гипотезе Н0, и параметром р1 - в гипотезе Н1; значит, математическое ожидание и дисперсия выборочного значения (см. п. 3.7) mk=Npr , Dk=Nprqr , где r равно 0 или 1. Отсюда находим математическое ожидание и дисперсию величины m* в гипотезах:
M(m*/H0)=Np0, D(m*/H0)=Np0q0/n,
M(m*/H1)=Np1, D(m*/H1)=Np1q1/n.
В п. 7.9 показано, что биномиальное распределение асимптотически (при бесконечном возрастании числа испытаний) нормально; отсюда можно вывести, что при
Nnp0q0>>1, Nnp1q1>>1,
распределения величины m* в гипотезах приближенно нормальны:
Вероятность
ложной тревоги и порог.
Найдем выражение
через порог
, затем обратим это выражение. Имеем:
.
Сделав в интеграле замену переменной
,
учтя выражение для функции «интеграл вероятности» и свойство
,
получим
.
Для обращения
этого равенства относительно
используем функцию
,
обратную функции
.
Тогда
,
и окончательно,
.
Мощность критерия:
,
и действуя так же,
как при вычислении
,
получаем
.
Из этого выражения видно, что мощность критерия монотонно возрастает с увеличением объема выборки n.
10.6. Испытание гипотез о вероятности события.
До сих пор испытывались гипотезы относительно распределений; сейчас рассмотрим испытание гипотез о вероятности некоторого события. Пусть событие А может иметь в одном испытании или вероятность р0, или вероятность р1, причем в серии испытаний эта вероятность не меняется. Испытаем гипотезу Н0: Р(А)=р0 против альтернативы Н1: Р(А)=р1. Для этого проделаем серию из N независимых испытаний и по их результатам будем принимать решения. Число S совершений события А в серии испытаний будем рассматривать как одномерную выборку. Очевидно, распределение СВ S - биномиальное, и распределение выборки в гипотезах:
Пусть, для определенности, р1>p0.
Сравнивая с задачей предыдущего пункта, видим, что рассматриваемая задача представляет собой частный случай при n=1. Поэтому все необходимые результаты немедленно получаются из формул п. 10.5, если в них положить n=1.
Решающая статистика: s; распределения решающей статистики в гипотезах записано выше; их аппроксимации:
;
решающее правило:
если
, то решение «Н1»,
если
,то решение «Н0».
Вероятность ложной тревоги:
;
порог:
;
мощность критерия:
.