
Семинары по ТВиМС / Семинар11_твмс
.doc(ТВиМС) Семинар 11.
Рассмотрим случайную
величину
и случайную выборку
=(X1,…,
Xn),
полученную в результате n
независимых испытаний над ней. Требуется
проверить некоторую гипотезу H0
о законе распределения .
Будем говорить, что задан
некоторый статистический критерий для
проверки гипотезы H0,
если сформулировано правило, согласно
которому принимается решение: согласуются
ли наблюдаемые значения с гипотезой
(обычно ее называют основной или нулевой)
или она должна быть отвергнута, как
противоречащая статистическим данным.
Для
построения критерия обычно разбивают
выборочное пространство
на два непересекающихся множества R
и S
таких, что все значения выборки
,
принадлежащие множеству R,
считаются характерными для гипотезы
H0,
а принадлежащие множеству S–
нехарактерными для гипотезы H0.
Гипотезе H0
принимается, если конкретная реализация
выборки будет принадлежать R,
и отвергается, если она будет принадлежать
S.
Следовательно, критерий можно определить
с помощью множества S.
Множество S
называется критическим
множеством.
Для каждого критерия
возможны ошибки двух родов. Ошибка
первого рода–
гипотеза H0
справедлива, но она отвергнута. =
–вероятность
ошибки первого рода (кратко говорят:
ошибка первого рода равна ).
Ошибка второго
рода–
гипотеза H0
ложна, но она принята. –вероятность
ошибки второго рода.
Множество S
можно задать с помощью статистики T
=T(),
характеризующей отклонение эмпирических
данных от соответствующих (гипотезе
H0)
гипотетических значений, распределение
которых в случае справедливости H0
известно (точно или приближенно). Тогда
для каждого достаточно малого >0
можно определить подмножество S1={t:
t
=T(
),
},
удовлетворяющее (точно или хотя бы
приближенно условию)
.
Любое такое
подмножество S1
порождает следующий критерий согласия
для гипотезы H0:
если t
=T()–наблюдавшееся
значение статистики T(
),
то при tS1
гипотеза H0
отвергается, в противном случае
принимается. Число
называют уровнем
значимости критерия или
размером
критерия,
статистику T
–статистикой
критерия, а
сам критерий –критерием
S1.
Любое допустимое
распределение
выборки
,
отличающиеся от гипотетического (т.е.
распределения при гипотезе H0),
будем назвать
альтернативным распределением
или альтернативой.
Совокупность всех альтернатив называют
альтернативной
гипотезой
и обозначают H1. Функцией
мощности критерия S1
называется функционал на множестве
всех допустимых распределений {F}:
W(F)=W(S1;
F)=.
W(F)–вероятность попадания значений статистики в критическую область, когда истинным распределением наблюдений является F. Если F H1, то значений W(F) называют мощностью критерия при альтернативе F, оно характеризует вероятность принятия правильного решения в ситуации, когда H0 ложна. Таким образом, =1– W(F).
Из двух критериев с одним и тем же уровнем значимости лучшим считается тот, мощность которого при альтернативе больше.
Пусть требуется различить две простые гипотезы H0 и H1, согласно которым абсолютно непрерывна (дискретна) распределена с плотностями распределения p0(x) и p1(x) (вероятностями p(x)=P{=x}) .
Теорема Неймана-Пирсона. Наиболее мощный критерий проверки простой гипотезы H0 при простой альтернативе с вероятность ошибки первого рода существует и задается критической областью
,
где
критическая граница определяется из
условия
.
Статистика
называется статистикой
отношения правдоподобия.
Задачи
1. Пусть абсолютно-непрерывная случайная величина имеет плотность распределения, сосредоточенную при гипотезе H0 на отрезке [0,1], а при гипотезе H1 на отрезке [2,3]. Построить критерий для проверки гипотез H0 и H1 при одном испытание n=1. Ответ: S=[2,3]. ,–?.
2.
Пусть случайная величина
при гипотезе H0
имеет распределение
,
а при гипотезе H1
–распределение: 1)
;
2)
;
3)
;
4)
.
Зададим критерий для проверки гипотезы
H0
против альтернативы H1.
Для следующих критических областей
найти ,.
-
S={
: все Xj1, j=
}; б) S={
: хотя бы одно из Xj, равно 2} для 2–4; в) придумать свой критерий.
3.
Пусть выборка состоит из одного
единственного наблюдения x1(n=1).
Что представляет собой при разных
значениях
критическое
множество критерия Неймана-Пирсона для
проверки гипотез.
а)
случайная величина
при гипотезе H0
имеет распределение
,
при H1–
.
б)
случайная величина
имеет
распределение
,
где дисперсия
известна, а математическое ожидание
нет. H0:
=
0
против альтернативы H1:
=1.
в)
случайная величина
имеет
плотность (x,)=,–<x<+,
(–,+))
проверяется гипотеза H0:=0
против альтернативы H1:
=1.
4. В последовательности n независимых испытаний вероятности положительных исходов одинаковы и равны p. Построить критерий проверки гипотезы p0=0 против альтернативы p>0. Найти , .
Ответ: S={Tn>0}, Tn– число положительных исходов в n испытаниях.
5.
Построить по одному наблюдению X1(n=1)
критерий отношения правдоподобия для
проверки гипотезы H0:
f(x)=1
на отрезке [0,1] против альтернативы H1:
f(x)=
на отрезке [0,1].
Ответ:
=P{
X1>c},
c=1–,
=
.
6.
Пусть для распределения Коши (плотность
f(x,)=,–<x<+,
(–,+))
проверяется гипотеза H0:=0
против альтернативы H1:
=1.
Построить по одному наблюдению (n=1)
критерий отношения правдоподобия:
S={
:
c}.
Найти в явном виде критическую область
S
и ошибки ,
в случае выбора c:
а) c=1,
б) c=2.
Ответ: S={X11/2}, =1/2–1/ arctg1/2, =–1/2–1/ arctg1/2; S={3X11}, =1/(arctg 3– arctg1), =1–1/ arctg2.
7.
По выборке
=(X1,…,Xn)
из Пуассоновского распределения П()
построить критерий Неймана-Пирсона для
проверки гипотез H0:
=0
против альтернативы H1:
=1(0<0<1).
Ответ:
=
.
Критическая граница находится из
уравнения
,
.
8.
(д.з.) Продолжение 7. Исследовать
асимптотическое поведение характеристик
критерия при больших объемах выборки
(n)
и гипотезах 1=0+,
a>0–константа.
Указание. Использовать, если имеет распределение Пуассона с E=, то
.
(почему?)
Таким образом, можно считать, что при больших величина имеет приближенно нормальное распределение с E=, D=.
9.
Рассмотрим последовательность
биномиальных испытаний X1,…,Xn
с постоянной вероятностью успеха p.
Построить критерий отношения правдоподобия
для проверки гипотез H0:
p=p0
при альтернативе H1:
p=p1
(p0<
p1).
Найти минимальный объем выборки n,
при котором можно разделить гипотезы
H0
и H1
с заданным уровнем значимости
и мощностью .
Ответ: n=.