
Лекции Мат.стат. (2007-2008) / stat12_07
.pdfЛекция 12.
Проверка параметрических гипотез.
Предположим, что выборка X = (X1; :::; Xn) взята из совокупности, распределение которой P (Xj < u) = F (u; ) полностью определяется значением параметра : Относительно числового параметра этого распределения
имеются две гипотезы H0 : 2 |
2 |
|
|
2 |
S |
0 è H1 : 2 1; = 0 1: Иногда, для |
|||||
краткости, мы будем писать |
|
H1; åñëè |
|
1 èëè 2 H0; åñëè 2 0: |
|
Мы будем рассматривать критерии проверки гипотезы H0 при альтернати- |
|||||
âå H1; основанные на критическом множестве, то есть критерии вида |
|||||
|
|
(H0 |
; X = K: |
|
|
(X) = H1 |
; X 2 K; |
|
|||
|
|
|
2 |
|
|
Обычно критическая область задается с помощью некоторой статистики T (X) и имеет, как правило, следующий вид: K = fX : T (X) Cg; èëè
K = fX : T (X) Cg èëè K = fX : jT (X)j Cg: Статистику T (X) называют в этом случае статистикой критерия. Запись P (X 2 K) означает, что вероятность вычисляется относительно распределения, задаваемого F (u; ):
Определение. Функцией мощности критерия (X) мы будем называть
W ( ) = P (X 2 K); 2 :
Определение. Если W ( ) ; 2 0; то критерий называется критерием уровня проверки гипотезы H0 : 2 0:
Åñëè 0 = 0; то гипотеза H0 - простая и W ( 0) = P 0 (X 2 K) = (ошибка первого рода для критерия (X)).
Åñëè 1 = 1; то гипотеза H1 - простая и W ( 1) = P 1 (X 2 K) = W = 1 ( - ошибка второго рода критерия (X):)
Определение. Если для критерия проверки гипотезы H0 : 2 0 при альтернативе H1 : 2 1
w ( ) ; 2 0; w ( ) ; 2 1;
то критерий называется несмещенным критерием уровня :
Проверка гипотез о числовых значениях параметров нормальных распределений.
Проверка гипотез о среднем значении нормальной совокупности. Пусть X = (X1; :::; Xn) выборка из совокупности, имеющей нормальное распределение: Xj N(a; 2): Относительно параметра имеются две гипотезы
H0 : a = a0;
H1 : a > a1:
1

a) Рассмотрим сначала случай, когда - известно. Если верна гипотеза H0; то распределение статистики
p
T (X) =
n(X a0)
имеет стандартное нормальное распределение. Возьмем теперь в качестве критической области K = fX : T (X) u1 g: Рассмотрим критерий
(
(X) = H0; T (X) u1 H1; T (X) < u1 :
Преобразуем немного неравенства для критической области
|
|
|
|
|
|
|
|
p |
|
( |
|
a0) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
X : T (X) |
|
|
|
= |
|
X : |
n |
X |
|
|
= |
|
|
|
X : |
|
|
|
|
+ u |
|
|
|
||||||||
|
|
u |
|
|
|
u |
|
|
X |
|
a |
|
: |
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
f |
|
|
|
1 g |
|
f |
|
|
|
|
|
|
1 g |
|
|
|
f |
|
|
|
|
0 |
|
1 png |
|
|||||||
Тогда |
|
|
|
(X) = (H0; X < a0 |
+ u1 p |
|
|
: |
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
H1; X a0 + u1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
p |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
Этот критерий совпадает с наиболее мощным критерием уровня ; постро-
енным с помощью леммы Неймана - Пирсона для проверки простой гипотезы H0 против простой альтернативы a = a1; a1 > a0: Так как этот критерий не зависит от a1; то этот критерий является наиболее мощным критерием уровня при любом значении a > a0:
Мы вычисляли мощность этого критерия при каждом a > a0 è ýòà ìîù-
ность равна |
|
|
|
|
|
|
w(a) = 1 u1 + |
|
|
|
|
|
: |
|
pn(a0 |
a) |
|
|
Определение. Критерий уровня ; мощность которого максимальна при каждом значении параметра a 2 H1; называется равномерно наиболее мощным критерием уровня :
Из перечисленных свойств описанного выше критерия (X) следует, что этот критерий является равномерно наиболее мощным критерием уровня :
Замечание Критерий
(
H ; X a + u(X) = 1 0 pn
H ; X > a + u :
0 0 pn
- равномерно наиболее мощный критерий уровня для проверки гипотезы
H0 : a = a0
при альтернативе
H1 : a < a0:
2

Пример. В бутылке должно находится 200 мл минеральной воды. Из партии было проверено 100 бутылок и обнаружено, что в среднем в бутылке 199 мл. Предполагая, что стандартное отклонение для объема минеральной воды в одной бутылке равно 5 мл, определить, является ли выявленное отклонение значимым, при альтернативе о среднем недоливе бутылок минеральной воды.
Естественно предположить, что количество минеральной воды распределено нормально с параметрами a; :
Гипотеза H0 : a = 200 |
|
|
|
|
|
|
|
|
|
|
|
||||||
Гипотеза H1 : a < 200: |
|
|
|
|
|
|
|
|
|
|
|
||||||
|
p |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Величина |
|
n |
(X 200) |
= |
2: |
При нулевой гипотезе эта статистика имеет |
|||||||||||
|
|
||||||||||||||||
5 |
|
|
p |
|
|
|
|
|
|
|
|||||||
стандартное нормальное распределение и |
P ( |
|
n |
(X 200) |
< 2) = 0:023: |
Ýòî |
|||||||||||
|
|
||||||||||||||||
значение называется p value: |
|
5 |
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
||||||||
Таким образом, при 5% уровне значимости критерия (т.е. если мы хотим |
|||||||||||||||||
сделать вывод о недоливе надежный на 95%) гипотеза |
H0 должна быть |
отклонена. При 1% уровне значимости нет оснований отклонять гипотезу
H0:
Пусть теперь нужно проверить гипотезу H0 : a = a0; а альтернатива H1 : a 6= a0: Рассмотрим критерий
(H0; |
|
p |
|
|
|
|
|
< u1 =2: |
|
|
pn(X a0) j |
||||||||
(X) = H1; j |
|
|
n(X a0) |
u1 =2 |
|||||
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|||
|
j |
|
|
|
|
|
j |
|
|
|
|
|
|
|
|
По построению этот критерий - критерий уровня : Подсчитаем теперь мощность этого критерия при любом a 6= a0:
w(a) = Pa j |
|
|
|
( |
|
|
|
|
) |
j u1 =2 = Pa |
|
|
|
|
|
|
|
) |
u1 =2 + |
|||||||||||||||||||||||||||||
|
n |
|
|
0 |
|
|
|
|
|
0 |
||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
p |
|
X |
a |
|
|
|
|
|
|
|
|
pn(X |
a |
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
+Pa |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
u =2 = Pa X a0 |
+ pnu1 =2 +Pa X a0 |
+ pnu =2 |
|||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
0 |
|
|
||||||||||||||||||||||||||||||||||||||
|
pn(X |
a |
) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
= Pa |
p |
|
|
|
|
|
|
|
a) |
|
|
|
(a |
|
|
p |
|
+ u1 =2 +Pa |
|
|
|
|
|
|
p |
|
|
|
|
|
p |
|
|
|||||||||||||||
|
|
|
|
X |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||
|
n( |
|
|
|
|
|
0 |
a) n |
(X a) n |
|
(a0 a) n |
+ u =2 |
||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
p p
= 1 (a0 a) n + u1 =2 + (a0 a) n + u =2 :
Åñëè a < a0; òî w(a) ! 1 ïðè n ! 1: Åñëè a > a0; то также w(a) ! 1 при n ! 1:
Для этого критерия при любом распределении из класса распределений, содержащихся в H1; вероятность отвергнуть нулевую гипотезу стремится к 1, если объем выборки неограниченно растет.
Определение. Если мощность критерия при всех значениях числового параметра, принадлежащих конкурирующей гипотезе H1 стремится к еди- нице при n стремящемся к бесконечности, то такой критерий называется состоятельным критерием.
=
=
3

Пример.Процесс упаковки сахара считается нормальным, если в упаковку помещается 1000 г сахара со стандартным отклонением 12г. Для контроля качества упаковки каждый час проверяется 16 коробок сахара. В результате очередной проверки было обнаружено, что средний вес коробки равен 1003г. Является ли это достаточным основанием для остановки процесса и устранения неисправности? Уровень значимости полагается равным 0.05.
Гипотеза H0 : a = 1000
Гипотеза H1 : a 6= 1000
p
n(X 1000)
Значение статистики 12 равно 1. Верхнее и нижнее значения p- value равны соответственно 0.159 и 0.841. Поэтому оснований для остановки
процесса нет.
Замечание. Если даже случайная величина имеет стандартное нормальное распределение, то при повторяющихся много раз наблюдениях с большой вероятностью могут встретиться недопустимо большие значения этой случайной величины.
б) Теперь посмотрим, что изменится, если рассматривается выборка из нормальной совокупности с неизвестной дисперсией и нужно проверить гипотезу
H0 : a = a0
при альтернативе
H1 : a > a0:
Известно, что если верна гипотеза H0; то статистика p
T (X) =
n 1(X a0)
S
имеет распределение Стьюдента с n-1 степенью свободы. Рассмотрим кри- |
||||||
терий |
p |
|
|
|
|
|
(H0; p |
n |
(X a0) |
< t(n 1; 1 ): |
|||
(X) = H1; |
n(X a0) |
t(n 1; 1 ) |
||||
|
|
|
S |
|
||
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
S |
Также, как и раньше можно убедиться в том, что это критерий уровня значимости : При любом a > a0 мощность этого критерия w(a) ! 1 при n ! 1:
Пусть теперь проверяется гипотеза
|
|
H0 : a = a0 |
|
||||
при альтернативе |
|
H1 : a < a0: |
|
||||
|
|
|
|||||
Тогда критерий |
|
|
|
|
|
|
|
|
p |
|
|
|
|
> t(n 1; 1 ) |
|
(H0; pn(X a0) |
|||||||
(X) = H1; |
|
n(X a0) |
t(n 1; 1 ) |
||||
|
|
|
S |
|
|||
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
S |
|
4

является критерием уровня и мощность этого критерия при любом a < a0 стремиться к единице.
Если проверяется также гипотеза H0 при альтернативе H1 : a 6= a0; òî
критерий |
p |
|
|
|
|
|
|
|
|
|
|
|
|
< t(n 1; 1 =2): |
|
(H0; jpn(X a0) j |
|||||||
(X) = H1; |
n(X a0) |
t(n 1; 1 =2) |
|||||
|
|
|
S |
|
|||
|
|
|
|
|
|
||
j |
|
|
|
|
j |
|
|
|
|
|
S |
является состоятельным критерием уровня :
Пример.Страховая компания нанимает агентов с оплатой через комиссионные сборы. Компания утверждает, что в первый год работы будут зарабатывать среднюю комиссию по крайней мере 40000$ в год. Случайная выборка 9 агентов показала, следующие результаты величины комиссий
99
XX
Xj = 333; |
(Xj |
X |
)2 = 312: |
j=1 |
j=1 |
Распределение совокупности можно считать нормальным. Проверить на 5% уровне значимости гипотезу о том, что среднее совокупности не меньше 40т.
T (X) = |
p |
|
( |
|
40) |
= |
|
|
|
|
|
|
|
n |
X |
|
0:48; |
|
= 37; S |
|
= 18:73 |
||||||
X |
0 |
||||||||||||
|
|
|
|
||||||||||
|
|
|
|
S0 |
|
|
|
|
Гипотеза H1 : a < 40; поэтому критическая область T (X) t(8; 0:05) =1:85; p value = :322038: Данные не противоречат утверждению страховой
компании.
Проверка гипотез о числовом значении дисперсии нормальной совокупности. Предположим, что выборка X = (X1; :::; Xn) взята из нормальной совокупности N(a; 2): Предположим также, что мы хотим прове-
рить нулевую гипотезу H0 : 2 = 02 против одной из трех альтернатив
H1 : 2 > 02;
H1 : 2 < 02;
H1 : 2 6= 02:
При этом критериями уровня являются следующие критерии:
|
(H0 |
|
nS2 |
2 |
|
|
|
|
|
(X) = |
; nS22 |
< 2 |
(n 1; 1 |
) |
|||||
|
H1 |
; |
02 |
(n |
|
1; 1 |
) |
||
|
|
|
|
|
|
|
|
|
|
|
|
|
0 |
|
|
|
|
||
|
(H0 |
|
nS2 |
2 |
|
|
|
|
|
(X) = |
; nS22 |
> 2 |
(n 1; 1 |
) |
|||||
|
H1 |
; |
02 |
(n |
|
1; 1 |
) |
||
|
|
|
|
|
|
|
|
|
|
|
|
|
0 |
|
|
|
|
(H1; nS22 2(n 1; 1 =2) èëè nS22 < 2(n 1; =2)
(X) = 02 0
H0; nS2 < 2(n 1; 1 )
0
5
Все эти критерии имеют уровень значимости и состоятельны каждый
при своей альтернативе.
Пример. Фирма предлагает новую установку по упаковке кофе. Фирма заявляет, что новая установка более точная, чем старая. Старая установка имеет точность = 5 гр: На 5% уровне значимости проверить утверждение
фирмы.
Для проверки утверждения фирмы был приглашен независимый эксперт. Шесть независимых проб дали следующие результаты
|
âåñ |
102 |
103 |
97 |
99 |
100 |
|
97 |
|
|
|
|
H1 |
|
|
|
|
|
|
|
|
=52 |
|
5) против альтернативы |
|
: > 5: Статистика критерия T (X) = nS2 |
||||||||||||
|
Мы будем проверять гипотезу H0 |
: = 5 ( |
|
равна 1.253 и это значение
больше 2(5; 0:05) = 1:145: Поэтому нет оснований на 5% уровне значимости доверять утверждению фирмы.
6