
Лекции Мат.стат. (2007-2008) / stat13_07
.pdf
Лекция 13.
Проверка параметрических гипотез.(Продолжение)
Проверка гипотезы о разности средних двух нормальных совокупностей.
Пусть имеются две выборки X = (X1; :::; Xn); Y = (Y1; :::; Ym): Ïðè ýòîì
выборка X взята из совокупности с распределением N(ax; x2); а выборка Y из совокупности с распределением N(ay; y2): Есть гипотеза H0 : ax = ay:
I. Рассмотрим сначала случай, когда дисперсии совокупностей известныx 6= y: Как было показано ранее (при построении доверительных интервалов) распределение статистики
|
|
|
|
|
|
|
|
|
G(X; Y; a a ) = |
X Y (ax ay) |
|||||||
x y |
|
|
|
2 |
|
2 |
||
|
|
q |
x |
+ |
y |
|
||
|
|
n |
m |
нормально c параметрами 0, 1. Если верна гипотеза H0 : ax = ay; то стати-
стика
X Y T (X) = q
x2 + y2 n m
имеет стандартное нормальное распределение. Поэтому критерий
(X) = |
8 |
r n |
+ m |
|
|
|
|
|||||
|
H1; |
|
X Y |
|
|
|
u1 |
|
|
|||
|
>H0; |
|
|
x |
|
|
y |
|
|
|||
|
|
X Y |
2 |
|
< u1 |
|||||||
|
> |
|
2 |
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
||||
|
2 |
|
|
2 |
|
|
|
|||||
|
< |
|
|
x |
|
|
y |
|
|
|
||
|
> |
r n |
+ m |
|
|
|
|
|||||
|
> |
|
|
|
|
|
|
|
|
|
|
|
|
: |
|
|
|
|
|
|
|
|
|
|
|
является состоятельным критерием уровня проверки нулевой гипотезы
при альтернативе H1 : ax > ay: Здесь состоятельность означает, что при n ! 1; m ! 1 мощность критерия при любых значениях ax > ay ñòðå- мится к единице.
Аналогично критерий
(X) = |
8 |
|
|
r n |
+ m |
|
|
|
||||||||||
|
|
|
H1; |
|
|
X Y |
|
|
|
|
|
u |
|
|||||
|
|
>H0; |
|
|
X Y |
2 |
|
> u |
|
|||||||||
|
|
> |
|
|
2 |
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
x |
|
|
y |
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
2 |
|
|
2 |
|
|
|
||||||||
|
|
< |
|
|
|
|
x |
|
|
|
|
y |
|
|
|
|||
|
|
> |
|
|
r |
n |
+ |
m |
|
|
|
|
||||||
- состоятельный критерий |
|
> |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
H0 при альтернативе |
|
|
: |
проверки гипотезы |
|||||||||||||||
|
ровня |
|
|
H1 : ax < ay:
При проверки гипотезы H0 при альтернативе H1 : ax 6= ay двухсторон-
ний критерий |
8 |
|
|
|
|
|
|
|
|
|
|
|
|
> |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
+ m |
|
|
|
||||
(X) = |
> |
H1; |
r |
X Y |
|
|
|
u1 =2 |
||||
|
> |
|
|
|
x |
|
|
y |
|
|
|
|
|
> |
|
|
|
|
|
|
|
|
|
|
|
|
> |
|
|
|
2 |
|
|
2 |
|
|
|
|
|
> |
|
|
|
|
|
|
|
|
|
|
|
|
< |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
> |
H0; |
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
+ |
y |
|
|
|||||
|
> |
|
r |
|
|
|
|
|
|
|
|
|
|
> |
|
|
|
|
|
|
|
|
|
|
|
|
> |
|
|
|
|
|
|
|
|
|
|
|
|
> |
|
|
|
2 |
|
|
2 |
|
|
|
|
|
> |
|
|
|
|
|
|
|
|
|
|
|
|
: |
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
m |
|
|
1

является состоятельным критерием уровня :
II. Пусть теперь x = y и дисперсии совокупностей неизвестны. Тогда, как было показано ранее, статистика
x |
y |
|
|
|
|
|
|
+ mS2 |
r |
|
m + n |
|
|
|
|
|
|
|
nS2 |
|
|
|
|||||||
G(X; Y; a |
a |
) = |
|
X Y (ax ay) |
|
mn(m + n |
2) |
|
||||||
|
|
q |
|
x |
y |
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
имеет распределение Стьюдента с n + m 2 степенями свободы. Если верна гипотеза H0 : ax = ay статистика
r |
|
m + n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
nS2 |
+ mS2 |
||||||
T (X) = |
mn(m + n |
2) |
|
|
q |
X Y |
||||||
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
x |
|
|
y |
|||
|
|
|
|
|
|
|
|
|
распределена по закону Стьюдента с n + m 2 степенями свободы. Крити- ческие области для проверки H0 строятся следующим образом
H1 : ax > ay тогда K = fT (X) t(n + m 2; 1 )g;
H1 : ax < ay тогда K = fT (X) t(n + m 2; 1 )g;
H1 : ax 6= ay тогда K = fjT (X)j t(n + m 2; 1 =2)g:
Проверка гипотез о равенстве дисперсий двух нормальных совокупностей.
Пусть имеются две выборки X = (X1; :::; Xn); Y = (Y1; :::; Ym): Ïðè ýòîì
выборка X взята из совокупности с распределением N(ax; x2); а выборка Y из совокупности с распределением N(ay; y2): Есть гипотеза H0 : x = y:
Известно, что |
|
x2 y2 |
|
|
|||||
|
x |
|
|
||||||
G(X; Y; |
|
= |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
y |
2 2 |
|
|
|||||
|
|
by |
x |
|
1: |
||||
имеет распределение Фишера с параметрами |
|
|
m |
||||||
|
|
|
b |
n 1; x2 |
|
||||
Если верна H0 : x = y; то статистика T (X) = |
|
|
имеет распределение |
||||||
b y2 |
|||||||||
|
|
|
|
|
|
b |
|
|
Фишера с теми же параметрами. Если нужно проверить гипотезу H0 ïðè альтернативе H1 : x > y; то критерием уровня будет критерий
(H0 |
; T (X) < F (n |
|
1; m |
|
1; 1 |
|
): |
(X) = H1 |
; T (X) F (n |
1; m |
1; 1 |
) |
|||
|
|
|
|
|
|
|
|
Критические области для проверки гипотезы H0 при разных альтернатив- ных гипотезах строятся следующим образом
H1 : x < y; тогда K = fT (X) F (n 1; m 1; 1 )g;
H1 : x 6= y; тогда K = fT (X) F (n 1; m 1; 1 =2) или T (X) F (n 1; m 1; =2)g:
2

Проверка гипотез о средних значениях (математических ожиданиях) совокупностей.
Пусть выборка X = (X1; :::; Xn) взята из совокупности, про которую из-
вестно лишь, что у нее существует математическое ожидание a = EXj è дисперсия 2 = DXj: Согласно центральной предельной теореме последо-
вательность |
n |
X |
|
|
na |
|
|
|
|||
|
Pj=1 p |
j |
|
|
|
|
|
|
n |
|
при n ! 1 слабо сходится (по распределению) к стандатному нормальному закону. Кроме того, S2 сходится по вероятности к 2: Поэтому распределе-
íèå |
n |
X |
|
|
na |
|
|
|
|||
|
Pj=1 pj |
|
|
||
|
|
S |
n |
|
|
также при больших n стремится к стандартному нормальному закону.
Пусть относительно параметра a имеется гипотеза H0 : a = a0: Если верна нулевая гипотеза, то распределение статистики
p
T (X) =
n(X a0)
S
слабо сходится при n ! 1 к стандартному нормальному распределению.
Поэтому, если проверяется нулевая гипотеза при одной из альтернатив, то критические области выглядят следующим образом:
H1 : a > a0; K = |
|
|
|
|
|
|
( |
|
|
|
|
|
|
|
) |
u1 |
||||
|
|
n |
|
S |
|
0 |
||||||||||||||
|
|
|
p |
X |
|
|
a |
|
|
|
||||||||||
|
H1 : a < a0; K = |
|
|
|
|
|
( |
|
|
|
|
|
) |
u |
||||||
|
|
|
|
n |
|
S |
|
0 |
||||||||||||
|
|
|
|
p |
|
|
X |
|
a |
|
|
|||||||||
|
: a 6= a0; K = |
p |
|
( |
|
|
|
|
|
u1 =2 |
||||||||||
H1 |
n |
|
S |
0 |
||||||||||||||||
|
|
|
|
|
|
X |
|
|
a ) |
|
|
|
|
|||||||
Критерии, использующие эти критические |
области, |
являются состоятель- |
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ными критериями с асимптотическим уровнем :
Проверка гипотез о значении долей.
Пусть все элементы выборки Xj принимают лишь значения 0 и 1, при этом P (Xj = 1) = p; P (Xj = 0) = 1 p; òî EXj = p; DXj = 2: Тогда при
гипотезе H0 : p = p0
p
T (X) = pn(pb p0) ; p0(1 p0)
3

Поэтому, как и в предыдущем пункте, критические области |
|
P |
n |
||||||||||||||
|
j=1 Xj=n): |
||||||||||||||||
слабо сходится к стандартному нормальному распределению (p = |
|
||||||||||||||||
дующим образом: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
b |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
строятся сле- |
||
H1 : p > p0; K = ( |
|
|
|
|
|
|
|
|
|
; |
|
|
|
|
|||
|
p0(1 p00) u1 ) |
|
|
|
|
||||||||||||
|
|
pn(p p ) |
|
|
|
|
|
||||||||||
|
|
p |
|
|
|
b |
|
|
|
|
|
|
|||||
H1 : p < p0; K = |
( |
|
|
|
|
|
|
(1 p00) u ); |
|
|
|
|
|
||||
|
|
|
|
p0 |
|
|
|
|
|
||||||||
|
|
|
|
pn(p p ) |
|
|
|
|
|
||||||||
|
|
|
p |
|
|
|
b |
|
|
|
|
|
|
|
|||
H1 : p 6= p0; K = ( |
|
|
|
|
|
(1 p00) u1 =2) |
; |
|
|
|
|||||||
|
|
p0 |
|
|
|
||||||||||||
|
pn(p |
p ) |
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
b |
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
p |
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Задача Предположим, что при стандартном лечении онкологического заболевания 30% пациентов живут 5 лет. Новый тип лечения предлагается 100 пациентам, 38 из которых остаются жить после 5 лет. На 5% уровне проверить гипотезу о том, что новый тип лечения более эффективен.
Решение. Гипотеза H0 : p = 0:3; гипотеза H1 : p > 0:3; ãäå p - äîëÿ
Статистика |
|
|
|
|
pb= 0:38: |
пациентов, получивших новое лечение и проживших более 5 лет, |
|
||||
|
b |
0:100 |
|
|
|
T (X) = |
p |
0:3 |
= 1:746 > u0:95 |
= 1:645: |
|
|
q |
|
|
|
|
|
|
3 0:7 |
|
|
|
Поэтому гипотеза H0 отвергается и принимается гипотеза о том, что новый тип лечения более эффективен.
Проверка гипотез о разности средних двух независимых выборок.
Предположим имеются две независимые выборки X = (X1; :::; Xn) è
Y = (Y1; :::; Ym): Мы будем предполагать, что EXj = ax; EYj = ay; DXj =
x2; DYj = y2:
Можно показать, что распределение статистики
X Y (ax ay)
p
Sx2=n + Sy2=m
при n ! 1; m ! 1 стремиться к стандартному нормальному распределе-
íèþ.
Если верна гипотеза H0 : ax ay = b; то статистика
X Y b
T (X; Y ) = p
Sx2=n + Sy2=m
4

при больших n; m имеет распределение, близкое к стандартному нормаль-
ному распределению. Поэтому критерий уровня проверки гипотезы H0 : ax ay = b при альтернативе H1 : ax ay > b задается c помощью крити- ческой области K = fT (X; Y ) u1 g:
Критическая область критерия уровня для проверки гипотезы H0 ïðî- тив альтернативы H1 : ax ay < b равна K = fT (X; Y ) u g:
В случае двусторонней альтернативы критическая область критерия уровня равна K = fjT (X; Y )j u1 =2g:
Проверка гипотез о равенстве долей двух совокупностей.
Пусть каждый элемент выборки X = (X1; :::; Xn) принимает лишь два значения 0 и 1 и при этом P (Xj = 1) = px: Пусть кажлый элемент выборки Y = (Y1; :::; Ym) также принимает значения 0 или 1 и P (Yl = 1) = py: Проверяется гипотеза H0 : px = py: Статистикой критерия при этом является
pbx pby
T (X) = q :
p(1 p)( 1 + 1 ) b b n m
В этих формулах pbx; pby - доля единиц в выборках X и Y соответственно, а pb - доля единиц в объединении этих двух выборок
pb= npbx + mpby : n + m
Распределение статистики T (X) при n ! 1 стремится к стандартно-
му нормальному распределению. Можно пояснить это следующим образом. Очевидно, что распределение статистик
vx = |
|
n |
|
|
|
|
|
||
P px(1 px)n |
|||||||||
|
|
j=1 Xj npx |
|||||||
vy = |
p |
m |
|
|
|
|
|||
Plpy(1 |
|
py)n |
|||||||
|
|
|
|
=1 Yl |
|
npy |
|||
|
|
p |
|
|
|
|
|
p
n(pbx px) = p ;
px(1 px)
p
n(pby py) = p
py(1 py)
по центральной предельной теореме при больших n, m приближенно стандартное нормальное. Поэтому распределение pbx è pby при больших n, m мож- но считать нормальным с параметрами px; px(1 px)=n è py; py(1 py)=m соответственно. Случайные величины pbx; pby - независимы. Их разность pbx pby при больших n, m тоже имеет почти что нормальное распределение с параметрами px py; px(1 px)=n + py(1 py)=m: Поэтому
pbx pby (px py)
p
px(1 px)=n + py(1 py)=m
при n ! 1; m ! 1 стремится к стандартному нормальному закону.
5

Если верна гипотеза H0 : px = py = p; то распределение статистики
pbx pby
v = p
p(1 p)(1=n + 1=m)
при n ! 1 cтремится к стандартному нормальному распределению. Заменяя в статистике v параметр p его состоятельной оценкой, мы и получаем статистику T (X):
Критические области критериев проверки гипотезы H0 при альтернати- âàõ
H1 : px > py;
H1 : px < py;
H1 : px 6= py
выглядят следующим образом
K= fT (X) u1 g;
K= fT (X) u1 g; K = fjT (X)j u1 =2g:
Âэтих формулах, как и раньше, u - квантили стандартного нормального закона распределения.
6