Скачиваний:
17
Добавлен:
20.05.2014
Размер:
113.02 Кб
Скачать

Лекция 13.

Проверка параметрических гипотез.(Продолжение)

Проверка гипотезы о разности средних двух нормальных совокупностей.

Пусть имеются две выборки X = (X1; :::; Xn); Y = (Y1; :::; Ym): Ïðè ýòîì

выборка X взята из совокупности с распределением N(ax; x2); а выборка Y из совокупности с распределением N(ay; y2): Есть гипотеза H0 : ax = ay:

I. Рассмотрим сначала случай, когда дисперсии совокупностей известныx 6= y: Как было показано ранее (при построении доверительных интервалов) распределение статистики

 

 

 

 

 

 

 

 

 

G(X; Y; a a ) =

X Y (ax ay)

x y

 

 

 

2

 

2

 

 

q

x

+

y

 

 

 

n

m

нормально c параметрами 0, 1. Если верна гипотеза H0 : ax = ay; то стати-

стика

X Y T (X) = q

x2 + y2 n m

имеет стандартное нормальное распределение. Поэтому критерий

(X) =

8

r n

+ m

 

 

 

 

 

H1;

 

X Y

 

 

 

u1

 

 

 

>H0;

 

 

x

 

 

y

 

 

 

 

X Y

2

 

< u1

 

>

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

2

 

 

 

 

<

 

 

x

 

 

y

 

 

 

 

>

r n

+ m

 

 

 

 

 

>

 

 

 

 

 

 

 

 

 

 

 

 

:

 

 

 

 

 

 

 

 

 

 

 

является состоятельным критерием уровня проверки нулевой гипотезы

при альтернативе H1 : ax > ay: Здесь состоятельность означает, что при n ! 1; m ! 1 мощность критерия при любых значениях ax > ay ñòðå- мится к единице.

Аналогично критерий

(X) =

8

 

 

r n

+ m

 

 

 

 

 

 

H1;

 

 

X Y

 

 

 

 

 

u

 

 

 

>H0;

 

 

X Y

2

 

> u

 

 

 

>

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

2

 

 

 

 

 

<

 

 

 

 

x

 

 

 

 

y

 

 

 

 

 

>

 

 

r

n

+

m

 

 

 

 

- состоятельный критерий

 

>

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

H0 при альтернативе

 

 

:

проверки гипотезы

 

ровня

 

 

H1 : ax < ay:

При проверки гипотезы H0 при альтернативе H1 : ax 6= ay двухсторон-

ний критерий

8

 

 

 

 

 

 

 

 

 

 

 

>

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

+ m

 

 

 

(X) =

>

H1;

r

X Y

 

 

 

u1 =2

 

>

 

 

 

x

 

 

y

 

 

 

 

>

 

 

 

 

 

 

 

 

 

 

 

>

 

 

 

2

 

 

2

 

 

 

 

>

 

 

 

 

 

 

 

 

 

 

 

<

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

>

H0;

 

 

 

 

 

 

 

 

 

 

 

 

x

+

y

 

 

 

>

 

r

 

 

 

 

 

 

 

 

 

>

 

 

 

 

 

 

 

 

 

 

 

 

>

 

 

 

 

 

 

 

 

 

 

 

 

>

 

 

 

2

 

 

2

 

 

 

 

>

 

 

 

 

 

 

 

 

 

 

 

:

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

m

 

 

1

является состоятельным критерием уровня :

II. Пусть теперь x = y и дисперсии совокупностей неизвестны. Тогда, как было показано ранее, статистика

x

y

 

 

 

 

 

 

+ mS2

r

 

m + n

 

 

 

 

 

 

nS2

 

 

 

G(X; Y; a

a

) =

 

X Y (ax ay)

 

mn(m + n

2)

 

 

 

q

 

x

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

имеет распределение Стьюдента с n + m 2 степенями свободы. Если верна гипотеза H0 : ax = ay статистика

r

 

m + n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

nS2

+ mS2

T (X) =

mn(m + n

2)

 

 

q

X Y

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

y

 

 

 

 

 

 

 

 

 

распределена по закону Стьюдента с n + m 2 степенями свободы. Крити- ческие области для проверки H0 строятся следующим образом

H1 : ax > ay тогда K = fT (X) t(n + m 2; 1 )g;

H1 : ax < ay тогда K = fT (X) t(n + m 2; 1 )g;

H1 : ax 6= ay тогда K = fjT (X)j t(n + m 2; 1 =2)g:

Проверка гипотез о равенстве дисперсий двух нормальных совокупностей.

Пусть имеются две выборки X = (X1; :::; Xn); Y = (Y1; :::; Ym): Ïðè ýòîì

выборка X взята из совокупности с распределением N(ax; x2); а выборка Y из совокупности с распределением N(ay; y2): Есть гипотеза H0 : x = y:

Известно, что

 

x2 y2

 

 

 

x

 

 

G(X; Y;

 

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

2 2

 

 

 

 

by

x

 

1:

имеет распределение Фишера с параметрами

 

 

m

 

 

 

b

n 1; x2

 

Если верна H0 : x = y; то статистика T (X) =

 

 

имеет распределение

b y2

 

 

 

 

 

 

b

 

 

Фишера с теми же параметрами. Если нужно проверить гипотезу H0 ïðè альтернативе H1 : x > y; то критерием уровня будет критерий

(H0

; T (X) < F (n

 

1; m

 

1; 1

 

):

(X) = H1

; T (X) F (n

1; m

1; 1

)

 

 

 

 

 

 

 

 

Критические области для проверки гипотезы H0 при разных альтернатив- ных гипотезах строятся следующим образом

H1 : x < y; тогда K = fT (X) F (n 1; m 1; 1 )g;

H1 : x 6= y; тогда K = fT (X) F (n 1; m 1; 1 =2) или T (X) F (n 1; m 1; =2)g:

2

распределение статистики

Проверка гипотез о средних значениях (математических ожиданиях) совокупностей.

Пусть выборка X = (X1; :::; Xn) взята из совокупности, про которую из-

вестно лишь, что у нее существует математическое ожидание a = EXj è дисперсия 2 = DXj: Согласно центральной предельной теореме последо-

вательность

n

X

 

 

na

 

 

 

 

Pj=1 p

j

 

 

 

 

 

n

 

при n ! 1 слабо сходится (по распределению) к стандатному нормальному закону. Кроме того, S2 сходится по вероятности к 2: Поэтому распределе-

íèå

n

X

 

 

na

 

 

 

 

Pj=1 pj

 

 

 

 

S

n

 

 

также при больших n стремится к стандартному нормальному закону.

Пусть относительно параметра a имеется гипотеза H0 : a = a0: Если верна нулевая гипотеза, то распределение статистики

p

T (X) =

n(X a0)

S

слабо сходится при n ! 1 к стандартному нормальному распределению.

Поэтому, если проверяется нулевая гипотеза при одной из альтернатив, то критические области выглядят следующим образом:

H1 : a > a0; K =

 

 

 

 

 

 

(

 

 

 

 

 

 

 

)

u1

 

 

n

 

S

 

0

 

 

 

p

X

 

 

a

 

 

 

 

H1 : a < a0; K =

 

 

 

 

 

(

 

 

 

 

 

)

u

 

 

 

 

n

 

S

 

0

 

 

 

 

p

 

 

X

 

a

 

 

 

: a 6= a0; K =

p

 

(

 

 

 

 

 

u1 =2

H1

n

 

S

0

 

 

 

 

 

 

X

 

 

a )

 

 

 

 

Критерии, использующие эти критические

области,

являются состоятель-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ными критериями с асимптотическим уровнем :

Проверка гипотез о значении долей.

Пусть все элементы выборки Xj принимают лишь значения 0 и 1, при этом P (Xj = 1) = p; P (Xj = 0) = 1 p; òî EXj = p; DXj = 2: Тогда при

гипотезе H0 : p = p0

p

T (X) = pn(pb p0) ; p0(1 p0)

3

Поэтому, как и в предыдущем пункте, критические области

 

P

n

 

j=1 Xj=n):

слабо сходится к стандартному нормальному распределению (p =

 

дующим образом:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

b

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

строятся сле-

H1 : p > p0; K = (

 

 

 

 

 

 

 

 

 

;

 

 

 

 

 

p0(1 p00) u1 )

 

 

 

 

 

 

pn(p p )

 

 

 

 

 

 

 

p

 

 

 

b

 

 

 

 

 

 

H1 : p < p0; K =

(

 

 

 

 

 

 

(1 p00) u );

 

 

 

 

 

 

 

 

 

p0

 

 

 

 

 

 

 

 

 

pn(p p )

 

 

 

 

 

 

 

 

p

 

 

 

b

 

 

 

 

 

 

 

H1 : p 6= p0; K = (

 

 

 

 

 

(1 p00) u1 =2)

;

 

 

 

 

 

p0

 

 

 

 

pn(p

p )

 

 

 

 

 

 

 

 

 

 

 

 

 

b

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Задача Предположим, что при стандартном лечении онкологического заболевания 30% пациентов живут 5 лет. Новый тип лечения предлагается 100 пациентам, 38 из которых остаются жить после 5 лет. На 5% уровне проверить гипотезу о том, что новый тип лечения более эффективен.

Решение. Гипотеза H0 : p = 0:3; гипотеза H1 : p > 0:3; ãäå p - äîëÿ

Статистика

 

 

 

 

pb= 0:38:

пациентов, получивших новое лечение и проживших более 5 лет,

 

 

b

0:100

 

 

T (X) =

p

0:3

= 1:746 > u0:95

= 1:645:

 

 

q

 

 

 

 

 

 

3 0:7

 

 

 

Поэтому гипотеза H0 отвергается и принимается гипотеза о том, что новый тип лечения более эффективен.

Проверка гипотез о разности средних двух независимых выборок.

Предположим имеются две независимые выборки X = (X1; :::; Xn) è

Y = (Y1; :::; Ym): Мы будем предполагать, что EXj = ax; EYj = ay; DXj =

x2; DYj = y2:

Можно показать, что распределение статистики

X Y (ax ay)

p

Sx2=n + Sy2=m

при n ! 1; m ! 1 стремиться к стандартному нормальному распределе-

íèþ.

Если верна гипотеза H0 : ax ay = b; то статистика

X Y b

T (X; Y ) = p

Sx2=n + Sy2=m

4

при больших n; m имеет распределение, близкое к стандартному нормаль-

ному распределению. Поэтому критерий уровня проверки гипотезы H0 : ax ay = b при альтернативе H1 : ax ay > b задается c помощью крити- ческой области K = fT (X; Y ) u1 g:

Критическая область критерия уровня для проверки гипотезы H0 ïðî- тив альтернативы H1 : ax ay < b равна K = fT (X; Y ) u g:

В случае двусторонней альтернативы критическая область критерия уровня равна K = fjT (X; Y )j u1 =2g:

Проверка гипотез о равенстве долей двух совокупностей.

Пусть каждый элемент выборки X = (X1; :::; Xn) принимает лишь два значения 0 и 1 и при этом P (Xj = 1) = px: Пусть кажлый элемент выборки Y = (Y1; :::; Ym) также принимает значения 0 или 1 и P (Yl = 1) = py: Проверяется гипотеза H0 : px = py: Статистикой критерия при этом является

pbx pby

T (X) = q :

p(1 p)( 1 + 1 ) b b n m

В этих формулах pbx; pby - доля единиц в выборках X и Y соответственно, а pb - доля единиц в объединении этих двух выборок

pb= npbx + mpby : n + m

Распределение статистики T (X) при n ! 1 стремится к стандартно-

му нормальному распределению. Можно пояснить это следующим образом. Очевидно, что распределение статистик

vx =

 

n

 

 

 

 

 

P px(1 px)n

 

 

j=1 Xj npx

vy =

p

m

 

 

 

 

Plpy(1

 

py)n

 

 

 

 

=1 Yl

 

npy

 

 

p

 

 

 

 

 

p

n(pbx px) = p ;

px(1 px)

p

n(pby py) = p

py(1 py)

по центральной предельной теореме при больших n, m приближенно стандартное нормальное. Поэтому распределение pbx è pby при больших n, m мож- но считать нормальным с параметрами px; px(1 px)=n è py; py(1 py)=m соответственно. Случайные величины pbx; pby - независимы. Их разность pbx pby при больших n, m тоже имеет почти что нормальное распределение с параметрами px py; px(1 px)=n + py(1 py)=m: Поэтому

pbx pby (px py)

p

px(1 px)=n + py(1 py)=m

при n ! 1; m ! 1 стремится к стандартному нормальному закону.

5

Если верна гипотеза H0 : px = py = p; то распределение статистики

pbx pby

v = p

p(1 p)(1=n + 1=m)

при n ! 1 cтремится к стандартному нормальному распределению. Заменяя в статистике v параметр p его состоятельной оценкой, мы и получаем статистику T (X):

Критические области критериев проверки гипотезы H0 при альтернати- âàõ

H1 : px > py;

H1 : px < py;

H1 : px 6= py

выглядят следующим образом

K= fT (X) u1 g;

K= fT (X) u1 g; K = fjT (X)j u1 =2g:

Âэтих формулах, как и раньше, u - квантили стандартного нормального закона распределения.

6

Соседние файлы в папке Лекции Мат.стат. (2007-2008)