Скачиваний:
18
Добавлен:
20.05.2014
Размер:
101.31 Кб
Скачать

Лекция 12.

Проверка параметрических гипотез.

Предположим, что выборка X = (X1; :::; Xn) взята из совокупности, распределение которой P (Xj < u) = F (u; ) полностью определяется значением параметра : Относительно числового параметра этого распределения

имеются две гипотезы H0 : 2

2

 

 

2

S

0 è H1 : 2 1; = 0 1: Иногда, для

краткости, мы будем писать

 

H1; åñëè

 

1 èëè 2 H0; åñëè 2 0:

Мы будем рассматривать критерии проверки гипотезы H0 при альтернати-

âå H1; основанные на критическом множестве, то есть критерии вида

 

 

(H0

; X = K:

 

(X) = H1

; X 2 K;

 

 

 

 

2

 

 

Обычно критическая область задается с помощью некоторой статистики T (X) и имеет, как правило, следующий вид: K = fX : T (X) Cg; èëè

K = fX : T (X) Cg èëè K = fX : jT (X)j Cg: Статистику T (X) называют в этом случае статистикой критерия. Запись P (X 2 K) означает, что вероятность вычисляется относительно распределения, задаваемого F (u; ):

Определение. Функцией мощности критерия (X) мы будем называть

W ( ) = P (X 2 K); 2 :

Определение. Если W ( ) ; 2 0; то критерий называется критерием уровня проверки гипотезы H0 : 2 0:

Åñëè 0 = 0; то гипотеза H0 - простая и W ( 0) = P 0 (X 2 K) = (ошибка первого рода для критерия (X)).

Åñëè 1 = 1; то гипотеза H1 - простая и W ( 1) = P 1 (X 2 K) = W = 1 ( - ошибка второго рода критерия (X):)

Определение. Если для критерия проверки гипотезы H0 : 2 0 при альтернативе H1 : 2 1

w ( ) ; 2 0; w ( ) ; 2 1;

то критерий называется несмещенным критерием уровня :

Проверка гипотез о числовых значениях параметров нормальных распределений.

Проверка гипотез о среднем значении нормальной совокупности. Пусть X = (X1; :::; Xn) выборка из совокупности, имеющей нормальное распределение: Xj N(a; 2): Относительно параметра имеются две гипотезы

H0 : a = a0;

H1 : a > a1:

1

a) Рассмотрим сначала случай, когда - известно. Если верна гипотеза H0; то распределение статистики

p

T (X) =

n(X a0)

имеет стандартное нормальное распределение. Возьмем теперь в качестве критической области K = fX : T (X) u1 g: Рассмотрим критерий

(

(X) = H0; T (X) u1 H1; T (X) < u1 :

Преобразуем немного неравенства для критической области

 

 

 

 

 

 

 

 

p

 

(

 

a0)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X : T (X)

 

 

 

=

 

X :

n

X

 

 

=

 

 

 

X :

 

 

 

 

+ u

 

 

 

 

 

u

 

 

 

u

 

 

X

 

a

 

:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f

 

 

 

1 g

 

f

 

 

 

 

 

 

1 g

 

 

 

f

 

 

 

 

0

 

1 png

 

Тогда

 

 

 

(X) = (H0; X < a0

+ u1 p

 

 

:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

H1; X a0 + u1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

Этот критерий совпадает с наиболее мощным критерием уровня ; постро-

енным с помощью леммы Неймана - Пирсона для проверки простой гипотезы H0 против простой альтернативы a = a1; a1 > a0: Так как этот критерий не зависит от a1; то этот критерий является наиболее мощным критерием уровня при любом значении a > a0:

Мы вычисляли мощность этого критерия при каждом a > a0 è ýòà ìîù-

ность равна

 

 

 

 

 

 

w(a) = 1 u1 +

 

 

 

 

 

:

 

pn(a0

a)

 

 

Определение. Критерий уровня ; мощность которого максимальна при каждом значении параметра a 2 H1; называется равномерно наиболее мощным критерием уровня :

Из перечисленных свойств описанного выше критерия (X) следует, что этот критерий является равномерно наиболее мощным критерием уровня :

Замечание Критерий

(

H ; X a + u(X) = 1 0 pn

H ; X > a + u :

0 0 pn

- равномерно наиболее мощный критерий уровня для проверки гипотезы

H0 : a = a0

при альтернативе

H1 : a < a0:

2

Пример. В бутылке должно находится 200 мл минеральной воды. Из партии было проверено 100 бутылок и обнаружено, что в среднем в бутылке 199 мл. Предполагая, что стандартное отклонение для объема минеральной воды в одной бутылке равно 5 мл, определить, является ли выявленное отклонение значимым, при альтернативе о среднем недоливе бутылок минеральной воды.

Естественно предположить, что количество минеральной воды распределено нормально с параметрами a; :

Гипотеза H0 : a = 200

 

 

 

 

 

 

 

 

 

 

 

Гипотеза H1 : a < 200:

 

 

 

 

 

 

 

 

 

 

 

 

p

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Величина

 

n

(X 200)

=

2:

При нулевой гипотезе эта статистика имеет

 

 

5

 

 

p

 

 

 

 

 

 

 

стандартное нормальное распределение и

P (

 

n

(X 200)

< 2) = 0:023:

Ýòî

 

 

значение называется p value:

 

5

 

 

 

 

 

 

 

 

 

 

 

Таким образом, при 5% уровне значимости критерия (т.е. если мы хотим

сделать вывод о недоливе надежный на 95%) гипотеза

H0 должна быть

отклонена. При 1% уровне значимости нет оснований отклонять гипотезу

H0:

Пусть теперь нужно проверить гипотезу H0 : a = a0; а альтернатива H1 : a 6= a0: Рассмотрим критерий

(H0;

 

p

 

 

 

 

 

< u1 =2:

 

pn(X a0) j

(X) = H1; j

 

 

n(X a0)

u1 =2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j

 

 

 

 

 

j

 

 

 

 

 

 

 

По построению этот критерий - критерий уровня : Подсчитаем теперь мощность этого критерия при любом a 6= a0:

w(a) = Pa j

 

 

 

(

 

 

 

 

)

j u1 =2 = Pa

 

 

 

 

 

 

 

)

u1 =2 +

 

n

 

 

0

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

p

 

X

a

 

 

 

 

 

 

 

 

pn(X

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

+Pa

 

 

 

 

 

 

 

 

 

 

 

 

 

 

u =2 = Pa X a0

+ pnu1 =2 +Pa X a0

+ pnu =2

 

 

 

 

 

 

 

 

0

 

 

 

pn(X

a

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= Pa

p

 

 

 

 

 

 

 

a)

 

 

 

(a

 

 

p

 

+ u1 =2 +Pa

 

 

 

 

 

 

p

 

 

 

 

 

p

 

 

 

 

 

 

X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n(

 

 

 

 

 

0

a) n

(X a) n

 

(a0 a) n

+ u =2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p p

= 1 (a0 a) n + u1 =2 + (a0 a) n + u =2 :

Åñëè a < a0; òî w(a) ! 1 ïðè n ! 1: Åñëè a > a0; то также w(a) ! 1 при n ! 1:

Для этого критерия при любом распределении из класса распределений, содержащихся в H1; вероятность отвергнуть нулевую гипотезу стремится к 1, если объем выборки неограниченно растет.

Определение. Если мощность критерия при всех значениях числового параметра, принадлежащих конкурирующей гипотезе H1 стремится к еди- нице при n стремящемся к бесконечности, то такой критерий называется состоятельным критерием.

=

=

3

Пример.Процесс упаковки сахара считается нормальным, если в упаковку помещается 1000 г сахара со стандартным отклонением 12г. Для контроля качества упаковки каждый час проверяется 16 коробок сахара. В результате очередной проверки было обнаружено, что средний вес коробки равен 1003г. Является ли это достаточным основанием для остановки процесса и устранения неисправности? Уровень значимости полагается равным 0.05.

Гипотеза H0 : a = 1000

Гипотеза H1 : a 6= 1000

p

n(X 1000)

Значение статистики 12 равно 1. Верхнее и нижнее значения p- value равны соответственно 0.159 и 0.841. Поэтому оснований для остановки

процесса нет.

Замечание. Если даже случайная величина имеет стандартное нормальное распределение, то при повторяющихся много раз наблюдениях с большой вероятностью могут встретиться недопустимо большие значения этой случайной величины.

б) Теперь посмотрим, что изменится, если рассматривается выборка из нормальной совокупности с неизвестной дисперсией и нужно проверить гипотезу

H0 : a = a0

при альтернативе

H1 : a > a0:

Известно, что если верна гипотеза H0; то статистика p

T (X) =

n 1(X a0)

S

имеет распределение Стьюдента с n-1 степенью свободы. Рассмотрим кри-

терий

p

 

 

 

 

 

(H0; p

n

(X a0)

< t(n 1; 1 ):

(X) = H1;

n(X a0)

t(n 1; 1 )

 

 

 

S

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S

Также, как и раньше можно убедиться в том, что это критерий уровня значимости : При любом a > a0 мощность этого критерия w(a) ! 1 при n ! 1:

Пусть теперь проверяется гипотеза

 

 

H0 : a = a0

 

при альтернативе

 

H1 : a < a0:

 

 

 

 

Тогда критерий

 

 

 

 

 

 

 

 

p

 

 

 

 

> t(n 1; 1 )

(H0; pn(X a0)

(X) = H1;

 

n(X a0)

t(n 1; 1 )

 

 

 

S

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S

 

4

является критерием уровня и мощность этого критерия при любом a < a0 стремиться к единице.

Если проверяется также гипотеза H0 при альтернативе H1 : a 6= a0; òî

критерий

p

 

 

 

 

 

 

 

 

 

 

 

 

< t(n 1; 1 =2):

(H0; jpn(X a0) j

(X) = H1;

n(X a0)

t(n 1; 1 =2)

 

 

 

S

 

 

 

 

 

 

 

j

 

 

 

 

j

 

 

 

 

S

является состоятельным критерием уровня :

Пример.Страховая компания нанимает агентов с оплатой через комиссионные сборы. Компания утверждает, что в первый год работы будут зарабатывать среднюю комиссию по крайней мере 40000$ в год. Случайная выборка 9 агентов показала, следующие результаты величины комиссий

99

XX

Xj = 333;

(Xj

X

)2 = 312:

j=1

j=1

Распределение совокупности можно считать нормальным. Проверить на 5% уровне значимости гипотезу о том, что среднее совокупности не меньше 40т.

T (X) =

p

 

(

 

40)

=

 

 

 

 

 

 

n

X

 

0:48;

 

= 37; S

 

= 18:73

X

0

 

 

 

 

 

 

 

 

S0

 

 

 

 

Гипотеза H1 : a < 40; поэтому критическая область T (X) t(8; 0:05) =1:85; p value = :322038: Данные не противоречат утверждению страховой

компании.

Проверка гипотез о числовом значении дисперсии нормальной совокупности. Предположим, что выборка X = (X1; :::; Xn) взята из нормальной совокупности N(a; 2): Предположим также, что мы хотим прове-

рить нулевую гипотезу H0 : 2 = 02 против одной из трех альтернатив

H1 : 2 > 02;

H1 : 2 < 02;

H1 : 2 6= 02:

При этом критериями уровня являются следующие критерии:

 

(H0

 

nS2

2

 

 

 

 

 

(X) =

; nS22

< 2

(n 1; 1

)

 

H1

;

02

(n

 

1; 1

)

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

(H0

 

nS2

2

 

 

 

 

 

(X) =

; nS22

> 2

(n 1; 1

)

 

H1

;

02

(n

 

1; 1

)

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

(H1; nS22 2(n 1; 1 =2) èëè nS22 < 2(n 1; =2)

(X) = 02 0

H0; nS2 < 2(n 1; 1 )

0

5

Все эти критерии имеют уровень значимости и состоятельны каждый

при своей альтернативе.

Пример. Фирма предлагает новую установку по упаковке кофе. Фирма заявляет, что новая установка более точная, чем старая. Старая установка имеет точность = 5 гр: На 5% уровне значимости проверить утверждение

фирмы.

Для проверки утверждения фирмы был приглашен независимый эксперт. Шесть независимых проб дали следующие результаты

 

âåñ

102

103

97

99

100

 

97

 

 

 

 

H1

 

 

 

 

 

 

 

 

=52

 

5) против альтернативы

: > 5: Статистика критерия T (X) = nS2

 

Мы будем проверять гипотезу H0

: = 5 (

 

равна 1.253 и это значение

больше 2(5; 0:05) = 1:145: Поэтому нет оснований на 5% уровне значимости доверять утверждению фирмы.

6

Соседние файлы в папке Лекции Мат.стат. (2007-2008)