Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

8256

.pdf
Скачиваний:
0
Добавлен:
24.11.2023
Размер:
1.48 Mб
Скачать

Учитывая сказанное, при построении критерия проверки статистической гипотезы необходимо сначала задаться допустимым уровнем риска на совершение ошибки I рода, как наиболее значимой, а затем минимизировать ошибки II рода.

3. Построение критерия проверки гипотезы

Пусть необходимо проверить простую гипотезу Н0 = {X f X (x, θ)} , состоящую в предположении о виде функции плотности распределения случайной величины Х с вполне определенными параметрами q . Построим критерий, однозначно принимающий или отвергающий проверяемую гипотезу по

полученной в

наблюдении за случайной величиной

Х выборке

хВ = {x1 , x2 ,...xn }

объема n. Помимо основной гипотезы Н0

(“ нулевой”) рас-

смотрим еще одну или несколько альтернативных гипотез

Н1 , H 2 , H 3 ,..., H m

каждая из которых противоречит основной. Альтернативные гипотезы необходимы при построении критерия проверки основной гипотезы для ее сравнения с имеющимися альтернативами (все познается в сравнении с чем-то).

Критерий проверки гипотезы состоит из двух составляющих:

Во-первых, в качестве критерия принимается некоторая случайная величина К , с известным распределением при условии справедливости основной

f K (k / H 0 )

и хотя

бы частично

известным для

альтернативных гипотез

f K (k / H j )

j=1, ..m.

Кроме того значения критерия

должны быть вычисляемы

по наблюдаемой выборке хВ , т.е.

knab = k (xi ) .

 

Во-вторых, строится решающее правило для критерия проверки, согласно которому гипотеза будет приниматься или отвергаться. Для этого, назовем

критической областью критерия

те значения величины К , при которых гипо-

теза отвергается. Критическую

область будем обозначать Кkr . Тогда решаю-

щее правило критерия проверки будет следующим:

knab Кkr

Н0

отвергается

(по наблюдаемой выборке),

knab Кkr

Н0

принимается

(нет оснований отвергать гипотезу).

Точки значения критерия К , где критическая область критерия проверки Кkr отделяется от области принятия гипотезы, называются критическими точками критерия kkr . Как построить критическую область критерия или, что равно-

сильно, как найти критические точки критерия? Ниже рассмотрим ответ на этот вопрос.

Зададимся вероятностью α ошибки I-го рода, как наиболее значимой. Исключить такую ошибку при проверке гипотезы невозможно ( a ¹ 0 ), но в вероятностных задачах это не является трагедией. На практике обычно эту ве-

80

роятность задают достаточно малой величиной α = 0,05 ; α = 0,025 ; α = 0,005 и называют уровнем значимости критерия.

Если из условия

P(k K kr ) = f K (k / H 0 )dx = α

Kkr

можно определить критические точки kkr однозначно, то задача построения

критической области критерия решена. В противном случае, когда еще остается свобода выбора критических точек, рассмотрим влияние альтернативных гипотез. Поскольку величина:

f K(k / H j )dx = 1 − β j есть вероятность правильного отбрасывания H 0 при ус-

Kkr

ловии справедливости H j , то ее называют мощностью критерия по отноше-

нию к альтернативной гипотезе H j . Поэтому при заданном уровне значимости

α , критическую область критерия нужно строить так, чтобы мощность критерия была максимальной, а именно:

(1− β j ) max , для наиболее мощного критерия (НМК) относительно гипотезы H j , максимизация проводится по параметрам сложной гипотезы;

min (1− β j ) max , для равномерно наиболее мощного критерия (РНМК), в случае наличия нескольких сложных гипотез.

Величина β j - есть вероятность принять неверную гипотезу H 0 при условии справедливости альтернативной гипотезы H j .

Рис. 13.1. Двухсторонняя критическая область критерия

Кkr = {k > k2 , k < k1} при наличии двух альтернативных гипотез H1 , Н2 . 81

На рис. 13.1 приведена графическая интерпретация алгоритма построения критической области одномерного критерия. Видим, что структура критической области, зависит от наличия альтернативных гипотез и их “ расположения” относительно основной.

Лекция № 14

Примеры построения критериев проверки гипотез

 

1. Проверка гипотез о значении параметров распределения

 

 

 

Пусть случайная величина

 

Х распределена нормально по закону

N (a, σ)

с

неизвестными

 

 

параметрами

a, σ

и

наблюдается в

выборке

хВ

= {xi , n} = {x1 , x2 ,...xn }

 

объема

n. Нормальный закон распределения

N (a, σ) задается

следующей функцией плотности распределения вероятно-

сти: f X (x, a, σ) =

 

1

 

 

exp(−

(х а)2

) ,

M [ X ] = a ,

D[ X ] = σ2 .

 

 

 

 

 

 

 

 

 

 

 

σ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

По данным выборки могут быть получены выборочное среднее

 

В и вы-

 

х

борочный стандарт S :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

n

 

 

 

 

 

 

 

 

 

 

В

=

x j ,

 

 

S =

 

( X ср x j )2 .

 

 

 

 

 

 

х

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n j =1

 

 

 

 

 

 

n − 1 j =1

 

 

 

 

 

 

 

 

Эти величины являются случайными и по ним могут быть построены

оценки математического ожидания

а = М[x] и дисперсии σ = D[x]

 

наблю-

даемой в выборке случайной величины Х.

 

 

 

 

 

 

Ниже проверим ряд простых статистических гипотез об истинных значе-

ниях параметров нормальной случайной величины Х .

 

 

 

1.1.

 

H 0 = {a = a0 } .

Проверим сначала гипотезу о равенстве значения

истинного (гипотетического) математического ожидания а некоторой величине a0 . Основная гипотеза тем самым будет следующей H 0 = {a = a0 } . В ка-

честве критерия K возьмем случайную величину имеющую, при справедливости основной гипотезы, распределение Стьюдента с n-1 степенями свободы:

K = xB a0 = tn−1 S / n

Задаваясь уровнем значимости α для проверяемой гипотезы H 0 , будем строить критическую область K kr в зависимости от вида единственной конкурирующей (альтернативной) гипотезы H1 в следующих случаях:

82

Случай А: H1 = {a > a0 } . В этом случае, при справедливости конкури-

рующей гипотезы ожидаем сдвиг вероятных значений критерия K в большую сторону (рис.14.1), поэтому критическая область критерия будет правосторон-

ней K kr = {k > kkr }. Критическая точка kkr

однозначно определяется из усло-

вия равенства вероятности ошибки I-рода

заданному уровню значимости

P(k > kkr ) = a . Решение этого уравнения

kkr = tkr (a; n -1) представляет со-

бой правостороннюю квантиль распределения случайной величины Стьюдента и приводится таблицей в приложении 3.

Рис. 14.1 Критические области гипотезы H 0 = {a = a0 } .

Случай Б: H1 = {a < a0 }. В этом случае, критическая область критерия будет левосторонней K kr = {k < kkr } , а значения критерия отрицательными (рис.14.1). Критическая точка kkr определяется из уравнения P(k < kkr ) = a ,

решение которого, в силу симметрии распределения Стьюдента,

будет сле-

дующим kkr = -tkr (a; n -1) .

 

 

 

 

Случай В: H1 = {a ¹ a0 } . В этом случае критическая область критерия

будет двухсторонней

K kr

= {k < kkr1 ; k > kkr 2 } . Однако,

здесь критические

точки

kkr1 , kkr 2

не

определяются

однозначно

из

уравнения

P(k < kkr1 ) + P(k > kkr 2 ) = a . Доказано [9], что при условии P(k < kkr1 ) = a / 2 и P(k > kkr 2 ) = a / 2 мощность критерия (1 − β) по отношению к конкурирую-

83

щей гипотезе Н1 будет максимальной. Тогда из этих уравнений критические точки находятся однозначно и представляют собой двухстороннюю квантиль распределения случайной величины Стьюдента:

kkr1 = −tkr (α / 2; n −1) , kkr 2 = tkr (α / 2; n −1) .

Рассмотрим числовой пример: Пусть по выборке объема n=16 получена оценка математического ожидания наблюдаемой нормальной случайной вели-

чины хВ =10,2 и оценка среднеквадратического отклонения S = 6,5 . Поскольку, каждая оценка есть величина случайная (получена по конкретной случайной выборке), то проверим гипотезу о том, что истинное математиче-

ское ожидание наблюдаемой величины равна 15 т.е.

H 0 = {a =15}. Зада-

димся уровнем значимости гипотезы

 

α = 0,05 и альтернативной гипотезой

H1

= {a ¹ 15}.

Наблюдаемое

в

выборке

значение

критерия

k nab

= (10,2 -15)× 4 / 6,5 = -2,954 . Критическая область

K kr

двухсторонняя, а

критические точки будут:

 

 

 

 

 

kkr1 = −tkr (0,025;15) = −2,13 ; kkr 2 = +tkr (0,025;15) = +2,13 .

 

 

 

Видим, что knab

принадлежит критической области и значит,

гипотеза отвер-

гается, т.е. отличие наблюдаемого значения математического ожидания от гипотетического значительны.

1.2. H 0 = {σ2 = σ02 } Проверим теперь гипотезу о том, что истинная (гипотетическая) дисперсия случайной величины равна s02 . Проверяемая гипотеза H0 = {σ2 = σ02} В качестве критерия возьмем одномерную случайную величину K , имеющую распределение «хи-квадрат» с n-1 степенями свободы:

K =

 

S 2

(n − 1) = χ n2−1 .

 

σ 2

 

0

 

Здесь S 2

оценка s02 , полученная по выборке хВ = {xi , i =1, n}.

Задаваясь уровнем значимости α для проверяемой гипотезы H 0 , будем стро-

ить критическую область K kr в зависимости от вида единственной конкурирующей (альтернативной) гипотезы H1 в следующих случаях (рис.14.2):

Случай А: H1 = {σ2 > σ02 } . В этом случае, при справедливости конкури-

рующей гипотезы ожидаем сдвиг наиболее вероятных значений критерия K в большую сторону, поэтому критическая область будет правосторонней.

84

Рис. 14.2 Критические области гипотезы H 0 = {σ2 = σ02 }.

Критическая точка kkr здесь однозначно определяется согласно общему под-

ходу к построению критических областей критерия из условия равенства вероятности ошибки I-рода заданному уровню значимости α :

P(k > kkr ) = χ2 (k; n − 1)dk = α .

kkr

Решение этого уравнения kkr = χ2kr (α; n −1) находятся однозначно, и

представляет собой правостороннюю квантиль «хи-квадрат» распределения случайной величины и приводится в приложении 4.

Случай Б: H1 = {σ2 < σ02 } . В этом случае критическая область критерия

будет левосторонней, а критическая точка однозначно определяется из уравнения :

P(k < kkr ) =

kkr

χ 2 (k; n − 1)dk = α

 

0

Левосторонняя критическая точка может быть легко выражена через функцию для правосторонней критической точки. Действительно, т.к.

P(k < k kr ) + P(k > k kr ) = 1 , то P(k > kkr ) = 1− α и тогда решение для левосторонней точки будет следующим kkr = χ2kr (1 − α; n −1) .

85

Случай В:

H1 ={s2 ¹ s02}. В этом случае, объединяющем два предыду-

щих случая,

критическая

область критерия будет

двухсторон-

ней Kkr = {k < kkr1; k > kkr 2 } . Однако, здесь критические точки

kkr1 , kkr 2 не

определяется однозначно из уравнения

 

 

 

 

kkr 2

 

 

P(k < kkr1 ) + P(k > kkr 2 ) = 1 − χ 2 (k, n − 1)dk = α .

 

 

 

 

kkr 1

 

 

Доказано [9], что при условиях

P(k < kkr1 ) = α / 2, P(k > kkr 2 ) = α / 2

мощ-

ность критерия

(1 − β) по отношению к конкурирующей гипотезе H 1

будет

максимальной, тогда из этих двух условий критические точки находятся однозначно:

kkr1 = χ2kr (1 − α / 2; n −1) ; kkr 2 = χ2kr (α / 2; n −1) .

Рассмотрим числовой пример: Пусть по выборке объема n=15 получена оценка дисперсии наблюдаемой нормальной случайной величины S 2 = 40,25 или оценка среднеквадратического отклоненияS = 6,5 . Поскольку, каждая оценка есть величина случайная (получена по конкретной случайной выборке), то проверим гипотезу о том, что истинная дисперсия наблюдаемой величины

равна 36, т.е.

H 0 = {σ2 = 36} . Зададимся уровнем значимости гипотезы

H0

α = 0,05 и альтернативной гипотезой H1 = {s2

¹ 36} .

 

Наблюдаемое значение критерия

knab

= (15 −1)40,25 / 36 = 15,653 . Крити-

ческая область

K kr = {k < k1kr ; k > k 2 kr }

двухсторонняя, а критические точки

будут:

 

 

 

 

kkr1 = χkr2 (1 − 0,025;14) = 5,63; kkr 2 = χkr2 (0,025;14) = 26,1.

 

Видим, что knab

= 15,653 не принадлежит критической области и значит,

ги-

потеза принимается, т.е. отличия наблюдаемого значения дисперсии от гипотетического незначительны. Если бы, такая оценка дисперсии была получена по выборке меньшего объема n=7, то

kkr1 = χ2kr (1 − 0,025;6) = 14,4; kkr 2 = χ2kr (0,025;6) = 1,24.

тогда наблюдаемое значение критерия k nab = 15,653 попадает в критическую область и тогда проверяемая гипотеза отвергается.

Отметим, что при проверке гипотез H 0 = {a = хВ } и H 0 = {s2 = S 2 } при уровне значимости α будут построены двухсторонние критические области такими, что область принятия гипотез Kkr совпадет с доверительными интервалами, построенными с надежностью γ = 1− α .

86

2. Критерий согласия Пирсона

Критериями согласия называются критерии проверки статистических гипотез о виде распределения случайной величины. Проверяемая гипотеза имеет вид:

H0 = {X ~ f Х (x, θ1, θ2 ,...θr ) ,

где θ1 , θ2 ,...θr - принятые в гипотезе параметры распределения. Пирсон предложил и обосновал следующий критерий проверки гипотезы H 0 по отношению к единственной альтернативной противоположной гипотезе

H1 = H 0 .

Пусть по полученной выборке хВ = {xi , i = 1, n} = {x1 , x2 ,...xn } построена гистограмма наблюдаемых частот H Xn = {hj , n j ; j = 1, m}. Построим, так же теоретические частоты nTj для интервалов hj при условии справедливости проверяемой гипотезы H 0 . Теоретические частоты вычисляют-

ся через вероятность Pj

нахождения случайной величины X в интервале

hj = (x j , x j +1 )

по формуле:

 

 

 

 

 

Т

 

 

 

 

 

x j +1

 

 

 

 

 

n j

 

» Рj = F (x j +1 ) - F (x j ) = f Х (x, qs )dx » hf (x j +0.5 , qs ) ,

 

 

 

n

 

 

 

 

 

 

 

 

 

x j

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где F (x j )

- функция распределения для случайной величины X ,

h

шаг

интервалов гистограммы, x j +0.5 = 0,5×(x j + x j +1 )

центры интервалов hj

гис-

тограммы.

Таким

образом,

получим

теоретические

частоты

nTj

» n × Pj .

Показано [9], что величина :

 

 

 

 

m

(n j nTj

) 2

 

 

 

 

 

 

 

 

 

 

 

= χm2 r −1 ,

 

 

 

 

 

 

T

 

 

 

 

 

 

 

 

j =1

 

n j

 

 

 

 

 

 

 

 

при достаточно большом объеме выборки имеет «хи-квадрат» распределение с m r −1 степенями свободы и может быть использована в качестве критерия для проверки гипотезы H 0 . Задаваясь уровнем значимости α

можем однозначно определить правостороннюю критическую область критерия из уравнения

P2 > χ2kr ) = α

Его решение представляет собой правостороннюю квантиль «хи-квадрат» распределения χ 2kr = χ 2kr (α, m r − 1) и приведено в приложении 4.

87

Рис. 14.3. Критическая область критерия Пирсона.

Определив, таким образом, критическую точку χ2kr , сравним ее с наблюдаемым значением χ2nab получим правило проверки гипотезы:

-

если χnab2 < χkr2 , то гипотеза принимается

(отклонения теоретических и наблюдаемых частот незначительны),

-

если же χnab2 > χkr2 , то гипотезу необходимо отвергнуть

(отклонения частот значительны).

Числовой пример: Проверим гипотезу о нормальном распределении полуденных температур месяца мая для выборки, приведенной в лекции

10, при уровне значимости гипотезы α = 0,05 . Вычислив выборочные ха-

рактеристики хВ = 14,6 и S = 7,5 , примем их за оценки параметров нормального распределения. Таким образам проверяемая гипотеза такова:

H0 = {X = N (a, σ); а = хВ ; σ = S}.

Учитывая, что для нормальной случайной величины Х функция

распределения имеет вид F (x) =

1

+ Ф(

х а

) , где Ф(x) - функция Лапласа

 

 

2

 

σ

(приложение 2), то для теоретических частот получим формулу:

 

x

 

 

-

 

 

 

x

 

-

 

 

 

 

j +1

x

B

j

x

B

Т

 

 

 

 

 

 

 

 

 

 

n j

 

 

 

 

 

 

 

 

 

 

 

» n ×[Ф

 

S

 

 

- Ф

 

S

 

] ,

 

 

 

 

 

 

 

 

 

где

x j , x j +1

соответственно левая и правая границы каждого из интер-

валов h j разбиения данных в гистограмме. Все результаты приведем в таблице 8 и на рис.14.4.

Таблица 8.

88

h j

0-5

5-10

10-15

15-20

20-25

25-30

n j

3

6

8

7

3

4

31

 

 

 

 

 

 

 

 

nТj

2,31

5,26

7,79

7,53

4,74

1,95

29,6

 

 

 

 

 

 

 

 

χnab2

0,205

0,105

0.006

0,037

0,639

2,171

3,162

 

 

 

 

 

 

 

 

Рис. 14.4. Гистограмма наблюдаемых частот и кривая теоретических частот.

По заданному уровню значимости проверяемой гипотезы H 0 определим критическую точку распределения «хи-квадрат» используя приложе-

ние 4. Получим, что

χkr2 = χkr2 (0,05;6 − 2 −1) = 7,8 .

Поскольку χ nab2

= 3,162 < χ kr2 = 7,8 , то гипотеза H 0 принимается (нет

оснований ее отвергнуть), т.к. отклонения частот незначительны.

Примеры заданий для проверки различных статистических гипотез для самостоятельной работы студентов приводятся в [12].

89

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]