Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

3110

.pdf
Скачиваний:
2
Добавлен:
15.11.2022
Размер:
3.01 Mб
Скачать

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

C m0 (Z )

 

C m0

.

P (C Z )

( )

 

1

 

 

 

 

 

 

 

 

0

 

 

 

 

 

0 (Z )

 

 

 

 

 

 

 

 

 

 

0

 

Пусть u таково, что

1

u

. Отсюда получаем соотношение

 

 

 

C

m0

 

u 0 .

 

 

 

Пусть произошло событие Z C , но на самом деле справедлива гипотеза H1 . В этом случае говорят, что произошла ошибка 2-го рода. Тогда ее вероятность, рассчитанная в предположении верности гипотезы H1 , равна

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

C m1 (Z )

 

 

 

 

 

C m1

.

 

P (

Z C)

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

1 (Z )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

Пусть u

0 таково, что

 

 

u

. Отсюда получаем соотношение

 

 

 

 

 

C m1

u

1 .

 

 

 

 

 

 

Вычитая из второго соотношения первое, получаем

 

 

 

 

 

 

 

 

 

 

 

u

0 u 1

 

u 0 (Z ) / n u

1 (Z ) / n m1 m0 .

Откуда

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

u

0 (Z ) u

1 (Z ) (m1

m0 ) n .

Мощностью критерия называется вероятность того, то гипотеза H0

будет отвергнута, если она не верна. Так как β

есть вероятность отвергнуть

H1 , когда она верна, то мощность критерия равна 1-β. Так как вероятности ошибок первого и второго рода желательно уменьшать, а мощность – увеличи-

вать, то u

и

u желательно брать как можно большими.

Наконец, полученное соотношение позволяет, выбрав и найдя u , оп-

ределить u и

, если объем выборки задан. Если объем выборки не задан, то

выбрав

и

и определив соответствующие u ,u , полученное соотношение

позволяет найти объем выборки, при котором качество обсуждаемого критерия будет оптимальным.

Возвращаясь к нашему примеру, имеем

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

u

0 (Z ) u

1 (Z ) (m1

m0 ) n или u 2,8

u 3

(3 2) 200 14,1.

Это соотношение позволяет взять u

u 2, 4

и обеспечить уровень значимо-

сти – вероятность ошибок первого и второго рода,

0,01.

 

 

 

 

 

 

 

 

 

88

6

 

 

 

 

 

 

Осталось найти

выборочное

Z

2,64,

и C

3 2, 4 0, 21 2, 46 . Так

 

 

 

 

 

200

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

как Z

C , то принимается гипотеза H1 , а гипотеза H0

отвергается.

 

 

 

 

 

 

 

 

 

 

71

 

 

 

 

 

Подобные рассуждения лежат в основе проверок всех статистических гипотез. Статистической гипотезой будем называть любое утверждение о виде или свойствах закона распределения случайной величины, наблюдаемой в эксперименте. Гипотеза отклоняется, если вероятность того, что она верна, оказы-

вается ниже некоторого уровня, называемого уровнем значимости

,

мало.

Введем ряд определений, используемых в дальнейшем изложении.

 

Сформулированное утверждение называют основной или нулевой гипоте-

зой и обозначают H0 . Альтернативное утверждение обозначают H1

и называют

альтернативной или конкурирующей гипотезой.

 

 

Приведем примеры нулевых и конкурирующих статистических гипотез. Предположим, что извлечена выборка из нормальной генеральной совокупно-

сти с параметрами a и . Тогда относительно параметров a и

можно выдви-

нуть следующие гипотезы.

 

 

 

 

1. Нулевая гипотеза H0 : математическое ожидание нормального распре-

деления a равно 5, при известном

. Кратко это можно записать так H0 : a

5 (

известно).

 

 

 

 

Конкурирующие гипотезы могут быть следующие: H1 : a 5, или H1 : a

5 ,

или H1 : a 5.

 

 

 

 

2. Нулевая гипотеза H0 :

0 02 ( a неизвестно). Конкурирующие гипоте-

зы могут быть следующие: H1 :

0 02 , или H1 :

0 02 , или H1 :

0 02.

 

Статистические гипотезы могут содержать одно или несколько предположений относительно параметров распределения случайной величины. Если гипотезе или альтернативе соответствует одно единственное распределение, то такая гипотеза (альтернатива) называется простой. Иначе гипотеза (альтернатива) называется сложной.

 

Например, нулевая гипотеза H0 : a 5 ( известно) – простая. А гипотеза

H0 :

0 02 ( a неизвестно) и альтернативная гипотеза H1 : a 5 – сложные.

 

Формулировка статистических гипотез может принимать различный вид

в зависимости от конкретной задачи исследования. Например, пусть требуется установить, будет ли новый способ производства электроламп увеличивать их срок службы по сравнению с существующим способом, при котором средний срок службы a0 4500 ч. Испытания небольшой партии ламп дали x 4800 ч. Можно ли на основании этих данных считать, что новый способ лучше старо-

го? Можно выдвинуть нулевую гипотезу H0 : a

a0 – при новом способе произ-

водства срок службы ламп остался прежним.

Альтернативная гипотеза H1 :

72

 

Kнабл

aa0 – при новом способе производства срок службы увеличился.

Вдальнейшем речь будет идти о проверке гипотез относительно закона распределения случайной величины U , из которой извлечена выборка; о значении параметра известного закона распределения; о равенстве параметров распределений; о независимости выборок и т.п.

13.2. Статистический критерий. Критическая и допустимая области

Задача проверки статистической гипотезы заключается в выработке правила, позволяющего на основе значений выборки принять или отвергнуть основную гипотезу. Для этого используют специально подобранную случайную величину, точное или приближенное распределение которой известно. Такую случайную величину называют статистическим критерием или тестовой статистикой. Эту случайную величину обозначают различными буквами в зависимости от закона ее распределения. Например, U – если она распределена

по нормальному закону,

F

– если она имеет распределение Фишера, T – рас-

пределение Стьюдента,

2

– распределение "хи"- квадрат. В целях общности

будем обозначать ее K

Множество всех значений статистики K разбивается на два непересекающихся подмножества. Одно – подмножество K1 , содержит значения критерия, при которых нулевая гипотеза отвергается, его называют критической областью, и K0 ―множество значений критерия, при которых нулевую гипотезу принимают, его называют допустимой областью. Если значение статистики Kнабл , найденное по конкретной выборке, принадлежит K0 , то принимается основная гипотеза, если K1 , то следует отклонить нулевую гипотезу и при-

нять альтернативную.

Замечание 13.1. Тот факт, что основная гипотеза принята, не является доказательством справедливости нулевой гипотезы, а лишь показывает, что имеющиеся данные ей не противоречат. Поэтому на практике, как правило, стараются проверить, дают ли результаты эксперимента право отклонить нулевую гипотезу, с тем, чтобы принять вместо нее некоторую альтернативную гипотезу, которую исследователь отстаивает. Например, если статистический критерий отклонит нулевую гипотезу H0 : a a0 – при новом способе производства срок службы ламп остался прежним, то повышение срока службы электроламп, изготовленных по новой технологии, можно считать доказанным (с соответствующим малым риском, равным уровню значимости ).

73

Разбиение на критическую и допустимую области производится исходя из условия, что вероятность попадания значения статистики в критическую об-

ласть при условии, что справедлива нулевая гипотеза, равна :

 

P(K K1 H0 )

(13.1)

где – уровень значимости критерия. Так как вероятность события (K

K1 H0 )

мала, такое событие при справедливости нулевой гипотезы, в силу принципа невозможности маловероятных событий в единичном испытании, не должно наступить. Если оно произошло, то это означает, что нулевая гипотеза ложна и ее следует отвергнуть.

 

Обычно на практике используют значения

0 01 и

0 05 . Например,

если

0 05 , то будет отвергнута справедливая нулевая гипотеза приблизи-

тельно в 5 случаях из 100. Таким образом,

определяет вероятность отверг-

нуть основную гипотезу, если она в действительности справедлива. Рассмотрим подробнее процесс разбиения на критическую и допустимую

области. Так как статистика является скалярной величиной, то множество ее возможных значений – это числовая ось, полуось или отрезок числовой оси. Значит, критическая и допустимая области также участки на числовой оси. Точки, которые разделяют критическую и допустимую области, называют кри-

тическими точками.

Если при справедливости конкурирующей гипотезы большие (меньшие) значения статистики появляются с большей вероятностью, то критическая область находится справа (слева) от критического значения и называется право-

сторонней (левосторонней), то есть правосторонняя (левосторонняя) критиче-

ская область определяется неравенством

K kкр

( K kкр ). Само значение kкр

находится из

условия (13.1),

которое

можно

теперь записать в виде:

P(K kкр H0 )

( P(K kкр H0 )

).

 

 

Критическую область называют двусторонней, если нулевая гипотеза отвергается как при больших, так и при малых значениях статистики. Она определяется неравенствами: K k1 , K k2 ( k1 k2 , здесь k1 k2 – критические точки). Критические точки двусторонней критической области находятся из условия

P(K k1 | H0 ) P(K k2 | H0 )

Если есть основания выбрать k1 и k2 так, что P(K k1 ) P(K k2 )

2 , а

распределение статистики симметрично относительно нуля, то критические точки также будут симметричны относительно нуля и их можно обозначить

74

k1 kкр и k2

kкр , а двустороннюю критическую область удобно задать нера-

венством вида

K kкр , где kкр

0 . Так как P(K

kкр ) P(K kкр ) , то

 

P(K

kкр )

2

 

Для ряда основных критериев существуют специальные таблицы, которые позволяют находить критическую точку kкр по заданному уровню значимости .

13.3. Ошибки первого и второго рода

При принятии или отбрасывании нулевой гипотезы мы можем совершить ошибки двух видов.

Ошибка первого рода состоит в том, что будет отвергнута нулевая гипотеза в то время, когда она в действительности верна.

Ошибка второго рода состоит в том, что будет принята нулевая гипотеза в то время, когда она неверна (или, что то же самое, будет отвергнута конкурирующая гипотеза, в то время, когда она верна).

Очевидно, что вероятность ошибки первого рода равна уровню значимости критерия . Вероятность ошибки второго рода будем обозначать .

Мощностью критерия называют вероятность отвергнуть нулевую гипотезу, если конкурирующая гипотеза верна. То есть мощность критерия равна 1 , и ее можно рассматривать как вероятность того, что критерий распознает, когда верна конкурирующая гипотеза.

Понятно, что чем меньше для данной критической области числа и , тем удачнее выбран критерий. Однако при заданном объеме выборки n невозможно одновременно сделать как угодно малыми оба числа и . Очевидно, что при выборе критической области логично руководствоваться следующим принципом: при заданных значениях и n выбирать критическую область так, чтобы величина была минимальна (мощность критерия была максимальна).

При этом, конечно, чем меньшее значение

мы выбираем, тем большее зна-

чение получается для минимума .

 

Заранее нельзя сказать, какое нужно выбрать, чтобы метод проверки гипотезы был самым выгодным, так как основную роль при этом играет практическая сторона дела. Например, если совершение ошибки первого рода приведет к большим потерям по сравнению с потерями, совершаемыми при ошибке второго рода, следует принять по возможности меньшее значение .

75

Отметим, что единственный способ одновременно уменьшить вероятности ошибок первого и второго рода заключается в увеличении объема выборки n .

Рассмотрим основные этапы процедуры проверки статистических гипотез о симметричности (гипотеза H0 ) и несимметричности (гипотеза H1 ) монеты с

помощью опыта с ее подбрасыванием n раз. Выберем уровень значимости 0 05 . Опишем статистическую модель: число выпадения герба – это случайная величина X , распределенная по биномиальному закону с параметрами n 1000 (число испытаний) и p (вероятность выпадения герба). Сформулируем

нулевую и конкурирующую гипотезы. Пусть H0 : p 12 (монета симметрична),

H1 : p 12 соответственно.

Требуется установить, значимо или незначимо отличается наблюдаемое число выпадений герба и среднее число выпадений герба при таком эксперименте в случае справедливости нулевой гипотезы.

В качестве тестовой статистики возьмем случайную величину

U X p n np

npq

где p 1 q , распределение которой приближается к стандартному нормальному распределению, при справедливости нулевой гипотезы. Действительно, при

большом n , случайная величина X p n

распределена почти по нормальному за-

кону с параметрами m M ( X p n )

np и

 

 

 

( X p n ) npq . Следовательно,

вычитая математическое ожидание и деля на среднее квадратическое отклоне-

ние, получим случайную величину U , причем M (U ) 0 , а (U ) 1.

Критическая область строится в зависимости от вида конкурирующей гипотезы. В этом примере критическая область будет двусторонней, так как если число выпадений герба будет значимо больше или меньше 500, то это будет служить основанием отвергнуть нулевую гипотезу. Так как U – нормированная нормальная величина, то ее распределение симметрично относительно нуля,

кроме того, наибольшая мощность критерия достигается, когда левая k1

и пра-

вая k2 критические точки выбраны так, что P(K

k1 )

P(K

k2 )

2 . Таким об-

разом, достаточно найти критическую точку k2

kкр

из условия P(U kкр )

2 .

Для этого воспользуемся функцией

0 (s) и формулой (8.5):

 

 

 

 

P(U kкр )

P(kкр U

)

(

)

(

kкр

0

)

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

0 (

) 0 5 (

0 (kкр ) 0 5) 0 5

 

0 (kкр ) .

 

 

Следовательно,

 

 

 

 

 

 

 

 

 

 

 

0 5

0 (kкр )

2

 

 

 

 

 

 

 

 

0 (kкр ) (1

) 2

 

 

 

 

 

 

 

 

 

76

 

 

 

 

 

 

 

 

Так как по условию

0 05 , то по табл. П. 1 функции

0 (s) можно легко

найти kкр

1 96 . Тогда двусторонняя критическая область задается неравенством

U kкр

1 96 , а допустимая область – неравенством

U kкр

1 96 .

Пусть число выпадений герба X 511. Вычислим наблюдаемое значение

статистики:

 

 

 

 

 

 

 

 

 

 

 

 

 

Kнабл

(511 500) 1000 0 5 0 5

 

0 696

 

Так как данное значение статистики не попадает в критическую область (|0,696|<1,96), то нулевая гипотеза принимается. Нет оснований считать монету несимметричной.

Задание 13.1. Самостоятельно проверить гипотезу о симметричности монеты, если число выпадений герба равно 897.

13.4. Отыскание мощности критерия

Как мы уже говорили, мощность критерия определяется как вероятность отклонить нулевую гипотезу, если она не верна. Эта вероятность зависит от реального значения рассматриваемого параметра закона распределения. Так как это значение не известно, то рассматривают кривую мощности, которая показывает соответствующее значение мощности критерия для каждого возможного значения параметра. Очевидно, что точки идеальной кривой мощности имеют ординату, равную единице для всех значений параметра, кроме тех, которые соответствуют нулевой гипотезе. На практике подобный результат получить невозможно, обычно удается повысить мощность критерия до желаемого уровня, соответственно увеличив объем выборки.

Рассмотрим вопрос об отыскании мощности критерия на примере с подбрасыванием монеты. Нулевая гипотеза отклонялась при U 1 96 :

X 1000 0 5

 

1 96

,

 

 

 

 

 

 

 

 

 

 

1000

0 5

0 5

 

 

 

то есть когда X 470 или X 530. Это означает, что мы отклоняем гипотезу тогда, когда число выпадений герба меньше чем 470 или больше чем 530.

Предположим, что монета на самом деле немного несимметрична и что неизвестное нам значение вероятности p в действительности равно 0,52. Тогда вероятность отклонить нулевую гипотезу можно найти по формуле МуавраЛапласа:

P(X 470 или X 530) 1 P(470 X 530)

77

1 ( (

 

530

1000

0 52

 

)

(

 

470

 

1000

0 52

 

))

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1000

0 52

0 48

 

 

1000

0 52

0 48

 

 

1

( (0 63)

 

 

( 3 16))

0 26 .

 

 

 

Таким образом, мощность критерия при

p

0 52 равна 0,26; вероятность

совершить ошибку второго рода равна 0,74.

Если увеличить объем выборки, то мощность критерия увеличится. Задание 13.2. Самостоятельно найдите мощность критерия при n 10000 . Перейдем к изложению конкретных статистических критериев.

14. Проверка гипотез о параметрах нормального распределения

14.1. Проверка гипотезы о математическом ожидании случайной величины, имеющей нормальное распределение

14.1.1. Среднее квадратическое отклонение случайной величины известно

Пусть генеральная совокупность имеет нормальное распределение с па-

раметрами a и

,

в дальнейшем кратко будем записывать это так: X N(a ) .

Предположим,

что

известно (например, найдено теоретически или вычисле-

но по выборке большого объема). Хотя математическое ожидание случайной величины X неизвестно, есть основание предположить, что оно равно некоторому значению a0 . На основании случайной выборки (x1 x2 xn ) , взятой из этой генеральной совокупности, требуется проверить гипотезу о равенстве математического ожидания значению a0 , т.е. H0 a a0 против альтернативной гипотезы H1 a a0 . Для этого необходимо установить, значимо или незначимо отличается значение выборочного среднего x от a0 .

Для проверки основной гипотезы можно использовать статистику:

 

 

 

 

 

 

 

 

 

 

 

 

 

U

( X a0 ) n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Здесь выборочное среднее X

 

– это случайная величина, распределенная

 

 

 

 

 

 

 

по нормальному закону:

X

N (a

 

 

n ) , а значит, если нулевая гипотеза верна,

то случайная величина U распределена по нормальному закону U N (0 1) . Зададим уровень значимости данного критерия равным . Критическую

точку kкр найдем из условия

P(U kкр H0 )

Так как U стандартная нормальная случайная величина, то

78

P(U kкр H0 ) 1

(kкр )

Отсюда легко найти kкр из условия

(kкр ) 1 , используя табл. П.1 зна-

чений функции распределения Гаусса-Лапласа.

Множество значений U , определяемых неравенством U kкр , является

правосторонней критической областью. Следовательно, если вычисленное по результатам выборки объема n наблюдаемое значение критерия

 

 

 

 

 

 

 

 

Uнабл

(x

a0 ) n

 

 

 

 

то основная гипотеза H0 a

a0

 

удовлетворяет неравенству Uнабл kкр ,

откло-

няется. Если Uнабл kкр , то основная гипотеза принимается.

 

 

Замечание 14.1. Если основная гипотеза остается прежней

H0 a

a0 , а

альтернативная гипотеза имеет вид H1

a a0 , то используют статистику U с ле-

восторонней критической областью. Если альтернативная гипотеза имеет вид H1 a a0 , то используют статистику U с двусторонней критической областью.

Пример 14.1. На станке-автомате изготавливается деталь с номинальным контролируемым размером a 12 мм. Известно, что распределение контролируемого размера является нормальным X N(a 0 5) . Отдел контроля в течение смены произвел измерение 36 случайно отобранных деталей и подсчитал сред-

ний размер контролируемого параметра x 11 7 мм. Можно ли утверждать, что станок-автомат изготавливает детали уменьшенного размера и поэтому требуется произвести подналадку станка?

 

Решение. Из условия следует, что необходимо проверить нулевую гипо-

тезу

H0 a

12 мм (станок производит детали номинального размера)

против

альтернативной гипотезы H1

a 12 (станок изготавливает детали, размер кото-

рых меньше номинального).

 

 

 

 

 

 

 

 

 

 

Для проверки нулевой гипотезы применим статистику U с левосторонней

критической областью. Вычислим наблюдаемое значение статистики

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Uнабл

(x

a) n

(11 7 12) 36

3 6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0 5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Зададим уровень значимости

0 05 . По табл. П.1 значений функции

распределения Гаусса-Лапласа из условия

P(U kкр H0 )

(kкр )

найдем

kкр

1 64 .

 

 

 

 

 

 

 

 

 

 

 

 

Так как наблюдаемое значение статистики находится в критической об-

ласти Uнабл

3 6 1 64 , то гипотезу

H0 a

12 мм следует отклонить в пользу

79

Tнабл

альтернативы. Это означает, что с вероятностью ошибки, меньшей чем 0,05 можно утверждать, что контролируемый размер деталей, изготавливаемых на станке, является заниженным по сравнению с номинальным и поэтому необходимо произвести подналадку станка.

14.1.2. Среднее квадратическое отклонение случайной величины неизвестно

Если неизвестно, тогда в качестве тестовой статистики проверки нулевой гипотезы можно взять случайную величину:

 

 

 

 

 

T

( X a0 ) n

 

 

s

 

 

 

где s – исправленное выборочное среднее квадратическое отклонение. Случайная величина T имеет распределение Стьюдента с k n 1 степенями свободы. Напомним, что критическая область строится в зависимости от вида конкурирующей гипотезы.

Пусть альтернативная гипотеза имеет вид H1 a a0 . Тогда критическая область будет двусторонней и, в силу симметричности распределения Стьюдента, критическую область можно считать симметричной относительно нуля:

T tкр , кроме того, наибольшая мощность критерия достигается, когда левая t1

и правая t2 критические точки выбраны так, что P(T t1 ) P(T

t2 )

2 . По за-

данному уровню значимости

и числу степеней свободы k

n

1 требуется

найти критическую точку tкр

t 2 n 1 по табл. П. 5 критических точек распре-

деления Стьюдента. Наблюдаемое значение критерия находится по формуле

 

 

 

 

 

Tнабл

(x a0 ) n

 

 

s

 

 

 

Если Tнабл tкр – нет оснований отвергнуть нулевую гипотезу. Если tкр – нулевую гипотезу отклоняют.

Пример 14.2. Статистическому анализу были подвергнуты одиннадцать экземпляров ручной гранаты. Требуется проверить утверждение, что среднее время срабатывания взрывателя равно 4,01 с. При проверке получена следую-

щая выборка: 4,21; 4,03; 3,99; 4,05; 3,89; 3,98; 4,01; 3,92; 4,23; 3,85; 4,20.

Решение. Очевидно, что граната будет непригодна, если среднее время срабатывания взрывателя слишком мало или, наоборот, слишком велико (противник может бросить гранату обратно). Генеральная совокупность имеет нор-

мальное распределение: X

N(a

)

( неизвестно). Поэтому требуется прове-

рить нулевую гипотезу

H0

a

4 01 против альтернативной гипотезы

 

 

 

80

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]