Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

4сем / ПП_4_сем_pdf / ПП _12_Проверка_стат_гипотез

.pdf
Скачиваний:
33
Добавлен:
23.02.2015
Размер:
501.49 Кб
Скачать

ПП 12. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ И ФОРМУЛЫ

12.1. Статистическая гипотеза. Нулевая и конкурирующая, простая и сложная гипотезы

Задача проверки гипотезы напоминает задачу оценки параметров генеральной совокупности по данным выборки: высказывается некоторое утверждение и на основании данных выборки выносится суждение о справедливости этого утверждения.

Важно отметить, что вопрос должен подлежать рассмотрению методами теории вероятностей, гипотеза должна быть статистической.

Статистические гипотезы утверждают что-либо о статистически устой-

чивых событиях (события, которые могут протекать многократно при идентичных условиях). Как правило, речь идет о виде функции распределения случайной величины или о параметрах, характеризующих эту функцию распределения.

Примеры статистических гипотез:

1)генеральная совокупность распределена по нормальному закону;

2)дисперсии двух нормальных распределений равны;

3)дисперсия признака, распределенного в генеральной совокупности

0 < D < 2.

Определения:

Если в гипотезе утверждается что-то о значении какого-то параметра, гипотеза называется параметрической. Если гипотеза предполагает что-то, количественно не измеряемое (например, «признак имеет нормальное распределение»), гипотеза называется непараметрической.

Основной (нулевой) гипотезой H0 называют выдвинутую гипотезу. Альтернативной (конкурирующей) гипотезой H1 называют гипотезу, которая противоречит выдвинутой.

Гипотеза называется простой, если ответ на нее однозначен. Если ответ неоднозначен, гипотеза называется сложной.

12.2. Ошибки первого и второго рода

Ошибкой первого рода называют ошибку, допускаемую в случае, когда

отвергнута правильная основная гипотеза ( H0 отвергнута, хотя она верна).

Ошибкой второго рода называют ошибку, допускаемую в случае приня-

тия неправильной основной гипотезы ( H0 принята, хотя она неверна).

Результат проверки

Возможные состояния проверяемой гипотезы

 

Верна основная

Верна альтернативная

основной гипотезы

гипотеза H0

гипотеза H1

 

Гипотеза отклоняется

Ошибка первого рода

Правильное решение

Гипотеза не отклоняется

Правильное решение

Ошибка второго рода

12.3. Статистический критерий. Критическая область. Область принятия гипотезы. Критические точки

Для проверки гипотезы H0 используют специально подобранную случайную величину, точное или приближенное распределение которой известно.

Случайная величина Θ, служащая для проверки гипотезы H0 (основной), называется статистическим критерием, или просто критерием.

Наблюдаемым значением Θнабл называют значение критерия, вычисленное по выборке.

Критической областью S называется множество значений критерия, при которых основная гипотеза H0 отклоняется.

Областью принятия гипотезы (допустимой областью) S называется множество значений критерия, при которых основная гипотеза H0 не от-

клоняется.

Критические точки разделяют критическую область и область принятия гипотезы.

Основной принцип проверки статистических гипотез состоит в следую-

щем: если наблюдаемое значение критерия Θнабл попадает в критическую область, то основную гипотезу H0 отклоняют и принимают альтернативную гипотезу H1 , если Θнабл принадлежит области принятия

гипотезы гипотезу H0 принимают, гипотезу H1 от-

клоняют. Вид критической области зависит от вида основной и альтернативной гипотез.

Пусть проверяется гипотеза о равенстве некоторого параметра генерального распределения, напри-

мер генерального среднего X , данному числу a и для проверки гипотезы используется критерий Θ, распре-

деление которого показано на рисунках. Если верна нулевая гипотеза H0 : X = a , то M (Θ)= a .

Если в качестве альтернативной гипотезы выдвигается H1 : X < a , то критическую область естественно определить неравенством Θ < Θ1 , т.е., выбрать левостороннюю критическую область. Задавшись уровнем значимости α, из уравнения P (Θ< Θ1 )=α находим левостороннюю критическую точку Θ1 .

 

 

При альтернативной гипотезе H1 :

 

> a крити-

 

X

 

ческая

область

определяется

из

 

уравнения

 

 

P (Θ> Θ2 )=α (правосторонняя); наконец, если аль-

 

тернативная гипотеза формулируется

в виде

H1 :

 

 

 

a ,

то строится

двусторонняя

критическая

об-

 

 

X

 

 

 

 

 

 

 

 

 

 

 

ласть, критические точки которой находятся из уравнения

P (Θ< Θ1 )+ P (Θ> Θ2 )=α .

Очевидно, две критические точки Θ1 и Θ2 из одного уравнения можно найти

бесчисленным количеством способов. Чаще всего двустороннюю критическую область строят как симметричную, определяя Θ1 и Θ2 из уравнений

P (Θ< Θ )= α

,

P (Θ> Θ

)= α .

1

2

 

2

2

 

 

 

12.4. Уровень значимости и мощность критерия Вероятность совершить ошибку первого рода называют уровнем значимости критерия и обозначают через α, α = P (H1 H0 ).

Вероятность ошибки второго рода обычно обозначается β, β = P (H0 H1 ).

Мощностью критерия называют вероятность попадания критерия в кри-

тическую область при условии, что справедлива альтернативная гипотеза

H1 (т.е., мощность критерия – вероятность недопущения ошибки второго рода).

Очевидно, мощность критерия равна 1 - β.

Обычно для α используются стандартные значения: α = 0,05, α = 0,01 и т.п.. Уменьшение α влечет за собой увеличение вероятности ошибки второго рода β и в этом смысле ошибки первого и второго рода являются конкурирующими. Одновременное уменьшение ошибок первого и второго рода возможно лишь при увеличении объема выборок.

Обычно при проверке гипотезы задаются определенным уровнем значимости α и объемом выборки n. Критерий выбирается так, чтобы мощность критерия была максимальной.

12.5. Некоторые типичные задачи проверки параметрических гипотез

Рассмотрим некоторые наиболее часто встречающиеся задачи, решающиеся с помощью проверки гипотез. Это прежде всего задачи сравнения: сравнение выборочных характеристик (доли признака, среднего, дисперсии) с нормативными; сравнение характеристик двух выборок между собой (для проверки гипотезы о принадлежности этих выборок к одной генеральной совокупности). Типичные непараметрические задачи – проверка гипотезы о виде выборочного распределения, проверка значимости расхождения выборочных характеристик.

12.5.1. Проверка гипотез о доле признака

а) Сравнение доли признака с нормативом

Пусть доля некоторого признака p в генеральной совокупности должна быть равной a , т.е., H0 : p = a . Рассмотрим вначале альтернативную гипотезу H1 : p a , т.е. двусторонний критерий проверки.

В качестве статистического критерия возьмем Θ= mn – частоту появления

признака в выборке. Эта с.в. для возвратной выборки распределена по биномиальному закону, но при достаточно больших объемах выборки можно воспользоваться асимптотическими распределениями (Пуассона или нормальным). Для нормального распределения из уровня значимости α найдем соответствующий

квантиль zα

:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

(

 

 

 

)

 

(

 

 

)

 

(

 

 

)

 

 

 

m

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P

 

a

z σ

Ф

 

z

 

 

Ф

 

 

z

 

 

= 2Ф

 

z

 

 

=1α ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

α

2

 

 

 

 

 

α

2

 

 

 

 

α

2

 

 

 

α

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где Ф(z)

 

– функция Лапласа. Среднеквадратическое отклонение для биноми-

ального распределения σ =

 

 

a (1 a)

, критические точки

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

a (1 a)

 

 

 

 

 

 

a (1 a)

 

 

 

 

 

Θ = a z

 

, Θ

 

 

= a + z

.

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

1

 

 

α 2

 

 

 

 

 

2

 

 

 

α 2

 

 

n

 

 

 

Для двустороннего критерия правило проверки выглядит следующим образом: если наблюдаемое значение критерия, вычисленное по данным выборки, попадает в интервал между критическими точками, Θ1 < Θнабл < Θ2 , нулевая гипоте-

за p = a не отклоняется, если не попадает – отклоняется.

Рассмотрим односторонний критерий проверки, в качестве альтернативной ги-

потезы выдвинем H1 : p > a . В этом случае используется zα

– квантиль уровня

α , определяемый из уравнения

 

 

 

 

 

a (1 a)

 

P

 

m

> Θ

= 0,5 Ф(z )=

α , где Θ

 

= a + z

 

.

 

2

 

 

 

2

α

 

 

a

n

 

n

 

 

 

 

 

 

 

Гипотеза H0

отклоняется, если

m > Θ2

, и принимается, если

m ≤ Θ2 .

 

 

 

 

 

n

 

 

 

 

 

n

Изменение критерия может изменить результаты проверки.

Если альтернативная гипотеза задается неравенствами H1 : X > a или H1 : X < a , то производится односторонняя проверка при помощи значения zα , вычисляемого из уравнения

P ( z < zα )= 0,5 Ф(zα )=α

и критическая область задается неравенством z > zα или z < zα .

Для применения изложенных правил проверки необходимо знать дисперсию генеральной совокупности (величину σ ). Если она неизвестна (что более соответствует реальной ситуации), то при достаточно большом n (как правило, n > 30 ) можно заменить σ на ее выборочную несмещенную оценку

 

1

n

s =

(xi

 

)2 .

X B

 

 

n 1 i=1

Однако при неизвестной генеральной дисперсии, а также при малых объемах выборок удобнее использовать критерий

t =

X B

a

n 1 ,

s

 

 

который имеет t - распределение Стьюдента с ν = n 1 степенями свободы. Дальнейшее построение критической области для двух- и односторонней проверок проводится аналогично предыдущему, но вместо квантилей стандартного нормального распределения zα используются квантили распределения Стью-

дента tα , определяемые по таблицам распределения Стьюдента, а не Лапласа.

б) Сравнение долей признака в двух совокупностях

Пусть

m1

и

m2

– частоты появления одного и того же признака в двух сово-

n

 

 

 

n

2

 

 

1

 

 

 

купностях из n1 и n2 элементов. Нулевой гипотезой является предположение,

что обе совокупности представляют собой две выборки из одной генеральной совокупности с некоторой долей признака p , а расхождение выборочных час-

тот носит случайный характер. Построение статистического критерия различно для больших и малых выборок.

1. Большие выборки. Если n1 и n2 – большие числа (примерно больше 30), то распределение выборочных частот будет близко к нормальному с параметрами

m

 

m

 

 

 

2

m

 

 

p (1p)

 

2

m

 

 

p (1p)

 

M

1

 

= M

2

 

= p

и дисперсиями σ

 

 

1

 

=

 

и σ

 

 

2

 

=

 

.

 

n2

 

 

n1

 

n2

n2

 

n1

 

 

 

 

 

 

n1

 

 

 

 

 

 

 

Для проверки гипотезы введем случайную величину Θ = m1 m2 . Ее распреде- n1 n2

ление также является нормальным с параметрами

 

 

M (Θ)= M

 

m2

 

= M

 

 

 

 

 

 

 

= p p = 0

,

 

 

 

m1

 

m1

M m2

 

 

 

 

 

 

 

 

n1

 

n2

 

 

 

n1

 

 

 

 

n2

 

 

 

 

 

 

 

2

 

2

m m

 

 

2 m

 

 

2

m

 

 

 

 

1

 

1

 

σ

 

(Θ)=σ

 

 

1

2

 

=σ

 

1

 

+σ

 

 

2

= p (1p)

 

+

 

.

 

 

 

 

 

 

 

 

 

 

n1

n2

 

 

 

n1

 

 

 

n2

 

 

 

n1

 

n2

В данном случае необходимо использовать двусторонний критерий, т.е. альтер-

нативную гипотезу выбрать в виде H

1

: m1

m2

. Задавшись уровнем значимо-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

n

2

 

 

 

 

 

 

 

 

 

 

 

сти α , найдем zα

 

из уравнения

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

(

 

 

)

 

 

(

 

 

 

)

 

(

 

 

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P

 

m

a

z σ =

Ф

 

z

 

 

Ф

 

z

 

 

= 2Ф

 

z

 

 

=1α

 

 

 

 

 

n

 

 

α

2

 

 

 

 

α

2

 

 

 

 

 

α

2

 

 

 

α

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и вычислим критические точки

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Θ = −z

 

p (1 p)

 

1

+

 

1

,

 

 

 

 

Θ

 

= z

p (1 p)

 

1

+

1

,

 

 

 

n2

 

 

 

 

 

 

 

1

α 2

 

 

 

 

n1

 

 

 

 

 

 

 

2

 

 

α

2

 

 

 

 

 

n1

n2

где величина p заменяется ее точечной оценкой, полученной на основании

данных двух выборок:

p = m1 + m2 . n1 + n2

Если наблюдаемое значение критерия, вычисленное по данным выборки, попадает в интервал между критическими точками, Θ1 < Θнабл < Θ2 , нулевая гипоте-

за не отклоняется, если не попадает – отклоняется.

2. Малые выборки. Если n1 и n2 – малые числа, то использование нормально-

го распределения для критерия Θ = m1 m2 становится неправомерным. В этом n1 n2

случае используется критерий Пирсона χ2 . Вид соответствующей плотности вероятности приведен в разделе, где обсуждались распределения, связанные с нормальным. Сгруппируем данные в таблицу.

Совокупность

 

Фактические

Теоретические

 

 

 

частоты

 

частоты

 

A

 

 

 

 

 

 

 

 

 

 

Всего

A

 

 

 

 

 

 

 

 

 

A

A

Выборка 1

m

 

 

 

 

 

 

 

 

 

 

n

pn

(1p)n

 

 

 

 

m

 

1

 

 

 

 

1

1

1

 

 

 

 

 

1

 

 

 

 

 

(1p)n2

Выборка 2

m2

 

 

 

 

 

 

 

 

 

 

n2

pn2

 

 

 

m

 

 

 

 

 

2

 

 

 

 

 

 

Всего

m1 +m2

 

 

+

 

 

 

n1 +n2

 

m

m

 

 

 

 

1

2

 

 

 

 

 

 

Через m1 и m2 обозначено количество элементов в каждой совокупности,

обладающих признаком A , через m1 и m2 – не обладающих. Если это выборки из одной и той же генеральной совокупности с долей признака p , то можно оп-

ределить теоретические частоты pn1 ,

(1p)n1 и т.д., которые указаны в двух

последних столбцах.

 

Для p принимается оценка

p = m1 + m2 . Вычисляем χ2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

+ n

2

 

 

 

 

по формуле

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

(m

pn )

2

 

 

 

(1p)n

 

 

(m

pn )

2

 

 

 

(1p)n

 

 

m

m

2

χ2 =

 

 

 

1

1

 

 

 

 

 

 

2

 

 

 

 

 

 

1

1

 

+

 

 

 

+

1

 

1

 

+

 

 

 

 

 

.

 

 

pn

 

 

 

(1 p)n

 

 

 

pn

 

 

 

 

(1 p)n

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

1

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

Так как между четырьмя теоретическими частотами существуют три независимых соотношения, то независимой является только одна величина, т.е. в

распределении χ2 следует учесть одну степень свободы (ν =1).

Нулевую гипотезу формулируем в виде «обе совокупности есть выборки из одной генеральной совокупности». В данном случае естественно применить односторонний критерий: определив для данного уровня значимости α критическое

значение χ02 , при χ2 > χ02 отклоняем нулевую гипотезу, при χ2 χ02 считаем расхождения между выборками незначимыми.

12.5.2. Проверка гипотез о среднем значении

а) Сравнение среднего значения с нормативом

Проверяется гипотеза о равенстве генерального среднего X стандартному значению a , т.е. H0 : X = a . Такие задачи встречаются при проверке качества

продукции, характеризуемого некоторым средним показателем: среднее время работы устройства, средний размер детали, среднее содержание компонентов смеси и т.д. Задача может быть переформулирована как гипотеза о принадлежности данной выборки к генеральной совокупности, в которой распределение признака имеет нужные свойства. Как и в предыдущем разделе, следует различать случаи больших и малых выборок.

Если выборка достаточно велика, распределение выборочного среднего

X B на основании центральной предельной теоремы можно считать нормальным (оно асимптотически нормально). В качестве критерия проверки вместо

самого выборочного среднего X B удобно рассматривать его стандартный (т.е.,

центрированный и нормированный) аналог z , нормированное отклонение X B от стандарта:

z = X(B a).

σ X B

Так как M (z)= 0 и σ (z)=1, случайная величина z распределена по стандартному нормальному закону. При справедливости гипотезы H0 математическое ожидание M (X B )= X = a и отклонения z нуля – следствие случайных

погрешностей выборки.

Если в качестве альтернативной гипотезы выдвигается H1 : X a , задав-

шись уровнем значимости α , из уравнения

 

 

 

 

 

 

 

 

 

 

 

 

 

 

zα

 

P (

 

z

 

 

 

zα 2 )= 2Ф(zα 2 )=1α

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

найдем

 

значение

2

и критические точки для

двусторонней проверки:

 

z1 = −zα

 

, z2 = zα

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

2

. Если найденное на основании выборки значение zэксп будет

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

H0 не отклоняется,

 

 

 

удовлетворять неравенству

 

zэксп

 

< zα

, то гипотеза

если

 

 

 

zэксп

 

zα

, то H0

отклоняется.

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

б) Сравнение средних значений двух совокупностей

 

 

 

 

 

 

Пусть имеются две совокупности, характеризующиеся средними

 

,

 

 

и

 

 

 

X

Y

дисперсиями σx2 ,

σy2 .

Выдвигается

гипотеза, что

эти средние равны,

 

т.е.

H0 : X =Y . Для проверки этой гипотезы из каждой совокупности производится выборка: из первой – объемом n1 , в результате которой получаются X B и sx2 , из

второй – объемом n , в результате которой получаются

Y

B

и

s2 .

s2

и

s2

– дис-

2

 

 

 

 

 

 

 

 

 

 

 

 

y

x

 

y

 

персии выборок.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для проверки основной гипотезы используем критерий

 

 

 

 

 

 

 

Θ =

 

X B

YB

 

 

.

 

 

 

 

 

 

 

D (

 

 

 

 

)

 

 

 

 

 

 

 

 

X B

YB

 

 

 

 

 

 

 

Так как M (X B )= X , M (YB )=Y , при справедливости нулевой гипотезы H0

будем иметь M (Θ)= 0 . Используя свойства дисперсии и предполагая выборки (а следовательно, и выборочные средние) независимыми, получим

σ2 (

 

 

)=σ2 (

 

)+σ2 (

 

)= σnx2

+

σy2

.

X B

YB

X B

YB

n

1

2

 

Теперь сделаем дополнительное предположение, что дисперсии обеих совокупностей равны, т.е. σx2 =σy2 =σ2 . Это предположение нуждается в специальной

проверке, о чем речь пойдет в следующем разделе. Если принять это предположение, то

 

2

 

 

 

 

 

2

 

1

1

 

 

(X B YB )=σ

σ

 

 

 

 

+

 

 

.

 

 

n

n

2

 

 

 

 

 

 

 

 

 

1

 

 

 

Подставляя это выражение в формулу для критерия, получаем

Θ =

 

X B

YB

 

 

 

.

σ

1

+

1

 

n

n

2

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

Если обе выборки достаточно большого объема, то X B и YB распределены нормально, поэтому нормально будет распределен и критерий Θ. Заменяя не-

известную дисперсию генеральной совокупности σ2 ее несмещенной выборочной оценкой

 

n

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 (xi

 

 

)2 +

2

(yi

 

)2

 

 

 

 

 

 

 

 

 

 

 

X B

YB

n s2

+n s2

 

 

 

 

 

s2

i=1

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

=

 

1 x

2 y

,

 

 

 

 

 

 

 

n +n

2

 

 

 

 

 

n +n 2

 

 

 

 

 

 

 

 

 

1

2

 

 

 

 

 

 

 

 

 

 

 

 

1

2

 

 

 

 

 

придем к нормально распределенному критерию

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n1 +n2 2

 

 

 

 

 

 

 

 

 

z =

 

X

B

Y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

B

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n1sx2 +n2 s2y

 

 

1 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

+ n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2

 

 

 

 

 

 

 

 

 

(число степеней свободы ν = n +n

2 , так как при расчете

s2

и

s2

использу-

 

 

 

 

 

 

 

 

 

1

 

2

 

 

 

 

 

 

 

 

 

 

 

 

x

 

y

 

ются два соотношения для средних X B и YB .

Дальнейшая проверка ведется обычным образом с использованием таблиц функций распределения Лапласа. Если выборки малого объема и примене-

ние нормального распределения может привести к ошибкам, для того же критерия z используется распределение Стьюдента.

12.5.3. Сравнение дисперсий двух совокупностей

Проверять гипотезу о равенстве дисперсий двух совокупностей приходится во многих случаях: например, при анализе стабильности производства до и после введения технического новшества (стабильность выпуска продукции измеряется с помощью дисперсии измеряемого признака), при изучении качества измерительных приборов (сопоставление дисперсий показателей отдельных приборов), при изучении степени однородности двух совокупностей в отношении какого-либо признака (квалификации рабочих, успеваемости учащихся и т.д.). Необходимость проверки равенства дисперсий возникает, как было показано в предыдущем разделе, и при сравнении средних значений двух совокупностей, поскольку при этом в большинстве случаев предполагается, что генеральные дисперсии равны.

Пусть имеются две нормально распределенные совокупности, дисперсии которых равны σ12 и σ22 ; нулевая гипотеза H0 :σ12 =σ22 . Так как дисперсии генеральных совокупностей неизвестны, проверка гипотезы осуществляется на основе сопоставления выборочных дисперсий s12 и s22 . Если отношение s12 : s22

близко к 1, нет оснований отклонять нулевую гипотезу, если значительно отличается – гипотеза отклоняется. Для решения вопроса, насколько большим должно быть отличие выборочных дисперсий, чтобы отклонение нулевой гипотезы было достаточно обоснованным, используется отношение

F =

s2

, где

s

2

> s

2

.

1

 

2

s2

 

 

 

 

1

 

 

 

2

 

называющееся F –распределением Фи-

Распределение этого отношения,

шера – Снедекора, рассматривалось ранее, при обсуждении распределений, связанных с нормальным. Оно зависит от двух параметров – чисел степеней свободы числителя и знаменателя: ν1 = n1 1 и ν2 = n2 1, где n1 и n2 – объемы вы-

борок. Числа ν1 и ν2 указываются в фигурных скобках рядом с вычисленным значением F :

F =

s12

; ν1

.

 

 

s

2

ν

 

 

 

2

2

Критическая область строится в зависимости от вида альтернативной гипотезы. 1). Нулевая гипотеза H0 :σ12 =σ22 . Альтернативная гипотеза H1 :σ12 >σ22 (считаем, что выборки пронумерованы так, что s12 > s22 ).

По заданному α и известным ν1 и ν2 по таблице распределения Фишера – Снедекора находим критическое значение Fα . Проверка гипотезы H0 сводится к следующему правилу: если отношение выборочных дисперсий Fэксп > Fα , гипотеза H0 отклоняется; если Fэксп < Fα , гипотеза H0 не отклоняется.

2). Нулевая гипотеза H0 :σ12 =σ22 . Альтернативная гипотеза H1 :σ12 σ22 .

В этом случае строим симметричную двустороннюю критическую область с

критическими точками F1

и F2 , определяемыми из неравенств

P (F < F )= α

,

P (F > F )= α .

1

2

 

2

2

 

 

 

Правая критическая точка F2 находится непосредственно по таблице критиче-

ских точек распределения Фишера – Снедекора для уровня значимости α2 и

степеней свободы ν1 и ν2 . Левых критических точек F1 таблица не содержит,

но, при выбранном симметричном способе построения критической области, достигается попадание критерия F в критическую область с вероятностью, равной уровню значимости α . Так как из определения уровня значимости

P (F < F1 )+ P (F > F1 )=α , то выбирая P (F > F2 )= α2 , мы одновременно дости-

гаем и P (F < F1 )= α2 . Проверка гипотезы H0 производится по тому же прави-

лу, что и в случае односторонней критической области, но табличные значения критерия ищутся для значения α2 , вдвое меньшего, чем заданный уровень зна-

чимости: если отношение выборочных дисперсий Fэксп > F2 , гипотеза H0 отклоняется; если Fэксп < F2 , гипотеза H0 не отклоняется.

12.5.4.Сравнение исправленной выборочной дисперсии с гипотетической генеральной дисперсией нормальной совокупности

Пусть генеральная совокупность распределена нормально и есть основания предполагать (скажем, на основании предыдущих испытаний), что гипотетиче-

ская (предполагаемая) дисперсия генеральной совокупности равна σ02 . Из генеральной совокупности извлечена выборка объема n и по ней вычислена исправленная выборочная дисперсия s2 с ν = n 1 степенями свободы.

Требуется проверить, значимо ли отличие s2 от σ02 . Как нулевую гипотезу выдвигаем H0 :σ2 =σ02 . На практике рассматриваемая гипотеза проверяется, если

нужно проверить точность приборов, инструментов, станков, устойчивость технологических процессов. Например, известна допустимая мера рассеяния

размера деталей σ02 , изготовляемых станком-автоматом, и по найденной по выборке характеристике рассеяния s2 требуется определить, значимо ли отличие s2 от σ02 , нужна переналадка станка или не нужна. В качестве критерия про-

(n 1)s2

верки нулевой гипотезы примем случайную величину . Можно дока-

σ02

зать, что она распределена (при нормальном распределении признака) по закону χ2 с ν = n 1 степенями свободы.