Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

11_12_Проверка_стат_гипотез

.pdf
Скачиваний:
26
Добавлен:
23.02.2015
Размер:
359.28 Кб
Скачать

Проверка статистических гипотез

121

нить односторонний критерий: определив для данного уровня значимости α критическое значение χ02 , при χ2 > χ02 отклоняем нулевую гипотезу, при χ2 χ02 считаем расхождения между выборками незначимыми.

Пример:

Пусть число бракованных изделий в экспериментальной партии составило 9 из 50, а в контрольной – 7 из 30. Оценить с уровнем значимости α = 0,05

существенность расхождений долей брака в этих двух партиях.

 

 

 

Расчет теоретических частот производим по оценке

 

 

 

 

 

 

 

 

 

 

p =

m1 +m2

=

 

9 +7

 

=

 

16 = 0,2 .

 

 

 

 

 

 

 

 

 

 

16 +64

 

 

 

 

 

 

 

 

 

n +n

 

 

 

 

 

 

80

 

 

 

 

 

 

 

 

 

 

 

1

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Совокупность

 

 

A

 

 

 

 

 

 

 

 

 

Всего

 

 

A

 

 

 

 

 

 

 

 

 

 

A

 

 

 

A

Экспериментальная партия

 

 

9

 

 

 

 

41

 

 

50

 

 

10

 

40

Контрольная партия

 

 

7

 

 

 

 

23

 

 

30

 

 

6

 

24

Всего

 

 

 

 

16

 

 

 

 

64

 

 

80

 

 

 

 

Вычисляем значение критерия:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

χэксп2 =

(9 10)2

+

(4140)2

+

(7 6)2

 

(23 24)2

 

 

 

10

 

 

 

40

 

 

 

6

+

 

24

= 0,333 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

При α = 0,05 и ν =1 χ02 =3,8 и χэксп2 < χ02 , поэтому нет оснований отвергать нулевую гипотезу.

12.1.2. Проверка гипотез о среднем значении

Как и в предыдущем параграфе, рассмотрим сравнение среднего со стандартом и сравнение средних двух совокупностей.

а) Сравнение среднего значения с нормативом

Проверяется гипотеза о равенстве генерального среднего X стандартному значению a , т.е. H0 : X = a . Такие задачи встречаются при проверке ка-

чества продукции, характеризуемого некоторым средним показателем: среднее время работы устройства, средний размер детали, среднее содержание компонентов смеси и т.д. Задача может быть переформулирована как гипотеза о принадлежности данной выборки к генеральной совокупности, в которой распределение признака имеет нужные свойства. Как и в предыдущем разделе, следует различать случаи больших и малых выборок.

Если выборка достаточно велика, распределение выборочного среднего

X B на основании центральной предельной теоремы можно считать нормальным (оно асимптотически нормально). В качестве критерия проверки вме-

сто самого выборочного среднего X B удобно рассматривать его стандартный (т.е., центрированный и нормированный) аналог z , нормированное отклоне-

ние X B от стандарта:

z = X(B a).

σ X B

 

122

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Лекции 11–12

 

Так как

M (z)= 0

и σ (z)=1, случайная величина z

распределена по

 

стандартному нормальному закону. При справедливости гипотезы H0 мате-

 

матическое ожидание M (

 

 

 

 

 

)=

 

 

= a и отклонения z нуля – следствие слу-

 

X B

X

 

чайных погрешностей выборки.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Если в качестве альтернативной гипотезы выдвигается

H1 :

 

 

 

a ,

за-

 

X

 

давшись уровнем значимости α , из уравнения

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

значение zα

 

P (

 

z

 

zα 2 )= 2Ф(zα 2 )=1α

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

найдем

 

2

и

критические

точки

для двусторонней

проверки:

 

z1 = −zα

 

, z2 = zα

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

. Если найденное на основании выборки значение zэксп

бу-

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

, то гипотеза H0

 

 

 

 

 

 

 

 

дет удовлетворять неравенству

 

zэксп

 

< zα

2

не отклоняется,

 

 

 

 

если

 

zэксп

 

zα

 

2

, то H0

отклоняется.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пример:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Проверяется гипотеза о среднем размере детали H0 :

 

= 5,8 мм относитель-

 

 

 

 

 

 

 

X

 

 

 

 

 

 

 

 

но

 

 

альтернативной

H1 :

 

5,8 мм.

Из

предыдущего

известно,

что

 

 

 

 

 

 

 

 

X

 

 

 

 

 

 

 

 

σ = 0,4 мм.

По

 

 

 

 

результатам

 

выборки

объемом

n =100

 

 

 

получено

 

 

 

 

 

 

 

 

 

 

= 5,2 мм.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X B

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Примем уровень значимости α = 0,05 и найдем соответствующий квантиль

 

 

 

 

 

 

 

 

 

zα 2

=1,96 . Допустимая область значений параметра z (1,96;1,96). Вычис-

 

 

 

 

 

 

 

 

ляя выборочное значение параметра

zэксп =

4,8 5,2 = −1 > −1,96

 

видим, что

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

оно попало в допустимую область. Гипотеза H0 не отклоняется.

 

 

 

 

 

 

 

 

 

 

 

 

 

Если

альтернативная

гипотеза

 

задается

неравенствами

H1 :

 

> a

или

 

 

 

 

 

 

 

 

X

 

 

 

 

 

 

 

 

 

H1 :

 

< a , то производится односторонняя проверка при помощи значения

 

 

 

 

 

 

 

 

 

X

 

 

 

 

 

 

 

 

 

zα , вычисляемого из уравнения

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P (

 

z

 

< zα )= 0,5 Ф(zα )=α

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и критическая область задается неравенством z > zα или z < zα .

Для применения изложенных правил проверки необходимо знать дисперсию генеральной совокупности (величину σ ). Если она неизвестна (что более соответствует реальной ситуации), то при достаточно большом n (как правило, n > 30 ) можно заменить σ на ее выборочную несмещенную оценку

 

1

n

s =

(xi

 

)2 .

X B

 

 

n 1 i=1

Однако при неизвестной генеральной дисперсии, а также при малых объемах выборок удобнее использовать критерий

t =

X B

a

n 1 ,

s

 

 

который имеет t - распределение Стьюдента с ν = n 1 степенями свободы.

Проверка статистических гипотез

123

Дальнейшее построение критической области для двух- и односторонней проверок проводится аналогично предыдущему, но вместо квантилей стандартного нормального распределения zα используются квантили распреде-

ления Стьюдента tα , определяемые по таблицам распределения Стьюдента,

а не Лапласа. Плотность распределения Стьюдента подобна функции Гаусса (плотности стандартного нормального распределения), но имеет отрицательный эксцесс, вследствие чего в «хвостах» распределения Стьюдента заключена бóльшая площадь. Следовательно, при том же уровне значимости значение tα будет больше, чем zα , т.е. доверительный интервал шире, чем по-

строенный на основе нормального распределения.

Пример:

Рассмотрим условия предыдущего примера ( H0 : средний размер детали X = 5,8 мм, альтернатива H1 : X 5,8 мм, выборочное среднее X B = 5,2 мм) с изменениями: выборка является малой, n =15 , выборочное среднеквадратическое отклонение s = 0,4 мм.

При том же уровне значимости α = 0,05 и числе степеней свободы ν = n 1 =15 1 =14 найдем соответствующий квантиль tα 2 = 2,145 .

Допустимая область значений параметра t (2,145;2,145). Вычисляя выбо-

рочное значение параметра tэксп

=

4,8 5,2

14 = −3,74 < −2,145 видим, что в

 

 

0,4

 

этом случае гипотеза H0 отклоняется.

 

б) Сравнение средних значений двух совокупностей

Пусть имеются две совокупности, характеризующиеся средними X , Y и дисперсиями σx2 , σy2 . Выдвигается гипотеза, что эти средние равны, т.е.

H0 : X =Y . Для проверки этой гипотезы из каждой совокупности производится выборка: из первой – объемом n1 , в результате которой получаются

 

X

B

и s2 , из второй – объемом n , в результате которой получаются

Y

и s2 .

 

 

x

 

 

 

 

2

 

 

 

 

 

 

 

 

B

y

 

sx2 и s2y – дисперсии выборок.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для проверки основной гипотезы используем критерий

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Θ =

 

 

X B

YB

.

 

 

 

 

 

 

 

 

 

 

 

D (

 

 

 

 

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X B

YB

 

 

 

Так как M (

 

)=

 

, M (

 

)=

 

, при справедливости нулевой гипотезы H0

X B

X

YB

Y

будем иметь M (Θ)= 0 .

Используя свойства дисперсии и предполагая вы-

борки (а следовательно,

 

и выборочные средние) независимыми,

получим

124

 

 

 

 

 

 

 

 

 

 

 

Лекции 11–12

 

 

 

 

 

 

 

 

2

σ

2

 

 

 

 

 

 

 

 

 

 

 

 

σ2 (X B YB )=σ2 (X B )+σ2 (YB )= σnx +

y

.

n

1

 

 

2

 

Теперь сделаем дополнительное предположение, что дисперсии обеих совокупностей равны, т.е. σx2 =σy2 =σ2 . Это предположение нуждается в специ-

альной проверке, о чем речь пойдет в следующем разделе. Если принять это предположение, то

 

2

 

 

 

 

 

2

 

1

1

 

σ

(X B YB )=σ

 

 

 

 

+

 

.

 

 

n

n

 

 

 

 

 

 

 

 

 

1

2

 

Подставляя это выражение в формулу для критерия, получаем

Θ =

 

X B

YB

 

 

.

σ

1

+

1

 

 

n

n

 

 

 

 

 

 

 

 

1

 

 

2

 

 

Если обе выборки достаточно большого объема, то X B и YB распределены нормально, поэтому нормально будет распределен и критерий Θ. Заменяя

неизвестную дисперсию генеральной совокупности σ2 ее несмещенной выборочной оценкой

 

n

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 (xi

 

 

)2 +

2

(yi

 

)2

 

 

 

 

 

 

 

 

 

 

X B

YB

n s2

+n s2

 

 

 

 

s2

i=1

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

=

 

1 x

2 y

,

 

 

 

 

 

 

n +n

2

 

 

 

 

 

n +n 2

 

 

 

 

 

 

 

 

1

2

 

 

 

 

 

 

 

 

 

 

 

 

1

2

 

 

 

 

придем к нормально распределенному критерию

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n1 +n2 2

 

 

 

 

 

 

 

 

z =

 

X

B

Y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

B

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n1sx2 +n2 s2y

 

 

1 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

+ n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2

 

 

 

 

 

 

 

 

(число степеней свободы ν = n +n

2 , так как при расчете s2

и

s2

исполь-

 

 

 

 

 

 

 

 

 

1

 

2

 

 

 

 

 

 

 

 

 

 

 

x

 

y

 

зуются два соотношения для средних X B и YB .

Дальнейшая проверка ведется обычным образом с использованием таблиц функций распределения Лапласа. Если выборки малого объема и применение нормального распределения может привести к ошибкам, для того же критерия z используется распределение Стьюдента.

Пример:

Для проверки эффективности новой технологии отбираются две группы рабочих: в первой группе численностью n1 = 40 чел., где применяется новая

технология, получены следующие данные: средняя выработка в штуках X B =84 , при этом sx =10,1, во второй группе численностью n2 = 54

YB = 77,5 sy =8,4 .

Определим со значимостью α = 0,05 , действительно ли новая технология

Проверка статистических гипотез

 

 

 

 

 

 

 

125

оказала влияние на производительность.

 

 

 

 

 

 

Вычисляем

 

 

 

 

 

 

 

 

zэксп =

 

84 77,5

 

40 +54 2

= 3,364 .

 

10,12 +54 8,42

 

1

 

1

 

40

 

+

 

 

 

 

 

 

40

54

 

 

Критическое табличное значение критерия при α = 0,05 составляет 1,96. Так как zэксп >1,96 , то нулевая гипотеза об отсутствии влияния новой технологии должна быть отклонена. Если, считая n1 и n2 небольшими числами, воспользоваться распределением Стьюдента, получается тот же результат.

12.1.3. Сравнение дисперсий двух совокупностей

Проверять гипотезу о равенстве дисперсий двух совокупностей приходится во многих случаях: например, при анализе стабильности производства до и после введения технического новшества (стабильность выпуска продукции измеряется с помощью дисперсии измеряемого признака), при изучении качества измерительных приборов (сопоставление дисперсий показателей отдельных приборов), при изучении степени однородности двух совокупностей в отношении какого-либо признака (квалификации рабочих, успеваемости учащихся и т.д.). Необходимость проверки равенства дисперсий возникает, как было показано в предыдущем разделе, и при сравнении средних значений двух совокупностей, поскольку при этом в большинстве случаев предполагается, что генеральные дисперсии равны.

Пусть имеются две нормально распределенные совокупности, дисперсии которых равны σ12 и σ22 ; нулевая гипотеза H0 :σ12 =σ22 . Так как дисперсии генеральных совокупностей неизвестны, проверка гипотезы осуществляется на основе сопоставления выборочных дисперсий s12 и s22 . Если отношение s12 : s22 близко к 1, нет оснований отклонять нулевую гипотезу, если значи-

тельно отличается – гипотеза отклоняется. Для решения вопроса, насколько большим должно быть отличие выборочных дисперсий, чтобы отклонение нулевой гипотезы было достаточно обоснованным, используется отношение

F =

s2

, где s

2

> s

2

.

1

 

2

s2

 

 

 

1

 

 

 

2

 

называющееся F –распределением

Распределение этого отношения,

Фишера – Снедекора, рассматривалось ранее, при обсуждении распределений, связанных с нормальным. Оно зависит от двух параметров – чисел степеней свободы числителя и знаменателя: ν1 = n1 1 и ν2 = n2 1, где n1 и n2

объемы выборок. Числа ν1 и ν2 указываются в фигурных скобках рядом с вычисленным значением F :

F =

s12

; ν1

.

 

 

s

2

ν

 

 

 

2

2

126 Лекции 11–12

Критическая область строится в зависимости от вида альтернативной гипотезы.

1). Нулевая гипотеза H0 :σ12 =σ22 . Альтернативная гипотеза H1 :σ12 >σ22 (считаем, что выборки пронумерованы так, что s12 > s22 ).

По заданному α и известным ν1 и ν2 по таблице распределения Фишера – Снедекора находим критическое значение Fα . Проверка гипотезы H0 сво-

дится к следующему правилу: если отношение выборочных дисперсий Fэксп > Fα , гипотеза H0 отклоняется; если Fэксп < Fα , гипотеза H0 не отклоняется.

2). Нулевая гипотеза H0 :σ12 =σ22 . Альтернативная гипотеза H1 :σ12 σ22 .

В этом случае строим симметричную двустороннюю критическую область с

критическими точками F1

и F2 , определяемыми из неравенств

P (F < F )= α

,

P (F > F )= α .

1

2

 

2

2

Правая критическая точка F2

находится непосредственно по таблице крити-

ческих точек распределения Фишера – Снедекора для уровня значимости α2

и степеней свободы ν1 и ν2 . Левых критических точек F1 таблица не содер-

жит, но, при выбранном симметричном способе построения критической области, достигается попадание критерия F в критическую область с вероятностью, равной уровню значимости α . Так как из определения уровня значи-

мости P (F < F1 )+ P (F > F1 )=α , то выбирая P (F > F2 )= α2 , мы одновре-

менно достигаем и P (F < F1 )= α2 . Проверка гипотезы H0 производится по тому же правилу, что и в случае односторонней критической области, но таб-

личные значения критерия ищутся для значения α

, вдвое меньшего, чем за-

2

 

 

данный уровень значимости: если отношение

выборочных

дисперсий

Fэксп > F2 , гипотеза H0 отклоняется; если Fэксп < F2 , гипотеза H0

не отклоня-

ется.

 

 

Пример:

Два завода производят однотипные измерительные приборы. Для сравнения качества продукции проведены серии измерений приборами каждого завода. Из совокупностей наблюдений сделаны выборки, объемы которых

n1 = n2 =15 , исправленные выборочные дисперсии s12 =1,35 и s22 = 0,45 . При уровне значимости α = 0,1 проверить гипотезу о равенстве генеральных дисперсий при альтернативной гипотезе σ12 σ22 .

Найдем наблюдаемое значение критерия

Проверка статистических гипотез

 

 

 

 

127

F

= 1,35 = 3 .

 

 

 

 

эксп

0,45

 

 

 

 

 

 

 

 

 

Ищем табличное значение критерия при уровне значимости, вдвое меньше

заданного, т.е. при α = 0,05

для степеней свободы ν

1

=ν

2

= n 1 =14 :

2

 

 

1

 

 

 

 

 

Fкрит = 2,48 . Так как Fэксп > Fкрит , нулевая гипотеза о равенстве дисперсий не

принимается, различие дисперсий статистически значимо. Приборы второго завода производят измерения с меньшей дисперсией, с меньшим разбросом и поэтому более предпочтительны.

12.1.4.Сравнение исправленной выборочной дисперсии

сгипотетической генеральной дисперсией

нормальной совокупности

Пусть генеральная совокупность распределена нормально и есть основания предполагать (скажем, на основании предыдущих испытаний), что гипотети-

ческая (предполагаемая) дисперсия генеральной совокупности равна σ02 . Из генеральной совокупности извлечена выборка объема n и по ней вычислена исправленная выборочная дисперсия s2 с ν = n 1 степенями свободы.

Требуется проверить, значимо ли отличие s2 от σ02 . Как нулевую гипотезу выдвигаем H0 :σ2 =σ02 . На практике рассматриваемая гипотеза проверяется,

если нужно проверить точность приборов, инструментов, станков, устойчивость технологических процессов. Например, известна допустимая мера рас-

сеяния размера деталей σ02 , изготовляемых станком-автоматом, и по найденной по выборке характеристике рассеяния s2 требуется определить, значимо ли отличие s2 от σ02 , нужна переналадка станка или не нужна.

В качестве критерия проверки нулевой гипотезы примем случайную величи-

(n 1)s2

ну . Можно доказать, что она распределена (при нормальном рас-

σ02

пределении признака) по закону χ2 с ν = n 1 степенями свободы. Итак, критерий проверки нулевой гипотезы

χ2 = (n 1)s2 .

σ02

Критическая область строится в зависимости от вида альтернативной гипотезы.

1). Нулевая гипотеза H0 :σ2 =σ02 . Альтернативная гипотеза H1 :σ2 >σ02 . В этом случае строим правостороннюю критическую область из усло-

вия

P (χ2 > χкрит2 )=α .

128

 

 

 

 

 

Лекции 11–12

По таблице распределения χ2

находим значение χкрит2 , и, сравнивая

χэксп2 с χкрит2

, при χэксп2

> χкрит2

отклоняем нулевую гипотезу, при χэксп2 < χкрит2

принимаем нулевую гипотезу.

 

 

 

 

2). Нулевая

гипотеза

H0 :σ2

=σ02 .

Альтернативная

гипотеза H1 :σ2 σ02 .

В этом случае строим симметричную двустороннюю критическую об-

ласть из условий

 

.лев )= α

 

 

.прав )= α .

 

P (χ2

< χкрит2

, P (χ2

> χкрит2

 

 

 

2

 

 

2

В таблице критических точек распределения χ2

приводятся только «правые»

критические точки. Это затруднение можно обойти следующим образом: так

как события χ2 < χкрит2

.лев

и χ2 χкрит2

.лев несовместны и в сумме составляют

все пространство событий, то

 

 

 

 

 

 

 

 

 

 

 

P (χ2 < χкрит2

.лев )+ P (χ2 χкрит2

.лев )=1.

Поэтому P (χ2 < χкрит2

.лев )

находим из условия P (χ2 χкрит2

.лев )=1α .

При χэксп2

< χкрит2

 

 

 

χ2 > χкрит2

 

 

 

 

 

2

.лев или

.прав

нулевая гипотеза отклоняется, в про-

тивном случае – принимается.

 

 

 

 

 

 

3). Нулевая гипотеза

H0 :σ2 =σ02 .

Альтернативная

гипотеза H1 :σ2 <σ02 .

Левосторонняя критическая область строится из условия

 

 

 

 

 

 

 

P (χ2 χкрит2

)=1α .

 

 

При χэксп2

< χкрит2

.лев нулевая гипотеза отклоняется, в противном случае – при-

нимается.

12.2.Непараметрические гипотезы. Критерии согласия Пирсона и Колмогорова

Впредыдущих параграфах рассматривались методы проверки гипотез относительно отдельных параметров генерального распределения. Особое место занимают гипотезы относительно согласованности выборочного распределения с теоретическим (генеральным) распределением. Критерии согласия позволяют ответить на вопрос о том, являются ли различия между выборочным и теоретическим распределениями столь незначительными, что они могут быть приписаны влиянию случайных факторов, или нет.

Пусть закон распределения генеральной совокупности неизвестен, но есть основания предполагать, что он имеет определенный вид. В частности, если выполняются условия центральной предельной теоремы, есть основания ожидать, что генеральное распределение – нормальное; если выборочное среднее и выборочная дисперсия равны, то можно предполагать, что генеральная совокупность распределена по закону Пуассона и т.д. Эти утвержде-

Проверка статистических гипотез

129

ния носят характер гипотез, а не категорических утверждений, и должны быть подвергнуты статистической проверке.

Для проверки гипотезы H0 : закон распределения имеет данный вид (на-

пример, равномерный, нормальный и др.) используется специально подобранная с. в., которая называется критерием согласия.

Критерий согласия есть критерий проверки гипотезы о предполагаемом законе неизвестного распределения.

Имеется несколько критериев согласия: χ2 (хиквадрат) Пирсона, Колмогорова, Мизеса – Смирнова и др.. Мы познакомимся с критериями χ2 и Колмогорова.

12.2.1. Критерий Пирсона

Рассмотрим случай, когда выборка представляется интервальным статистическим рядом. Для изучения случайной величины Х проведено n опытов, диапазон наблюдавшихся значений величины Х разбит на q интервалов. Ряд распределения имеет вид:

 

Интервалы

(x1 ...x2 )

(x2 ...x3 )

(xq ...xq+1 )

 

 

 

 

 

 

 

 

 

 

 

pi =

mi

 

p1

p2

pq

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

q

где mi – количество экспериментальных данных в i -м интервале, mi = n .

 

 

 

 

 

 

 

i=1

В соответствии с предполагаемым теоретическим законом распределения, вычислим вероятности попадания с.в. в соответствующий интервал pi = P(xi < X < xi +1 ) и рассмотрим величину

q

 

χ2 = n (pi pi )2 ,

i=1

pi

которая характеризует степень расхождения теоретических и эмпирических данных. Учитывая, что pi = mni , получим

q

(mi

npi )2

χнабл2 =

 

.

i=1

 

npi

Можно показать, что при n → ∞ распределение этой с.в., независимо от того, каков закон распределения генеральной совокупности, стремится к рас-

пределению Пирсона χ2 с числом степеней свободы ν = q 1k , где k

число параметров генерального распределения, оцениваемых на основании наблюденных данных. Если проверяется согласие выборочного распределения с распределение Пуассона, единственный параметр которого оценивается по выборочным данным, то ν = q 2 , если проверяется согласие с нор-

130 Лекции 11–12

мальным распределением, для которого по выборочным данным оцениваются два параметра X и σ , то ν = q 3 и т.д.

При полном совпадении теоретического и экспериментального распределений χ2 = 0 , в противном случае χ2 > 0 . Задавшись уровнем значимости α , находим табличное критическое значение χα2 , при χнабл2 < χα2 принимаем гипотезу H0 , при χнабл2 χα2 отклоняем гипотезу H0 о виде распределения.

В связи с асимптотическим характером закона Пирсона χ2 должны выполняться следующие условия:

1)выборка должна образовываться в результате случайного отбора;

2)объем выборки n должен быть достаточно большим (практически не менее 50 единиц);

3)численность каждой группы должна быть не менее 5 (если это условие не выполняется, производится объединение малочисленных интервалов).

Пример:

На экзамене экзаменатор задает студенту только один вопрос по одной из четырех частей курса. Из 100 студентов 26 получили вопрос по первой части, 32 - по второй, 17 - по третьей, остальные - по четвертой. При уровне значимости α=0,05 проверить гипотезу, что вероятность получить вопрос по любой из четырех частей для пришедшего на экзамен одинакова.

Объемы выборки и групп n =100 , m1 = 26 , m2 = 32 , m3 =17 , m4 =100 (26 +32 +17)= 25 . Вероятность получить вопрос по любой из че-

тырех частей одинакова, т.е. pi = p = 0,25 ,

npi = 25;

(i =1,2,3,4).

Наблюдаемое значение критерия

 

 

 

 

 

 

 

χ2

=

(26 25)2

+

(32 25)2

+

(17 25)2

+

(25 25)2

=

 

 

 

 

 

 

набл

 

25

 

25

 

 

 

25

 

25

 

 

 

 

 

 

 

 

 

 

 

=

1+49 +64

=

114

= 4,56 .

 

 

 

 

 

 

 

25

 

25

 

 

 

 

Так как ни один из параметров предполагаемого распределения не находился по выборке, то k = 0 б q = 4 и число степеней свободы

ν = 4 (1+0)= 3 . По таблице для ν = 3 и α=0,05 находим критическую

точку χкр2 = 7,82 . Так как χнабл2 = 4,56 < χкр2 = 7,82 , гипотеза о равновероятности получить вопрос по любой из четырех частей курса не отвергается.

Пример:

Распределение признака Х в выборке задано интервальным вариационным рядом (первый и второй столбцы таблицы).

При уровне значимости α=0,05 проверить гипотезу о нормальном распределении Х в генеральной совокупности.

 

*

 

*

 

*

mi )

2

 

(m*i mi )2

 

xi

mi

mi = nФ

mi

mi

(mi

 

 

 

 

 

 

mi

 

 

 

 

 

 

 

 

 

 

 

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]