11_12_Проверка_стат_гипотез
.pdfПроверка статистических гипотез |
121 |
нить односторонний критерий: определив для данного уровня значимости α критическое значение χ02 , при χ2 > χ02 отклоняем нулевую гипотезу, при χ2 ≤ χ02 считаем расхождения между выборками незначимыми.
Пример:
Пусть число бракованных изделий в экспериментальной партии составило 9 из 50, а в контрольной – 7 из 30. Оценить с уровнем значимости α = 0,05
существенность расхождений долей брака в этих двух партиях. |
|
|
|
||||||||||||||||||||||
Расчет теоретических частот производим по оценке |
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
p = |
m1 +m2 |
= |
|
9 +7 |
|
= |
|
16 = 0,2 . |
|
|
|
|
|
|
|
|||||||||
|
|
|
16 +64 |
|
|
|
|
|
|
|
|||||||||||||||
|
|
n +n |
|
|
|
|
|
|
80 |
|
|
|
|
|
|
|
|
|
|
||||||
|
1 |
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Совокупность |
|
|
A |
|
|
|
|
|
|
|
|
|
Всего |
|
|
A |
|
|
|
|
|||||
|
|
|
|
|
|
A |
|
|
|
A |
|||||||||||||||
Экспериментальная партия |
|
|
9 |
|
|
|
|
41 |
|
|
50 |
|
|
10 |
|
40 |
|||||||||
Контрольная партия |
|
|
7 |
|
|
|
|
23 |
|
|
30 |
|
|
6 |
|
24 |
|||||||||
Всего |
|
|
|
|
16 |
|
|
|
|
64 |
|
|
80 |
|
|
– |
|
|
– |
||||||
Вычисляем значение критерия: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
χэксп2 = |
(9 −10)2 |
+ |
(41−40)2 |
+ |
(7 −6)2 |
|
(23 −24)2 |
|
|
|
|||||||||||||||
10 |
|
|
|
40 |
|
|
|
6 |
+ |
|
24 |
= 0,333 . |
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
При α = 0,05 и ν =1 χ02 =3,8 и χэксп2 < χ02 , поэтому нет оснований отвергать нулевую гипотезу.
12.1.2. Проверка гипотез о среднем значении
Как и в предыдущем параграфе, рассмотрим сравнение среднего со стандартом и сравнение средних двух совокупностей.
а) Сравнение среднего значения с нормативом
Проверяется гипотеза о равенстве генерального среднего X стандартному значению a , т.е. H0 : X = a . Такие задачи встречаются при проверке ка-
чества продукции, характеризуемого некоторым средним показателем: среднее время работы устройства, средний размер детали, среднее содержание компонентов смеси и т.д. Задача может быть переформулирована как гипотеза о принадлежности данной выборки к генеральной совокупности, в которой распределение признака имеет нужные свойства. Как и в предыдущем разделе, следует различать случаи больших и малых выборок.
Если выборка достаточно велика, распределение выборочного среднего
X B на основании центральной предельной теоремы можно считать нормальным (оно асимптотически нормально). В качестве критерия проверки вме-
сто самого выборочного среднего X B удобно рассматривать его стандартный (т.е., центрированный и нормированный) аналог z , нормированное отклоне-
ние X B от стандарта:
z = X(B −a).
σ X B
|
122 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Лекции 11–12 |
|||||
|
Так как |
M (z)= 0 |
и σ (z)=1, случайная величина z |
распределена по |
||||||||||||||||||||||||||||||||||||||||||||
|
стандартному нормальному закону. При справедливости гипотезы H0 мате- |
|||||||||||||||||||||||||||||||||||||||||||||||
|
матическое ожидание M ( |
|
|
|
|
|
)= |
|
|
= a и отклонения z нуля – следствие слу- |
||||||||||||||||||||||||||||||||||||||
|
X B |
X |
||||||||||||||||||||||||||||||||||||||||||||||
|
чайных погрешностей выборки. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||
|
Если в качестве альтернативной гипотезы выдвигается |
H1 : |
|
|
|
≠ a , |
за- |
|||||||||||||||||||||||||||||||||||||||||
|
X |
|||||||||||||||||||||||||||||||||||||||||||||||
|
давшись уровнем значимости α , из уравнения |
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||
|
|
|
|
|
значение zα |
|
P ( |
|
z |
|
≤ zα 2 )= 2Ф(zα 2 )=1−α |
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||
|
найдем |
|
2 |
и |
критические |
точки |
для двусторонней |
проверки: |
||||||||||||||||||||||||||||||||||||||||
|
z1 = −zα |
|
, z2 = zα |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
2 |
. Если найденное на основании выборки значение zэксп |
бу- |
|||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
, то гипотеза H0 |
|
|
|
|
|
|
|
|||||
|
дет удовлетворять неравенству |
|
zэксп |
|
< zα |
2 |
не отклоняется, |
|||||||||||||||||||||||||||||||||||||||||
|
|
|
||||||||||||||||||||||||||||||||||||||||||||||
|
если |
|
zэксп |
|
≥ zα |
|
2 |
, то H0 |
отклоняется. |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||
|
Пример: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
Проверяется гипотеза о среднем размере детали H0 : |
|
= 5,8 мм относитель- |
||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
X |
|||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
но |
|
|
альтернативной |
H1 : |
|
≠ 5,8 мм. |
Из |
предыдущего |
известно, |
что |
||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
X |
||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
σ = 0,4 мм. |
По |
|
|
|
|
результатам |
|
выборки |
объемом |
n =100 |
|
|
|
получено |
||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
= 5,2 мм. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
X B |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
Примем уровень значимости α = 0,05 и найдем соответствующий квантиль |
|||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
zα 2 |
=1,96 . Допустимая область значений параметра z (−1,96;1,96). Вычис- |
||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
ляя выборочное значение параметра |
zэксп = |
4,8 −5,2 = −1 > −1,96 |
|
видим, что |
||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0,4 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
оно попало в допустимую область. Гипотеза H0 не отклоняется. |
|
|
|
|
|
|||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
Если |
альтернативная |
гипотеза |
|
задается |
неравенствами |
H1 : |
|
> a |
или |
|||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
X |
||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
H1 : |
|
< a , то производится односторонняя проверка при помощи значения |
|||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
X |
|||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
zα , вычисляемого из уравнения |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
P ( |
|
z |
|
< zα )= 0,5 −Ф(zα )=α |
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
и критическая область задается неравенством z > zα или z < zα .
Для применения изложенных правил проверки необходимо знать дисперсию генеральной совокупности (величину σ ). Если она неизвестна (что более соответствует реальной ситуации), то при достаточно большом n (как правило, n > 30 ) можно заменить σ на ее выборочную несмещенную оценку
|
1 |
n |
|||
s = |
∑(xi − |
|
)2 . |
||
X B |
|||||
|
|||||
|
n −1 i=1 |
Однако при неизвестной генеральной дисперсии, а также при малых объемах выборок удобнее использовать критерий
t = |
X B |
−a |
n −1 , |
|
s |
||||
|
|
который имеет t - распределение Стьюдента с ν = n −1 степенями свободы.
Проверка статистических гипотез |
123 |
Дальнейшее построение критической области для двух- и односторонней проверок проводится аналогично предыдущему, но вместо квантилей стандартного нормального распределения zα используются квантили распреде-
ления Стьюдента tα , определяемые по таблицам распределения Стьюдента,
а не Лапласа. Плотность распределения Стьюдента подобна функции Гаусса (плотности стандартного нормального распределения), но имеет отрицательный эксцесс, вследствие чего в «хвостах» распределения Стьюдента заключена бóльшая площадь. Следовательно, при том же уровне значимости значение tα будет больше, чем zα , т.е. доверительный интервал шире, чем по-
строенный на основе нормального распределения.
Пример:
Рассмотрим условия предыдущего примера ( H0 : средний размер детали X = 5,8 мм, альтернатива H1 : X ≠ 5,8 мм, выборочное среднее X B = 5,2 мм) с изменениями: выборка является малой, n =15 , выборочное среднеквадратическое отклонение s = 0,4 мм.
При том же уровне значимости α = 0,05 и числе степеней свободы ν = n −1 =15 −1 =14 найдем соответствующий квантиль tα 2 = 2,145 .
Допустимая область значений параметра t (−2,145;2,145). Вычисляя выбо-
рочное значение параметра tэксп |
= |
4,8 −5,2 |
14 = −3,74 < −2,145 видим, что в |
|
|
0,4 |
|
этом случае гипотеза H0 отклоняется. |
|
б) Сравнение средних значений двух совокупностей
Пусть имеются две совокупности, характеризующиеся средними X , Y и дисперсиями σx2 , σy2 . Выдвигается гипотеза, что эти средние равны, т.е.
H0 : X =Y . Для проверки этой гипотезы из каждой совокупности производится выборка: из первой – объемом n1 , в результате которой получаются
|
X |
B |
и s2 , из второй – объемом n , в результате которой получаются |
Y |
и s2 . |
|||||||||||||||||||||
|
|
x |
|
|
|
|
2 |
|
|
|
|
|
|
|
|
B |
y |
|||||||||
|
sx2 и s2y – дисперсии выборок. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
Для проверки основной гипотезы используем критерий |
|
|
|
|||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
− |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Θ = |
|
|
X B |
YB |
. |
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
D ( |
|
|
− |
|
|
) |
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
X B |
YB |
|
|
|
||||||||||
Так как M ( |
|
)= |
|
, M ( |
|
)= |
|
, при справедливости нулевой гипотезы H0 |
||||||||||||||||||
X B |
X |
YB |
Y |
|||||||||||||||||||||||
будем иметь M (Θ)= 0 . |
Используя свойства дисперсии и предполагая вы- |
|||||||||||||||||||||||||
борки (а следовательно, |
|
и выборочные средние) независимыми, |
получим |
124 |
|
|
|
|
|
|
|
|
|
|
|
Лекции 11–12 |
|
|
|
|
|
|
|
|
2 |
σ |
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
||
σ2 (X B −YB )=σ2 (X B )+σ2 (YB )= σnx + |
y |
. |
||||||||||
n |
||||||||||||
1 |
|
|
2 |
|
Теперь сделаем дополнительное предположение, что дисперсии обеих совокупностей равны, т.е. σx2 =σy2 =σ2 . Это предположение нуждается в специ-
альной проверке, о чем речь пойдет в следующем разделе. Если принять это предположение, то
|
2 |
|
|
|
|
|
2 |
|
1 |
1 |
|
||
σ |
(X B −YB )=σ |
||||||||||||
|
|
|
|
+ |
|
. |
|||||||
|
|
n |
n |
||||||||||
|
|
|
|
|
|
|
|
|
1 |
2 |
|
Подставляя это выражение в формулу для критерия, получаем
Θ = |
|
X B |
− |
YB |
|
|
. |
|||
σ |
1 |
+ |
1 |
|
||||||
|
n |
n |
||||||||
|
|
|
|
|
||||||
|
|
|
1 |
|
|
2 |
|
|
Если обе выборки достаточно большого объема, то X B и YB распределены нормально, поэтому нормально будет распределен и критерий Θ. Заменяя
неизвестную дисперсию генеральной совокупности σ2 ее несмещенной выборочной оценкой
|
n |
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
∑1 (xi − |
|
|
)2 + |
∑2 |
(yi − |
|
)2 |
|
|
|
|
|
|
|
|
|
||||||||||
|
X B |
YB |
n s2 |
+n s2 |
|
|
|
|
|||||||||||||||||||
s2 ≈ |
i=1 |
|
|
|
|
|
|
|
i=1 |
|
|
|
|
|
|
|
= |
|
1 x |
2 y |
, |
|
|
|
|||
|
|
|
n +n |
−2 |
|
|
|
|
|
n +n −2 |
|
|
|
||||||||||||||
|
|
|
|
|
1 |
2 |
|
|
|
|
|
|
|
|
|
|
|
|
1 |
2 |
|
|
|
|
|||
придем к нормально распределенному критерию |
|
|
|
|
|
||||||||||||||||||||||
|
|
|
|
|
|
− |
|
|
|
|
|
n1 +n2 −2 |
|
|
|
|
|
|
|
||||||||
|
z = |
|
X |
B |
Y |
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
B |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
n1sx2 +n2 s2y |
|
|
1 1 |
|
|
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
n |
+ n |
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
2 |
|
|
|
|
|
|
|
|
|||||
(число степеней свободы ν = n +n |
−2 , так как при расчете s2 |
и |
s2 |
исполь- |
|||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
1 |
|
2 |
|
|
|
|
|
|
|
|
|
|
|
x |
|
y |
|
зуются два соотношения для средних X B и YB .
Дальнейшая проверка ведется обычным образом с использованием таблиц функций распределения Лапласа. Если выборки малого объема и применение нормального распределения может привести к ошибкам, для того же критерия z используется распределение Стьюдента.
Пример:
Для проверки эффективности новой технологии отбираются две группы рабочих: в первой группе численностью n1 = 40 чел., где применяется новая
технология, получены следующие данные: средняя выработка в штуках X B =84 , при этом sx =10,1, во второй группе численностью n2 = 54
YB = 77,5 sy =8,4 .
Определим со значимостью α = 0,05 , действительно ли новая технология
Проверка статистических гипотез |
|
|
|
|
|
|
|
125 |
|
оказала влияние на производительность. |
|
|
|
|
|
|
|||
Вычисляем |
|
|
|
|
|
|
|
|
|
zэксп = |
|
84 −77,5 |
|
40 +54 −2 |
= 3,364 . |
||||
|
10,12 +54 8,42 |
|
1 |
|
1 |
|
|||
40 |
|
+ |
|
|
|||||
|
|
|
|
40 |
54 |
|
|
Критическое табличное значение критерия при α = 0,05 составляет 1,96. Так как zэксп >1,96 , то нулевая гипотеза об отсутствии влияния новой технологии должна быть отклонена. Если, считая n1 и n2 небольшими числами, воспользоваться распределением Стьюдента, получается тот же результат.
12.1.3. Сравнение дисперсий двух совокупностей
Проверять гипотезу о равенстве дисперсий двух совокупностей приходится во многих случаях: например, при анализе стабильности производства до и после введения технического новшества (стабильность выпуска продукции измеряется с помощью дисперсии измеряемого признака), при изучении качества измерительных приборов (сопоставление дисперсий показателей отдельных приборов), при изучении степени однородности двух совокупностей в отношении какого-либо признака (квалификации рабочих, успеваемости учащихся и т.д.). Необходимость проверки равенства дисперсий возникает, как было показано в предыдущем разделе, и при сравнении средних значений двух совокупностей, поскольку при этом в большинстве случаев предполагается, что генеральные дисперсии равны.
Пусть имеются две нормально распределенные совокупности, дисперсии которых равны σ12 и σ22 ; нулевая гипотеза H0 :σ12 =σ22 . Так как дисперсии генеральных совокупностей неизвестны, проверка гипотезы осуществляется на основе сопоставления выборочных дисперсий s12 и s22 . Если отношение s12 : s22 близко к 1, нет оснований отклонять нулевую гипотезу, если значи-
тельно отличается – гипотеза отклоняется. Для решения вопроса, насколько большим должно быть отличие выборочных дисперсий, чтобы отклонение нулевой гипотезы было достаточно обоснованным, используется отношение
F = |
s2 |
, где s |
2 |
> s |
2 |
. |
|
1 |
|
2 |
|||||
s2 |
|
||||||
|
|
1 |
|
|
|||
|
2 |
|
называющееся F –распределением |
||||
Распределение этого отношения, |
Фишера – Снедекора, рассматривалось ранее, при обсуждении распределений, связанных с нормальным. Оно зависит от двух параметров – чисел степеней свободы числителя и знаменателя: ν1 = n1 −1 и ν2 = n2 −1, где n1 и n2 –
объемы выборок. Числа ν1 и ν2 указываются в фигурных скобках рядом с вычисленным значением F :
F = |
s12 |
; ν1 |
. |
|
|
||||
|
s |
2 |
ν |
|
|
|
2 |
2 |
126 Лекции 11–12
Критическая область строится в зависимости от вида альтернативной гипотезы.
1). Нулевая гипотеза H0 :σ12 =σ22 . Альтернативная гипотеза H1 :σ12 >σ22 (считаем, что выборки пронумерованы так, что s12 > s22 ).
По заданному α и известным ν1 и ν2 по таблице распределения Фишера – Снедекора находим критическое значение Fα . Проверка гипотезы H0 сво-
дится к следующему правилу: если отношение выборочных дисперсий Fэксп > Fα , гипотеза H0 отклоняется; если Fэксп < Fα , гипотеза H0 не отклоняется.
2). Нулевая гипотеза H0 :σ12 =σ22 . Альтернативная гипотеза H1 :σ12 ≠σ22 .
В этом случае строим симметричную двустороннюю критическую область с
критическими точками F1 |
и F2 , определяемыми из неравенств |
|||
P (F < F )= α |
, |
P (F > F )= α . |
||
1 |
2 |
|
2 |
2 |
Правая критическая точка F2 |
находится непосредственно по таблице крити- |
ческих точек распределения Фишера – Снедекора для уровня значимости α2
и степеней свободы ν1 и ν2 . Левых критических точек F1 таблица не содер-
жит, но, при выбранном симметричном способе построения критической области, достигается попадание критерия F в критическую область с вероятностью, равной уровню значимости α . Так как из определения уровня значи-
мости P (F < F1 )+ P (F > F1 )=α , то выбирая P (F > F2 )= α2 , мы одновре-
менно достигаем и P (F < F1 )= α2 . Проверка гипотезы H0 производится по тому же правилу, что и в случае односторонней критической области, но таб-
личные значения критерия ищутся для значения α |
, вдвое меньшего, чем за- |
|
2 |
|
|
данный уровень значимости: если отношение |
выборочных |
дисперсий |
Fэксп > F2 , гипотеза H0 отклоняется; если Fэксп < F2 , гипотеза H0 |
не отклоня- |
|
ется. |
|
|
Пример:
Два завода производят однотипные измерительные приборы. Для сравнения качества продукции проведены серии измерений приборами каждого завода. Из совокупностей наблюдений сделаны выборки, объемы которых
n1 = n2 =15 , исправленные выборочные дисперсии s12 =1,35 и s22 = 0,45 . При уровне значимости α = 0,1 проверить гипотезу о равенстве генеральных дисперсий при альтернативной гипотезе σ12 ≠σ22 .
Найдем наблюдаемое значение критерия
Проверка статистических гипотез |
|
|
|
|
127 |
F |
= 1,35 = 3 . |
|
|
|
|
эксп |
0,45 |
|
|
|
|
|
|
|
|
|
|
Ищем табличное значение критерия при уровне значимости, вдвое меньше |
|||||
заданного, т.е. при α = 0,05 |
для степеней свободы ν |
1 |
=ν |
2 |
= n −1 =14 : |
2 |
|
|
1 |
||
|
|
|
|
|
|
Fкрит = 2,48 . Так как Fэксп > Fкрит , нулевая гипотеза о равенстве дисперсий не |
принимается, различие дисперсий статистически значимо. Приборы второго завода производят измерения с меньшей дисперсией, с меньшим разбросом и поэтому более предпочтительны.
12.1.4.Сравнение исправленной выборочной дисперсии
сгипотетической генеральной дисперсией
нормальной совокупности
Пусть генеральная совокупность распределена нормально и есть основания предполагать (скажем, на основании предыдущих испытаний), что гипотети-
ческая (предполагаемая) дисперсия генеральной совокупности равна σ02 . Из генеральной совокупности извлечена выборка объема n и по ней вычислена исправленная выборочная дисперсия s2 с ν = n −1 степенями свободы.
Требуется проверить, значимо ли отличие s2 от σ02 . Как нулевую гипотезу выдвигаем H0 :σ2 =σ02 . На практике рассматриваемая гипотеза проверяется,
если нужно проверить точность приборов, инструментов, станков, устойчивость технологических процессов. Например, известна допустимая мера рас-
сеяния размера деталей σ02 , изготовляемых станком-автоматом, и по найденной по выборке характеристике рассеяния s2 требуется определить, значимо ли отличие s2 от σ02 , нужна переналадка станка или не нужна.
В качестве критерия проверки нулевой гипотезы примем случайную величи-
(n −1)s2
ну . Можно доказать, что она распределена (при нормальном рас-
σ02
пределении признака) по закону χ2 с ν = n −1 степенями свободы. Итак, критерий проверки нулевой гипотезы
χ2 = (n −1)s2 .
σ02
Критическая область строится в зависимости от вида альтернативной гипотезы.
1). Нулевая гипотеза H0 :σ2 =σ02 . Альтернативная гипотеза H1 :σ2 >σ02 . В этом случае строим правостороннюю критическую область из усло-
вия
P (χ2 > χкрит2 )=α .
128 |
|
|
|
|
|
Лекции 11–12 |
По таблице распределения χ2 |
находим значение χкрит2 , и, сравнивая |
|||||
χэксп2 с χкрит2 |
, при χэксп2 |
> χкрит2 |
отклоняем нулевую гипотезу, при χэксп2 < χкрит2 |
|||
принимаем нулевую гипотезу. |
|
|
|
|
||
2). Нулевая |
гипотеза |
H0 :σ2 |
=σ02 . |
Альтернативная |
гипотеза H1 :σ2 ≠σ02 . |
|
В этом случае строим симметричную двустороннюю критическую об- |
||||||
ласть из условий |
|
.лев )= α |
|
|
.прав )= α . |
|
|
P (χ2 |
< χкрит2 |
, P (χ2 |
> χкрит2 |
||
|
|
|
2 |
|
|
2 |
В таблице критических точек распределения χ2 |
приводятся только «правые» |
критические точки. Это затруднение можно обойти следующим образом: так
как события χ2 < χкрит2 |
.лев |
и χ2 ≥ χкрит2 |
.лев несовместны и в сумме составляют |
|||||||||
все пространство событий, то |
|
|
|
|
|
|
||||||
|
|
|
|
|
P (χ2 < χкрит2 |
.лев )+ P (χ2 ≥ χкрит2 |
.лев )=1. |
|||||
Поэтому P (χ2 < χкрит2 |
.лев ) |
находим из условия P (χ2 ≥ χкрит2 |
.лев )=1−α . |
|||||||||
При χэксп2 |
< χкрит2 |
|
|
|
χ2 > χкрит2 |
|
|
|
|
|
2 |
|
.лев или |
.прав |
нулевая гипотеза отклоняется, в про- |
||||||||||
тивном случае – принимается. |
|
|
|
|
|
|
||||||
3). Нулевая гипотеза |
H0 :σ2 =σ02 . |
Альтернативная |
гипотеза H1 :σ2 <σ02 . |
|||||||||
Левосторонняя критическая область строится из условия |
|
|||||||||||
|
|
|
|
|
|
P (χ2 ≥ χкрит2 |
)=1−α . |
|
|
|||
При χэксп2 |
< χкрит2 |
.лев нулевая гипотеза отклоняется, в противном случае – при- |
нимается.
12.2.Непараметрические гипотезы. Критерии согласия Пирсона и Колмогорова
Впредыдущих параграфах рассматривались методы проверки гипотез относительно отдельных параметров генерального распределения. Особое место занимают гипотезы относительно согласованности выборочного распределения с теоретическим (генеральным) распределением. Критерии согласия позволяют ответить на вопрос о том, являются ли различия между выборочным и теоретическим распределениями столь незначительными, что они могут быть приписаны влиянию случайных факторов, или нет.
Пусть закон распределения генеральной совокупности неизвестен, но есть основания предполагать, что он имеет определенный вид. В частности, если выполняются условия центральной предельной теоремы, есть основания ожидать, что генеральное распределение – нормальное; если выборочное среднее и выборочная дисперсия равны, то можно предполагать, что генеральная совокупность распределена по закону Пуассона и т.д. Эти утвержде-
Проверка статистических гипотез |
129 |
ния носят характер гипотез, а не категорических утверждений, и должны быть подвергнуты статистической проверке.
Для проверки гипотезы H0 : закон распределения имеет данный вид (на-
пример, равномерный, нормальный и др.) используется специально подобранная с. в., которая называется критерием согласия.
Критерий согласия есть критерий проверки гипотезы о предполагаемом законе неизвестного распределения.
Имеется несколько критериев согласия: χ2 (хиквадрат) Пирсона, Колмогорова, Мизеса – Смирнова и др.. Мы познакомимся с критериями χ2 и Колмогорова.
12.2.1. Критерий Пирсона
Рассмотрим случай, когда выборка представляется интервальным статистическим рядом. Для изучения случайной величины Х проведено n опытов, диапазон наблюдавшихся значений величины Х разбит на q интервалов. Ряд распределения имеет вид:
|
Интервалы |
(x1 ...x2 ) |
(x2 ...x3 ) |
… |
(xq ...xq+1 ) |
|
||
|
|
|
|
|
|
|
|
|
|
pi = |
mi |
|
p1 |
p2 |
… |
pq |
|
|
n |
|
||||||
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
q |
|
где mi – количество экспериментальных данных в i -м интервале, ∑mi = n . |
||||||||
|
|
|
|
|
|
|
i=1 |
В соответствии с предполагаемым теоретическим законом распределения, вычислим вероятности попадания с.в. в соответствующий интервал pi = P(xi < X < xi +1 ) и рассмотрим величину
q |
|
χ2 = ∑ n (pi − pi )2 , |
|
i=1 |
pi |
которая характеризует степень расхождения теоретических и эмпирических данных. Учитывая, что pi = mni , получим
q |
(mi |
−npi )2 |
χнабл2 = ∑ |
|
. |
i=1 |
|
npi |
Можно показать, что при n → ∞ распределение этой с.в., независимо от того, каков закон распределения генеральной совокупности, стремится к рас-
пределению Пирсона χ2 с числом степеней свободы ν = q −1−k , где k –
число параметров генерального распределения, оцениваемых на основании наблюденных данных. Если проверяется согласие выборочного распределения с распределение Пуассона, единственный параметр которого оценивается по выборочным данным, то ν = q −2 , если проверяется согласие с нор-
130 Лекции 11–12
мальным распределением, для которого по выборочным данным оцениваются два параметра X и σ , то ν = q −3 и т.д.
При полном совпадении теоретического и экспериментального распределений χ2 = 0 , в противном случае χ2 > 0 . Задавшись уровнем значимости α , находим табличное критическое значение χα2 , при χнабл2 < χα2 принимаем гипотезу H0 , при χнабл2 ≥ χα2 отклоняем гипотезу H0 о виде распределения.
В связи с асимптотическим характером закона Пирсона χ2 должны выполняться следующие условия:
1)выборка должна образовываться в результате случайного отбора;
2)объем выборки n должен быть достаточно большим (практически не менее 50 единиц);
3)численность каждой группы должна быть не менее 5 (если это условие не выполняется, производится объединение малочисленных интервалов).
Пример:
На экзамене экзаменатор задает студенту только один вопрос по одной из четырех частей курса. Из 100 студентов 26 получили вопрос по первой части, 32 - по второй, 17 - по третьей, остальные - по четвертой. При уровне значимости α=0,05 проверить гипотезу, что вероятность получить вопрос по любой из четырех частей для пришедшего на экзамен одинакова.
Объемы выборки и групп n =100 , m1 = 26 , m2 = 32 , m3 =17 , m4 =100 −(26 +32 +17)= 25 . Вероятность получить вопрос по любой из че-
тырех частей одинакова, т.е. pi = p = 0,25 , |
npi = 25; |
(i =1,2,3,4). |
|||||||||
Наблюдаемое значение критерия |
|
|
|
|
|
|
|
||||
χ2 |
= |
(26 −25)2 |
+ |
(32 −25)2 |
+ |
(17 −25)2 |
+ |
(25 −25)2 |
= |
||
|
|
|
|
|
|
||||||
набл |
|
25 |
|
25 |
|
|
|
25 |
|
25 |
|
|
|
|
|
|
|
|
|
||||
|
|
= |
1+49 +64 |
= |
114 |
= 4,56 . |
|
|
|
||
|
|
|
|
25 |
|
25 |
|
|
|
|
Так как ни один из параметров предполагаемого распределения не находился по выборке, то k = 0 б q = 4 и число степеней свободы
ν = 4 −(1+0)= 3 . По таблице для ν = 3 и α=0,05 находим критическую
точку χкр2 = 7,82 . Так как χнабл2 = 4,56 < χкр2 = 7,82 , гипотеза о равновероятности получить вопрос по любой из четырех частей курса не отвергается.
Пример:
Распределение признака Х в выборке задано интервальным вариационным рядом (первый и второй столбцы таблицы).
При уровне значимости α=0,05 проверить гипотезу о нормальном распределении Х в генеральной совокупности.
|
* |
|
* |
|
* |
−mi ) |
2 |
|
(m*i −mi )2 |
|
xi |
mi |
mi = n∆Ф |
mi |
−mi |
(mi |
|
|
|
|
|
|
|
mi |
|
|||||||
|
|
|
|
|
|
|
|
|
|