
- •1. Простые и сложные статистические гипотезы.
- •2. Проверка статистических гипотез
- •3. Построение критерия проверки гипотезы.
- •1. Проверка гипотез о значении параметров распределения
- •2. Критерий согласия Пирсона
- •Выборочная линейная среднеквадратическая регрессия
- •Свойства линейной регрессии и коэффициента корреляции.
- •3. О множественной регрессии
- •4. О нелинейной регрессии
1. Проверка гипотез о значении параметров распределения
Пусть случайная величина Х распределена нормально по закону N(а, ) с неизвестными параметрами а, и наблюдается в выборке хB={xi, n} объема n. Нормальный закон распределения N(а,) задается следующей функцией плотности распределения вероятности:
fX(x)=;
M[Х]=а, D[Х]=.
По
данным выборки хВ={хi,
n}
могут быть получены выборочное среднее
и выборочный стандарт
:
=
,
=
.
Эти
величины являются случайными и по ним
могут быть построены оценки математического
ожидания
и дисперсии
наблюдаемой в выборке
случайной величины Х.
Ниже проверим ряд простых статистических гипотез об истинных значениях параметров нормальной случайной величины Х.
1.1. Н0={а=а0}. Проверим сначала гипотезу о равенстве значения истинного (гипотетического) математического ожидания а некоторой величине а0. Основная гипотеза тем самым будет следующей Н0={а=а0}. В качестве критерия К возьмем случайную величину имеющую, при справедливости основной гипотезы, распределение Стьюдента с n-1 степенями свободы:
fK(
k
H0 )
=t(k,n-1),
М[K]=0,
D[K]=(n-1)/(n-3)
Задаваясь уровнем значимости для проверяемой гипотезы Н0 , будем строить критическую область Ккр в зависимости от вида единственной конкурирующей (альтернативной) гипотезы H1 в следующих случаях:
Случай А: Н1={а>а0}. В этом случае при справедливости конкурирующей гипотезы ожидаем сдвиг вероятных значений критерия К в большую сторону (рис.14.1), поэтому критическая область критерия будет правосторонней Ккр={k>kкр}. Критическая точка kкр однозначно определяется из условия равенства вероятности ошибки I-рода заданному уровню значимости P(k>kкр) = .. Решение этого уравнения kкр=Tкр(, n-1) представляет собой правостороннюю квантиль распределения случайной величины Стьюдента и приводится в приложении 3.
Рис. 14.1 Критические области гипотезы Н0={а=а0}.
Случай Б: Н1 ={а<а0}. В этом случае критическая область критерия будет левосторонней Ккр={k<kкр}, а значения критерия отрицательными (рис.14.1). Критическая точка kкр определяется из уравнения P(k<kкр)=, решение которого, в силу симметрии распределения Стьюдента, будет следующим kкр=Tкр(, n-1).
Случай В: Н1={а а}. В этом случае критическая область критерия будет двухсторонней Ккр={k<kкр.л ; k>kкр.п }. Однако здесь критические точки kкр.л и kкр.п не определяются однозначно из уравнения P(k<kкр.л)+P(k>kкр.п)=Доказано [9], что при условии P(k<kкр.л)=и P(k>kкр.п) = мощность критерия 1- по отношению к конкурирующей гипотезе Н1 будет максимальной, тогда из этих уравнений критические точки находятся однозначно и представляет собой двухстороннюю квантиль распределения случайной величины Стьюдента:
kкр.л =кр( , n-1); kкр.п =Tкр( , n-1).
Рассмотрим
числовой пример: Пусть по выборке объема
n=16 получена оценка
математического ожидания наблюдаемой
нормальной случайной величины
=10,2
и оценка среднеквадратического
отклонения S=6,5.
Поскольку каждая оценка есть величина
случайная (получена по конкретной
случайной выборке), то проверим гипотезу
о том, что истинное математическое
ожидание наблюдаемой величины равна
15 т.е. Н0 ={а=15}.
Зададимся уровнем значимости гипотезы
и
альтернативной гипотезой Н1={а}.
Наблюдаемое значение критерия
kнабл=(10,2-15)4/6,5=-2.954.
Критическая область Ккр
двухсторонняя, а критические точки
будут:
kкр.л =-Tкр( , 15) =-2,13; kкр.п =+Tкр( 0.025, 15)=2,13
Видим, что kнабл принадлежит критической области и значит, гипотеза отвергается, т.е. отличие наблюдаемого значения математического ожидания от гипотетического значительны.
1.2. Н0={=}. Проверим теперь гипотезу о том, что истинная (гипотетическая) дисперсия случайной величины равна Проверяемая гипотеза Н0={=}. В качестве критерия возьмем одномерную случайную величину К, имеющую распределение «хи-квадрат» с n-1 степенями свободы:
,
fK(
k
H0 )
=2(k,n-1),
M[K]=(n-1),
D[K]=
2(n-1).
Задаваясь уровнем значимости для проверяемой гипотезы Н0 будем строить критическую область Ккр в зависимости от вида единственной конкурирующей (альтернативной) гипотезы H1 в следующих случаях (рис.14.1),:
Случай А: Н1={>}.
В этом случае при справедливости
конкурирующей гипотезы ожидаем сдвиг
наиболее вероятных значений критерия
К в большую сторону, поэтому
критическая область будет правосторонней.
Рис. 14.2 Критические области гипотезы Н0={=}.
критическая точка kкр здесь однозначно определяется согласно общего подхода к построению критических областей критерия из условия равенства вероятности ошибки I-рода заданному уровню значимости :
P(k>kкр)
=
=
Решение этого уравнения kкр =2кр(, n-1) находятся однозначно и представляет собой правостороннюю квантиль распределения «хи-квадрат» случайной величины и приводится в приложении 4.
Случай Б: Н1 ={ < }. В этом случае критическая область критерия будет левостороннейа критическая точка однозначно определяется из уравнения :
P(k<kкр)
=
=
Таблиц его решений обычно не строится, поскольку левосторонняя критическая точка может быть легко выражена через функцию для правосторонней критической точки. Действительно, т.к. P(k<kкр)+ (k>kкр)=1, то P(k>kкр)=1- и тогда решение для левосторонней точки будет следующим kкр =2кр(1-, n-1).
Случай В: Н1={ }. В этом случае, объединяющем два предыдущих случая, критическая область критерия будет двухсторонней
однако здесь критические точка kкр.л , kкр.п не определяется однозначно из уравнения
P(k<kкр.л)
+ P(k>kкр.п)
=
= 1-
Доказано [9], что при условиях P(k<kкр.1)= и P(k>kкр.2)=мощность критерия 1- по отношению к конкурирующей гипотезе Н1 будет максимальной, тогда из этих двух условий критические точки находятся однозначно:
kкр.л =2кр( 1-, n-1); kкр.п =2кр( , n-1).
Рассмотрим числовой пример: Пусть по выборке объема n=15 получена оценка дисперсии наблюдаемой нормальной случайной величины S2=40,25 или оценка среднеквадратического отклонения S=6,5. Поскольку, каждая оценка есть величина случайная (получена по конкретной случайной выборке), то проверим гипотезу о том, что истинная дисперсия наблюдаемой величины равна 36 т.е. Н0={=36}. Зададимся уровнем значимости гипотезы и альтернативной гипотезой Н1 ={ }.
Наблюдаемое значение критерия kнабл =(15-1)40.25/36 =15.653. Критическая область Ккр двухсторонняя, а критические точки будут:
kкр.л =2кр( 1-, 14) = 5.63; kкр.п =2кр( 0.025, 14) =26.1
Видим, что kнабл не принадлежит критической области и значит, гипотеза принимается, т.е. отличия наблюдаемого значения дисперсии от гипотетического незначительны. Если бы такая оценка дисперсии была получена по выборке меньшего объема n=7, то
kкр.л =2кр( 1-, 6) = 14.4; kкр.п =2кр( 0.025, 6) =1.24;
тогда наблюдаемое значение критерия kнабл попадает в критическую область и проверяемая гипотеза отвергается.
Отметим, что при проверке гипотез Н0={а=хср} и Н0={=S2} при уровне значимости будут построены двухсторонние критические области такими, что область принятия гипотез Кпр совпадет с доверительными интервалами, построенными с надежностью ..