
Ответы к ГОСу / 11
.DOC11. Проверка гипотез. Критерий χ2. Ошибки 1-го и 2-го рода. Лемма Неймана-Пирсона.
Статистической гипотезой называют любое предположение распределения СВ X.
Примерами гипотез явл.:
1) гипотеза о в-не мат. ожидания
a = a0
a = Mx
2) гипотеза об однородности дисперсии (равенстве)
(примечание : б – это сигма)
б12 = б22 , где б12 = DX1 , б22 = DX2
Статистические гипотезы относительно неизвестного истинного значения Ө наз-ют параметрическими.
Ф-я распределения СВ X в этом случае предполагается с точностью до неизвестного параметра Ө.
Рассмотрим параметрические гипотезы:
статист. гипотезу H наз-ют простой, если она имеет вид: Ө = Ө0 , где Ө0 – заданное значение параметра. гипотезу H наз-ют ложной, если она имеет вид:
H: Ө Є D, где D – некоторое мн-во значений параметра Ө, состоящее более чем из одного элемента.
Примерами сложных гипотез явл.: Ө<Ө0 , Ө>Ө0 , Ө ≠ Ө0
Рассмотрим случай проверки двух больших гипотез вида:
H0 : Ө = Ө0 , H1 : Ө = Ө1 , где Ө0 , Ө1 – два заданных различных значения параметра Ө .
Гипотезу H0 наз-ют основной, а гипотезу H1 альтернативной или конкурирующей. По данным конкретной выборки ( x1, x2,…, xn)= xn (с чертой сверху) необходимо принять решение о справедливости одной из указанных гипотез.
Критерием или статист. критерием проверки гипотез наз-ют правило, по которому по данным выборки необходимо принять решение о справедливости одной из гипотез. Критерий задают с помощью критического мн-ва: W c xn , где xn – выборочное прост-во случ. выборки xn (с чертой сверху)=( x1, x2,…, xn). Т.обр. принимается решение:
1) если конкретная выборка xn (с чертой сверху) Є W, то H0 отклоняется и принимается гипотеза H1 (гипотезу H1 при этом считают доказанной);
2) если xn (с чертой сверху) не принадлежит W, то принимается гипотеза H0 и отклоняется гипотеза H1 (гипотеза H0 при этом считается непротиворечивой данной выборке).
При использовании любого критерия возможны ошибки 1-го и 2-го рода.
Ошибка 1-го рода – это принять альтернативную гипотезу H1 , когда верна основная H0 , т.е. ошибка отклонения от правильной основной гипотезы.
Ошибка 2-го рода – это принять основ. гипотезу H0 , когда верна альтернат-я гипотеза H1(т.е. это ошибка состоящая в принятии неправильной основной гип-зы).
Вероятность α совершить ошибку первого рода вычисляют по формуле:α =P(xn(с чертой сверху) Є W│H0) и наз-ют ур-ем значимости критерия
Вероятность β совершить ошибку второго рода вычисляют по формуле:β = P ( xn(с чертой сверху) Є W(с чертой сверху) │H1), а в-ну (1-β) наз-ют мощностью критерия (вер-сть отклонить осн. гипотезу H0, когда она неверна).
При построении критерия для проверки параметрических гипотез, как правило стараются max его мощность (min вер-сть ошибки второго рода), при фиксир. значении вер-сти α ошибки первого рода.
Одновременно min α и β при заданном V выборки нельзя.
Наиболее мощный критерий при заданном ур-нии значимости α наз-ют оптимальным. Построение оптим. критерия для проверки простых гипотез H0 : Ө = Ө0 , H1 : Ө = Ө1 осуществляют на основании следующей леммы.
Лемма Неймана-Пирсона.
Л.: критическим мн-вом опт. критерия для проверки двух простых гипотез H0 : Ө = Ө0 , H1 : Ө = Ө1 , при заданном уровне значимости α явл. мн-во:
W* = {x(с чертой сверху) Є χn│ φ (xn(с чертой сверху)) ≥ Cφ} , (1)
где const Cφ определяют исходя из усл-я:
P(φ (Xn(с чертой сверху)) ≥ Cφ │H0 ) = α (2)
φ(Xn(с чертой сверху)) = L (X1, X2,…, Xn, Ө1) - ф-я случ.
L (X1, X2,…, Xn, Ө2) выборки
Xn(с чертой сверху)= (X1,X2,…,Xn), называемая отношением правдоподобия.
L (X1, X2,…, Xn, Ө1)
L (X1, X2,…, Xn, Ө2) – ф-ции правдоподобия случ. выборки.
Рассмотрим построение оптим. критерия Н.-Пирсона, при проверке простых гипотез относительно параметра a нормального закона распределения, с известной дисперсией σ2.
H0 : a = a0 , H1 : a = a1
1) a0 < a1 ; 2) a0 > a1 ; 3) a0 ≠ a1
Ф-ция правдоподобия имеет вид:
L (X1, X2,…, Xn, a) = П e / б √2П (П- произведение по i=1 до n, e в степени –(xi - a)2 / 2б2 , √2П – корень из двух пи ) = (1/ б √2П)n * e (e в степени ∑ –(xi - a)2 / 2б2, ∑ i=1 до n )
(3)
Отношение правдоподобия:
φ( x1, x2,…, xn) = L(xn(с чертой сверху), a1) = e
L(xn(с чертой сверху), a0)
( e в степени ∑ [(xi – a1)2 -(xi – a0)2 ]/ 2б2 ,∑ i=1 до n )
∑(xi2 - 2 xi a1+ a12 - xi2 + 2 xi a0 - a02 = -2 ∑(xi ( a1 - a0) + n a12 - na02 = - 2( a1 - a0) ∑xi + n (a12 - a02 ) (∑ по i=1 до n)
φ( x1, x2,…, xn) = e (в степени ( a1 - a0) ∑xi / б2) * e (в степени -(a12 - a02 )n/ 2б2)
Далее необходимо решить неравенство и найти const Cφ :
φ (Xn(с чертой сверху)) ≥ Cφ (4)
(4) ~ ∑xi ≥ C (с волной) (5) , где
C (с волной) = б2(ln Cφ- n( a1 - a0)2/2 б2)/ ( a1 - a0)
C (с волной) выбирают из усл-я :
P (∑xi ≥ C (с волной)│a=a0) = α
Так как СВ Xi имеет нормальный з-н распределения:
Xi ~ N( n a0, б√n)
∑xi /n = X (c чертой сверху) ~ N(a0, б / √n)
P(∑xi≥C(с волной)│a=a0)= P(C (с волной) ≤ ∑xi <∞│a=a0) = Ф(∞) – Ф ((C (с волной) - na0) / б √n) =
= 1- Ф ((C (с волной) - na0) / б √n)
1- Ф ((C (с волной) - na0) / б √n) = α (6) =>C(с волной) = ?
Ф ((C (с волной) - na0) / б √n) = 1 - α
Пусть (C (с волной) - na0) / б √n = Uα
Ф(Uα) = 1 – α (7)
Решая ур-е (7) относительно неизвестного аргумента Uα при заданном α (н-р с помощью статистических таблиц), находим Uα и следует
С(с волной)= Uα б √n +nao
С(с волной)= nao + Uα б √n
При этом вероятность ошибки 2-го рода
β=Р(∑xi <C (с волной)/ а=а1)=Ф(C(с волной)-nа1 / б √n )
будет минимальной при заданном значении α. Таким образом критерий для проверки 2-х простых гипотез будет определяться множеством :
W*={xn(c чертой сверху)Єχn │∑xi = x(c чертой сверху)n > nao + Uα б √n }
W*={ xn(c чертой сверху)Єχn │x(c чертой сверху) > ao + +Uα б / √n }
т.е. оптим-м критическим множеством явл-ся множ-во всех значений случ. выборок, для которых среднее арифметическое выборки удовлетворяет условиям Х(с чертой) > а0 + Uαб/ √n(если это условие выполняется , то основная гипотеза отклоняется, в противном случае принимается)
Аналогично для случая ao > а1 оптимальное критическое множество : W* = { xn(c чертой сверху)Єχn │x(c чертой сверху) < ao - Uα б / √n }
Если же проверяется гипотеза ao ≠ а1, то оптимальное критическое множество :
W* = { xn(c чертой сверху)Єχn │(x(c чертой сверху) < ao - Uα/2 б / √n ) U(объединение)( x(c чертой сверху) > ao + +Uα/2 б / √n)}
На практике для проверки параметрических гипотез поступают след. образом:
- вводят в рассмотрение статистику критерия (необходимую СВ, з-н распределения которой, при условии, что основная гипотеза верна, известен) и строят в этом случае не критич. мн-во W, а критич. мн-во значений статистики критерия. Например в случае проверки двух простых гипотез H0 : a = a0 , H1 : a = a1 , при известной дисперсии б2 в качестве статистики критерия рассматривают СВ:
U = (x(c чертой сверху) - ao ) / б / √n ) , которая имеет стандартный норм. з-н распределения и строят критич. мн-во значений статистики критерия.
В случае:a1 > a0 (Uα, +∞)
a0 > a1 (-∞, - Uα)
a0 ≠ a1 (-∞, - Uα/2) U(объединение) (Uα/2, +∞),
где Uα, Uα/2 – критические точки статистики критерия , вычисляемые по заданному α.
Схема проверки параметрических гипотез выглядит так:
1) по выборке xn (с чертой сверху)=( x1, x2,…, xn) вычисляют наблюдаемое значение статистики критерия;
2) по заданному уровню значимости α вычисляют критические точки статистики критерия и строят критич. мн-во значений статистики критерия;
3) принимают статистическое решение: если Uнаблюдаемое Є критическому мн-ву, то основную гипотезу H0 отклоняют и принимают альтернативную гипотезу, в противном случае принимают основную гипотезу H0.