Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

3666

.pdf
Скачиваний:
1
Добавлен:
21.11.2023
Размер:
381.31 Кб
Скачать

Ккр = {k>kкр},

 

/////// a

/////////////

 

 

 

kкр

К

Критическая точка kкр

здесь однозначно определяется согласно общего под-

хода к построению критических областей критерия из условия

равенства вероятности ошибки I-рода заданному уровню значимости α:

P(k>kкр) = χ 2 (k, n − 1)dk = α

kкр

Решение этого уравнения kкр = χ2кр(α, n-1) находятся однозначно, представ-

ляет собой обращение функции распределения «хи-квадрат» случайной величины и

приводится в таблицах, например в [1, 2].

 

 

 

 

Случай Б: Н

1

={σ2 < σ 2}. В этом случае

критическая область критерия будет

 

0

 

 

 

 

 

левосторонней

 

 

 

 

 

 

 

Ккр = {0<k<kкр},

 

///////

a ////////

 

 

 

 

 

 

 

kкр

К

а критическая точка однозначно определяется из уравнения

 

 

kкр

P(k<kкр) = χ 2 (k, n − 1)dk = α

0

Таблиц его решений обычно не строится, поскольку левосторонняя критиче-

ская точка может быть легко выражена через функцию для правосторонней крити-

ческой точки. Действительно, т.к. P(k<kкр)+ (k>kкр)=1, то P(k>kкр)=1- α и тогда решение для левосторонней точки будет следующим kкр = χ2кр(1-α, n-1).

Случай В: Н1={σ2¹ σ02}. В этом случае, объединяющем два предыдущих слу-

чая, критическая область критерия будет двухсторонней

Ккр = {k<kкр.л ; k>kкр.п },

//// a/2 ////

////// a/2 //////

10

kкр.л

kкр.п

К

однако здесь критические точка kкр.л , kкр.п не определяется однозначно из уравне-

ния

kкр.п

P(k<kкр.л) + P(k>kкр.п) = χ 2 (k, n −1)dk = a

kкр. л

Доказано [1], что при условиях P(k<kкр.л)=a/2 и P(k>kкр.п)=a/2 мощность критерия

1-b по отношению к конкурирующей гипотезе Н1 будет максимальной, тогда из этих двух условий критические точки находятся однозначно:

kкр.л = c2кр( 1-a/2, n-1); kкр.п = c2кр( a/2, n-1).

Рассмотрим числовой пример: Пусть по выборке объема n=15 получена оцен-

ка дисперсии наблюдаемой нормальной случайной величины S2=40,25 или оценка среднеквадратического отклонения S=6,5. Поскольку, каждая оценка есть величина случайная (получена по конкретной случайной выборке), то проверим гипотезу о том, что истинная дисперсия наблюдаемой величины равна 36 т.е. Н0={s2=36}. За-

дадимся уровнем значимости гипотезы a=0,05 и альтернативной гипотезой Н1 ={s2

¹36}.

 

Наблюдаемое значение критерия

kнабл =(15-1)40.25/36 =15.653. Критиче-

ская область Ккр двухсторонняя, а критические точки будут:

kкр.л = c2кр( 1-0.025, 14) = 5.63;

kкр.п = c2кр( 0.025, 14) =26.1

Видим, что kнабл не принадлежит критической области и значит, гипотеза принима-

ется, т.е. отличие наблюдаемого значения дисперсии от гипотетического не значи-

тельны. Если бы такая оценка дисперсии была получена по выборке меньшего объема n=7, то

kкр.л = c2кр( 1-0.025, 6) = 14.4;

kкр.п = c2кр( 0.025, 6) =1.24;

тогда наблюдаемое значение критерия kнабл попадает в критическую область и про-

веряемая гипотеза отвергается.

5.2. Проверим теперь гипотезу о равенстве значения истинного (гипотетиче-

ского) математического ожидания а некоторой величине а0. Основная гипотеза тем

11

самым будет следующей Н0={а=а0}. В качестве критерия К возьмем случайную ве-

личину имеющую, при справедливости основной гипотезы, распределение Стью-

дента с n-1 степенями свободы:

К=(Хср0)

 

/S,

fK( k H0 ) = Т(k,n-1), М[K]=0, D[K]=(n-2)/(n-3)

n

Задаваясь уровнем значимости α для проверяемой гипотезы Н0 будем строить критическую область Ккр в зависимости от вида единственной конкурирующей

(альтернативной) гипотезы H1 в следующих случаях:

Случай А: Н1={а>а0}. В этом случае при справедливости конкурирующей ги-

потезы ожидаем сдвиг вероятных значений критерия К в большую сторону, поэтому критическая область критерия будет правосторонней Ккр={k>kкр}. Критическая точ-

ка kкр однозначно определяется из условия равенства вероятности ошибки I-рода заданному уровню значимости P(k>kкр) = α.

Решение этого уравнения kкр= Tкр(α, n-1) представляет собой обращение функции распределения случайной величины Стьюдента и приводится в многочис-

ленных таблицах, например в [ 1, 2].

Случай Б: Н1 ={ а<а0 }. В этом случае критическая область критерия будет ле-

восторонней Ккр={k<kкр}, а значения критерия отрицательными. Критическая точка kкр определяется из уравнения P(k<kкр)=α, решение которого, в силу симметрии распределения Стьюдента, будет следующим kкр= -Tкр(α, n-1).

Случай В: Н1={а ¹ а0}. В этом случае критическая область критерия будет двухсторонней Ккр={k<kкр.л ; k>kкр.п }. Однако здесь критические точки kкр.л и kкр.п

не определяются однозначно из уравнения P(k<kкр.л)+P(k>kкр.п)=α. Доказано, что при условии P(k<kкр.л)=α/2 ; P(k>kкр.п) =α/2 мощность критерия 1 - β по отноше-

нию к конкурирующей гипотезе Н1 будет максимальной, тогда из этих уравнений

критические точки находятся однозначно:

 

kкр.л = -Ткр( α/2, n-1);

kкр.п кр( α/2, n-1).

12

Рассмотрим числовой пример: Пусть по выборке объема n=16 получена оцен-

ка математического ожидания наблюдаемой нормальной случайной величины

Хср=10,2 и оценка среднеквадратического отклонения S=6,5. Поскольку, каждая оценка есть величина случайная (получена по конкретной случайной выборке), то проверим гипотезу о том , что истинное математическое ожидание наблюдаемой ве-

личины равна 15 т.е. Н0 ={а =15}. Зададимся уровнем значимости гипотезы a=0,05 и альтернативной гипотезой Н1={а¹15}. Наблюдаемое значение критерия kнабл=(10,2-15)4/6,5=-2.954. Критическая область Ккр двухсторонняя, а критиче-

ские точки будут:

kкр.л =-Ткр( 0.025, 15) =-2.13; kкр.п кр( 0.025, 15)=2.13

Видим, что kнабл принадлежит критической области и значит, гипотеза отвергается,

т.е. отличие наблюдаемого значения математического ожидания от гипотетического значительны.

Отметим, что при проверке гипотез Н0={а=Хср} и Н0={s2=S2} при уровне зна-

чимости a, будут построены двухсторонние критические области такими, что об-

ласть принятия гипотез Кпр совпадет с доверительными интервалами, построенными с надежностью g=1-a.

13

6. Примеры построения критериев значимости.

Пусть в опыте наблюдаются две нормально распределенные случайные вели-

чины X, Y с неизвестными значениями математических ожиданий ах, ау и дисперсий

σх2, σу2. Используя выборки ХВ={xj, nx}, YВ={yj, ny} объемов nx и ny, построим оцен-

ки неизвестных параметров случайных величин

ах*ср, аy*=Yср, σх*= Sx, σy*= Sy.

Сравним параметры двух наблюдаемых случайных величин, т.е. проверим гипотезу об однородности дисперсии {σх2 = σу2} и математического ожидания х = ау}.

6.1. Проверим гипотезу об однородности дисперсии Н0={σх2=σу2}. В качестве

критерия примем величину К, распределенную при условии справедливости основной гипотезы по закону Фишера – Снедекора со степенями свободы n1, n2.

K=

Smax2

>1; fK(k)=F(k, n1, n2);

M[K]=n2/(n2-1) >1

Smin2

 

 

 

Где Smax=max(Sx, Sy);

Smin= min(Sx, Sy): n1, n2

объемы выборок с наибольшим и

наименьшим значением стандарта S соответственно. Критическую область критерия строим как обычно исходя из вида альтернативных гипотез.

Случай А. Н1={σх2>σу2} или Н2={σх2<σу2}. Такие гипотезы рассматриваются,

когда имеется основание полагать что дисперсия одной из величин больше другой

(например когда Sx и Sy существенно отличаются по величине своих значений). В

этом случае критическая область будет правосторонней Ккр={k>kкр}, поскольку при справедливости любой из альтернатив, наиболее вероятное значение критерия сме-

щается в право.

Критическая точка kкр однозначно определяется из условия равенства вероятности ошибки I-рода заданному уровню значимости P(k>kкр) = α.

Решение этого уравнения kкр= Fкр(α, n1, n2) представляет собой обращение функции распределения случайной величины Фишера и приводится в многочислен-

ных таблицах, например в [1, 2].

14

Случай Б. Н3={σх2¹sу2}. Такая альтернативная гипотеза рассматривается то-

гда, когда неизвестно какая из величин обладает большей дисперсией. В этом случае

имеются одновременно две альтернативных гипотезы Н1, Н2.

Если рассмотреть критерий К=(Sx/Sy)2, то для него критическая область будет

двухсторонней с критическими точками

kкр.л = Fкр(1-α/2, nх,nу), kкр.п = Fкр(α/2, nх,nу) .

Поскольку, критерии Ки К связаны следующим соотношением:

К = Кпри Sх2 > Sу2 и К = 1/Кпри Sх2 < Sу2,

то правосторонние части критических областей для К и Ксовпадают, а левосторон-

няя часть критической области для Копять же совпадает с правосторонней частью

для критерия К. Таким образом, критическая область

критерия Фишера и в этом случае правосторонняя с критической точкой kкр= Fкр(α/2, n1,n2).

6.2. Проверим теперь гипотезу о равенстве математических ожиданий у наблюдаемых случайных величин Н0={аху} при условии равенства их дисперсии

{σх2=σу2}. В качестве критерия примем величину К, распределенную при условии справедливости основной гипотезы по закону Стьюдента с nх+ nу -2 степенями сво-

боды.

 

 

 

X ср Yср

 

 

 

nx ny (nx + ny

− 2)

 

 

K=

 

 

 

 

 

 

 

 

;

fK(k)=Т(k, nх+ nу -2), M[K]=0

 

 

 

 

 

 

nx + ny

 

(nx

−1)S x2 + (ny

−1)S y2

 

 

 

 

 

 

 

 

 

 

Рассмотрим опять два типа альтернативных гипотез:

Случай А. Н1={аху} или Н2={аху}. Критическая область при наличии таких альтернативных гипотез будет правосторонней или, соответственно, левосторонней и определяемая критическими точками распределения Стьюдента kкр = ±Tкр(α,nх+ nу -2).

Случай Б. Н3={ах¹ау}. Такая альтернативная гипотеза эквивалентна наличию двух равновозможных альтернатив Н1 и Н2. В этом случае критическая область

15

двухсторонняя Ккр={k<kкр.л;

k>kкр.п}

, тогда из условий P(k<kкр.л)=α/2 ;

P(k>kкр.п)=α/2 критические точки находятся однозначно:

kкр.л = -Ткр( α/2,

nх+ nу -2);

kкр.п кр( α/2, nх+ nу -2).

Рассмотрим числовой пример: Пусть по выборкам объема nх=12 nу=8 получе-

ны оценки математических ожиданий наблюдаемых нормальных случайных вели-

чин Хср=10,2; Yср=16,8 и оценки среднеквадратических отклонения Sх=6,5 и Sу=7,4.

Примером подобных данных могут быть показания двух приборов при измерении одной и той же физической величины. Поскольку, каждая оценка есть величина случайная (получена по конкретной случайной выборке), то проверим гипотезу об однородности случайных величин. Сначала проверим гипотезу о равенстве диспер-

сий Н0={σх2=σу2}. Зададимся уровнем значимости гипотезы α=0,02 и воспользуем-

ся критерием Фишера – Снедекора . Поскольку значения Sх=6,5 и

Sу=7,4 отличаются незначительно, то в качестве альтернативной гипотезы примем

Н3 ={σх2 ¹ σу2}. Критическая область односторонняя Ккр={k>kкр}, а критическую точку найдем из таблиц kкр = Fкр(0.02/2, 8,12) = 4,5. Наблюдаемое значение крите-

рия kнабл=(7.4/6.5)2 =1,296 не принадлежит критической области, поэтому гипотеза о равенстве дисперсии принимается.

Поскольку гипотеза о равенстве дисперсии принимается, то проверим теперь гипотезу о равенстве математических ожиданий Н0={ах = ау}. Пусть уровень значи-

мости этой гипотезы α=0.02, а за единственную альтернативную гипотезу примем

Н2={ах < ау} и воспользуемся критерием Стьюдента.

Критическая область левосторонняя Ккр={k<kкр}, а критическую точку найдем из таблиц kкр= -Tкр(0.025, 8+12-2)=-2.1. Наблюдаемое значение критерия kнабл=(10.1-16.8)*9.295/29.122=-2.385 принадлежит критической области, поэтому гипотеза о равенстве математических ожиданий отвергается (наблюдаемые в вы-

борках отличия значительны).

16

6.3. Проверим гипотезу о значимости коэффициента корреляции двух случай-

ных величин X, Y совместно наблюдаемых в выборках ХВ={xj}, YВ={yj} равного объема n . Вычислим выборочный коэффициент корреляции

ρв= n

( XY )ср X срYср

где (XY)ср=

1 xi yi ,

 

 

 

 

 

 

n

 

n − 1

 

S x S y

 

n i=1

Поскольку, отличное от нуля значение ρв характеризует степень зависимости вели-

чин X и Y , то для проверки значимости коэффициента корреляции проверим ги-

потезу Н0={ρ=0} при наличии альтернативной гипотезы Н1={ρ¹0}. В качестве кри-

терия примем величину К, распределенную при условии справедливости основной гипотезы Н0 по закону Стьюдента с n-2 степенями свободы.

К= ρ в

n − 21 − ρ 2

fК(k)= T(k , n-2); М[K] = 0; D[K]=n-2/n-3

 

в

 

Вэтом случае критическая область будет двухсторонней

Ккр={k<kкр.л;k>kкр.п}. Однако здесь критические точки kкр.л , kкр.п не

определяются однозначно из уравнения P(k<kкр.л)+P(k>kкр.п)=α, где α заданный уровень значимости. Доказано, что при условии P(k<kкр.л)=α/2 ;

P(k>kкр.п)=α/2 мощность критерия 1-β по отношению к конкурирующей гипотезе

Н1 будет максимальной, тогда из этих уравнений критические точки находятся од-

нозначно:

kкр.л =-Ткр( α/2, n-2); kкр.п кр( α/2, n-2).

Числовой пример. Пусть в опыте одновременно наблюдаются случайные величины

X, Y и получены выборки ХВ={xj}, YВ ={yj} объема n=15. По ним вычислены выбо-

рочные характеристики Хср=10,2; Yср=16,8;

Sх=6,5 и Sу=7,4; (ХY)ср=160 тогда мож-

но вычислить наблюдаемое значение критерия

 

 

 

 

ρ

 

 

=-0,253

 

 

 

=(15/14)(160-10,2*16,8)/(6,5*7,4)=-0,253; k

 

15 − 2

1 − 0.2532

=-3,618

в

набл

 

 

 

Задаваясь уровнем значимости гипотезы α=0,05 найдем из таблиц критические точ-

ки двухсторонней критической области критерия

kкр=±Ткр(0,05/2;13)= ±2,16. Поскольку kнабл принадлежит критической области т.к.

17

kнабл >kкр, то гипотезу об отсутствии корреляционной зависимости между X, Y

отвергаем. Наблюдаемый коэффициент корреляции значим.

Используемые в различных критериях проверки функции для критических точек правосторонней области Ткр(α; n); Fкр(α; n1 n2); χ2кр(α; n); представляют собой обратные распределения соответствующих величин и приводятся в таблицах

[1; 2]. В случае отсутствия в таблице нужных значений Fкр(α) можно

воспользоваться табличной интерполяцией; например линейной.

При использовании вычислительных средств функции Fкр(α) обычно встроены в программное обеспечение. Так в приложения Excel из среды Microsoft Office в

категории статистических функций «f*» реализованы:

ХИ2ОБР(α; n) = χ2кр(α; n); FРАСПОБР(α; n1 n2)= Fкр(α; n1; n2);

CТЬЮДРАСПОБР(2α; n) = Ткр(α; n); НОРМОБР(1-α; 0; 1) = Фкр(α).

7. Критерий согласия Пирсона.

При рассмотрении критериев проверки гипотез о значении параметров слу-

чайных величин или критериев значимости предполагался вид закона распределе-

ния случайной величины. Закон для непрерывной случайной величины Х задается в общем случае функцией распределения FX(x, θs) или функцией плотности распре-

деления fX(x, θs), где θs параметры распределения s=1,..,r.

Критерием согласия называется критерий проверки гипотезы о предполагае-

мом виде закона распределения. Рассмотрим один из подобных критериев, а именно критерий Пирсона.

Основной гипотезой при проверке является простая гипотеза о виде распреде-

ления с определенными параметрами Н0={ fX(x, θs), s=1,..,r }. Пусть при наблюдении за случайной величиной получена выборка XB={xi, n} объема n. Суть критерия за-

ключается в сравнении частот эмпирических, полученных в наблюдаемой выборке,

и теоретических, вычисленных по виду предполагаемого распределения случайной величины. Эти частоты обычно различаются , но значимо ли это различие? Возмож-

но, это различие случайно и связано с конкретно наблюдаемой выборкой и величи-

18

ной ее объема, а возможно, что эти различия значимы и связаны с неверным пред-

положением о виде распределения случайной величины.

Эмпирические частоты строятся по выборке путем объединения наблюдаемых значений в группы. Это достигается, например, построением гистограммы выборки.

Разобьем наблюдаемый интервал значений в выборке на m равновеликих интерва-

лов:

= (Xmax – X min)/m , Xmax=max(xi) , Xmin=min(xi) .

Граничные точки интервалов разбиения hj=[xj, xj+1] ; j=1,..,m и их центры xj+0.5 вы-

числяются следующим образом хj=Xmin + (j-1) ; xj+0.5=( xj+1+ xj)/2. Подсчитав, чис-

ло значений выборки, попавших в интервал hj, получим эмпирическую частоту nj

или относительную эмпирическую частоту ωj =nj/n попадания Х в интервал hj.

Для построения теоретических частот njт воспользуемся тем, что относитель-

ная теоретическая частота попадания случайной величины в интервал hj есть веро-

ятность попадания случайной величины в этот интервал ωjт=P(xj<X<xj+1). По-

скольку вероятность P(xj<X<xj+1)=FX(xj+1, θs)-FX(xj, θs) или равна приближенно при

малых интервала разбиения

x j +1

P(xj<X<xj+1)= f X (xs )dx fX(x, θs) ,

x j

то теоретическая частота попадания случайной величины Х в интервал hj будет njт=n ωjт или по приближенной формуле njтfX(x, θs)n .

В качестве критерия проверки основной гипотезы Н0 примем случайную величину, характеризующую суммарное относительное отклонение теоретических и

эмпирических частот.

m

(n j nТj )2

К =

 

Т

j=1

n j

Доказано, что распределение случайной величины К при n → ∞ стремится к распре-

делению «хи-квадрат» χ2 с m-r-1 степенями свободы, где m - число интервалов ги-

стограммы, r - число параметров предполагаемого распределения. Принимая за аль-

тернативную гипотезу Н1 гипотезу противоположную основной Н0 и учитывая что

К>0 , можно показать, что критическая область критерия будет правосторонней

19

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]