Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

3643

.pdf
Скачиваний:
0
Добавлен:
21.11.2023
Размер:
378.8 Кб
Скачать

2.1. Предполагая, что наблюдаемая величина Х имеет нормальное распреде-

ление, построим доверительные интервалы для математического ожидания a=М[X]

и среднеквадратического отклонения σ= D( X ) при уровне надежности γ=0,95.

Поскольку известно, что величина t=(Хср-а) n /S имеет распределение Стью-

дента с n-1 степенью свободы, то решая уравнение Р( | t |<tγ )=γ относительно tγ

можно построить симметричный интервал ХВ -εγ <а<ХВ +εγ, в котором с вероятно-

стью γ находится математическое ожидание а. Величина εγ=tγS/ n представляет со-

бой точность оценки. Решение tγ=t(γ,n-1) есть обращенное распределение Стьюден-

та, оно протабулировано и может быть найдено и таблиц, например из [1,2 прило-

жение 3]. В рассматриваемом примере tγ =t(0,95;29)=2,045 , εγ = 2,045*2,758/ 30

=1,03 и тогда доверительный интервал для математического ожидания будет

6,367 -1,03< a < 6,367+1,03 или 5,337< a < 7,397.

Для нахождения доверительного интервала оценки среднеквадратического от-

клонения σ воспользуемся тем, что величина

χ2=(n-1)S22 имеет распределение «Хи-квадрат» с n-1 степенью свободы. Задав-

шись надежностью интервальной оценки γ и решая уравнение

P2 < χ 2

< χ 2 ) = γ от-

 

 

 

 

 

 

1

 

2

носительно σ2 можно построить доверительный интервал. Определяя χ 2

, χ 2 из таб-

 

 

 

 

 

 

 

1

2

лиц, например [1,2 приложение

5],

переходим к эквивалентному

уравнению

P{(n −1)s2 / χ 2

< σ 2 < (n −1)s2

/ χ 2 } = γ ,

построим доверительный интервал для

σ в виде

 

2

 

1

 

 

 

 

 

σ

<σ<σ

. В нашем примере для

γ=0.95 получим χ 2 = 16.05, χ 2 = 45.72 , тогда до-

min

max

 

 

1

2

 

 

верительный интервал будет

 

 

 

 

 

 

4,92 < σ2 < 14,08

или

2,22 < σ< 3,75.

 

 

 

 

В нем оцениваемый параметр σ находится с вероятностью γ=0,95

 

 

2.2. Отметим, что построенные доверительные интервалы являются областями принятия гипотез Н0={а=Хср} и Н0={σ=S} при их проверке с уровнем значимости

α=1-γ. Теперь проверим гипотезу о равенстве математического ожидания и диспер-

сии наблюдаемой случайной величины указанным в задании гипотетическим значе-

ниям σ=0,8S, а=1,2Хср.

30

Проверим сначала гипотезу о том, что истинная дисперсия наблюдаемой ве-

личины равна s=0,8S, т.е. Н0={s=0,8*2,785=2,228}. Зададимся уровнем значимости гипотезы a1=0,05 и альтернативными гипотезами Н1 ={s ¹2,228} или Н2

={s>2,228}. Для проверки основной гипотезы воспользуемся критерием «Хи-

квадрат» К=(n-1)(S/s)2.

Наблюдаемое значение критерия kнабл =(30-1) (2,785/2,228)2 =45,313. Крити-

ческая область Ккр при альтернативной гипотезе Н1 двухсторонняя, а критические точки найдем из таблиц kкр.л = c2кр( 1-0.025; 29) = 16,047, kкр.п= c2кр( 0.025; 29) =45,722. Видим, что kнабл не принадлежит критической области и значит, гипотеза принимается, т.е. отличие наблюдаемого значения дисперсии от гипотетического не значительны. Если в качестве альтернативной рассматривать гипотезу Н2, по-

скольку s <S значительно (20%), то при этом критическая область будет правосто-

ронней, а критическую точку kкр= c2кр( 0.05; 29) =42,557 найдем из таблиц. Тогда наблюдаемое значение критерия kнабл =45,313 попадает в критическую область и проверяемая гипотеза отвергается. Результат проверки гипотезы при различных аль-

тернативах оказался разным, в итоге гипотеза отвергается.

Проверим теперь гипотезу о том, что истинное математическое ожидание на-

блюдаемой величины равна а=1,2Хср, т.е. Н0={а=1,2*6,367=7,64}. Зададимся уров-

нем значимости гипотезы a1=0,05 и альтернативными гипотезами Н1 ={а ¹7,64}

или Н2 ={а<7,64}. Для проверки основной гипотезы воспользуемся критерием

Стьюдента К=(Хср-а) n /S.

Наблюдаемое значение критерия kнабл=(6,367-7,64) 30 /2,785=-2,504. Крити-

ческая область Ккр при альтернативной гипотезе Н1 двухсторонняя, а критические точки найдем из таблиц kкр.л= Ткр(0.025; 29) = -2,045, kкр.пкр(0.025; 29) = 2,045.

Видим, что kнабл принадлежит критической области и значит, гипотеза отвергает-

ся, т.е. отличие наблюдаемого значения дисперсии от гипотетического значительны.

Если в качестве альтернативной рассматривать гипотезу Н2, поскольку а>Хср зна-

чительно (20%), то критическая область левосторонняя, а критическая точка

31

kкр= −Ткр(0.05, 29)=-1,699, тогда наблюдаемое значение критерия kнабл=-2,504 попа-

дает в критическую область и проверяемая гипотеза опять отвергается. Результат проверки гипотезы при различных альтернативах оказался одинаковым, в итоге ги-

потеза отвергается.

2.3. Проверим гипотезу об однородности выборки, т.е. гипотезу о равенстве математического ожидания и дисперсии случайных величин, наблюдаемых в первой и второй половинах имеющейся выборки.

Разобьем выборку на две равные части объемов n1=15, n2=15 и вычислим по ним выборочные средние и выборочные стандарты

Хср1=5,8, Хср2=6,93, S1=2,957, S2=2,576.

Основная проверяемая гипотеза Н0={s1=s2 , а1=а2 }. Зададимся уровнем зна-

чимости гипотезы a2=0,05 и альтернативными гипотезами Н1={s1¹s2} или

Н2={а1¹а2}, поскольку отличия в значениях Хср , S для разных частей выборки не существенны (менее чем 16%).

Для проверки основной гипотезы по отношению к альтернативной гипотезе

Н1 воспользуемся критерием Фишера

max(S , S )

K= 1 2

min(S1 , S2 )

2

>1

Наблюдаемое значение критерия kнабл=1,317. Критическая область Ккр при альтернативной гипотезе Н1 правосторонняя, а критическую точку найдем из таблицkкр = Fкр( 0.05;15;15) =2,403. Видим, что kнабл не принадлежит критической

области и значит, гипотеза принимается. Если в качестве альтернативной рас-

сматривать гипотезу Н2, то для проверки основной гипотезы воспользуемся крите-

рием Стьюдента

 

 

 

X ср1 Хср2

 

 

 

 

 

 

 

 

 

 

К=

 

 

 

 

 

n n

2

(n + n

2

− 2)

,

 

 

 

 

 

1

1

 

 

 

 

 

 

 

 

 

 

 

n1 + n2

 

(n

−1)S 2

+ (n

2

−1)S 2

 

 

 

 

 

 

 

 

1

1

 

2

 

 

 

 

 

 

 

 

 

Наблюдаемое значение критерия kнабл = -1,119. Критическая область Ккр при этом Н1 двухсторонняя, а критические точки найдем из таблиц

32

kкр.л = Ткр( 0.05/2; 15+15-2) = -2,048, kкр.п = Ткр( 0.05/2; 15+15-2) = 2,048. Видим, что kнабл не принад-

лежит критической области и значит, гипотеза опять принимается, т.е. отличие на-

блюдаемых значений математического ожидания и дисперсии в первой и второй по-

ловине выборки незначительны. Гипотеза об однородности выборки принимается.

Задание 3

3.1. Построим гистограмму выборки ХВ как удобную форму представления

выборочного распределения. Для этого разобьем наблюдаемый интервал значений в выборке на m равновеликих интервалов

xmin= 1; xmax= 12; m=5; = xmax xmin =2,2 m

Количество интервалов разбиения m выбирается исходя из свойств выборки, реко-

мендуется использовать формулу m=1+3,2*lg(n), m=5,73 примем m=5. Граничные точки интервалов hj=[xj , xj+1], j=1,.., m и их центры xj+0.5 вычисляем по формулам следующим образом:

xj= xmin + ( j-1)* ;

xj+0.5= (xj + xj+1)/2.

Подсчитав для каждого интервала частоты попадания в него элементов выборки nj и

относительные частоты ωj =nj/n , сведем все результаты расчета наблюдаемых час-

тот nj, ωj в следующую таблицу3 и построим гистограмму частот рис. 3.

Таблица 3

 

 

 

 

hj

 

 

 

 

1 - 3,2

3,2 - 5,4

5,4 - 7,6

7,6 - 9,8

9,8 - 12

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xj+0.5

 

 

 

2,1

4,3

6,5

8,7

10,9

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

nj

 

 

 

 

6

3

11

7

3

30

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ωj

 

 

 

 

0,2

0,1

0,37

0,23

0,1

1

 

 

 

 

 

 

 

 

 

 

 

 

Теоретические частоты нормальной случайной величины

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

uj=

x j +0.5

Х

ср

-1,55808

-0,7547

0,04869

0,8520761,655462

 

 

 

S

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

njт=

n

ϕ(uj)

2,596642

6,57481

8,73068

6,0800442,220542

26,20272

S

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

χ 2

= (nТj

n j

) 2

 

 

4,4607011,9436710,5898530,1391960,273606

7,407027

j

 

 

 

 

nТ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

33

Теоретические частоты показательной случайной величины

njт= nD ×Λexp( -Λxj+0.5 )

7,454

5,276

3,735

2,644

1,871

21

 

 

 

 

 

 

 

 

χ 2

= (nТj n j ) 2

0,284

0,982

14,135

7,180

0,681

23,26

j

 

nТ

 

 

 

 

 

 

 

 

 

 

 

j

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис.3.

3.2.Используя критерий согласия Пирсона, проверим гипотезу Н0={X~N(a,σ)}

онормальном распределении наблюдаемой случайной величины Х с параметрами

а=Хср, σ=S. Для этого подсчитаем теоретические частоты попадания величины Х в

интервалы hj

njт=nP(xj<Х<xj+1) =n(F (xj+1 )–F(x j)) n *f(xj+0.5).

Поскольку проверяется гипотеза о нормальном распределении то из таблиц находим

значения F(xj)= Ф( õ j X ñð ) , где Ф(u)= функция Лапласа, а f(u) - функция Гаусса.

S

Все результаты расчетов теоретических частот njт приведены в таблице 3 и на рис. 3, где приводится так же и кривая теоретических частот.

Согласно критерия Пирсона величина суммарного отклонения наблюдаемых частот от теоретических

 

m

(n

j

nТ )2

χ2

=

 

 

j

 

 

Т

 

 

j=1

 

 

n j

 

34

при условии справедливости основной гипотезы имеет распределение «хи-квадрат» с m-3 степенями свободы и может быть принята за критерий проверки гипотезы Н0.

Задаваясь уровнем значимости ошибки II-рода (отвергнуть верную гипотезу)

α3=0,01 находим критическую точку критерия из решения уравнения

P(χ2 >χ2кр) =α3.

Его решения представляются обратным «хи-квадрат» распределением и находятся из таблиц χ2кр=χ2(α, m-3), например в [1,2 приложение 5]. Тогда критерий проверки основной гипотезы Н0 о нормальном распределении выборочного признака Х

состоит в следующем:

если χ2набл ≤ χ2кр гипотеза принимается (отклонения

теоретических и наблюдаемых частот не значительны),

если χ2набл > χ2кр гипотеза отвергается (отклонения значительны)

В нашем примере величина χ2набл рассчитана в таблице и ее значение

χ2набл=7,407, а χ2кр=χ2(0,01, 2)=9,2 . Тогда согласно критерию Пирсона гипотеза о нормальном распределении случайной величины Х принимается.

3.3. Теперь проверим гипотезу Н0 ={X ~Е( Λ)} о показательном распределе-

нии наблюдаемой случайной величины Х с параметром Λ=1/Хср.

Теоретические частоты подсчитаем исходя из вида функции плотности показатель-

ного распределения

njт fX(xj+0.5) n ; fX(xj+0.5)= Λ exp( -Λ* xj+0.5 ) .

Рассчитанные теоретические частоты и суммарное относительное отклонение на-

блюдаемых и теоретических частот приводятся так же в таблице 3 и отражены на рис. 3 .

Из таблицы видно, что наблюдаемое значение критерия при проверке гипоте-

зы χ2набл=23,26 принадлежит правосторонней критической области, так как крити-

ческая точка χ2кр=χ2(0,01, 5-2)=11,3. Тогда согласно критерию Пирсона гипотеза о показательном распределении наблюдаемой случайной величи-

ны Х отклоняется.

35

Задание 4

Пусть в опыте наблюдается одновременно значения двух случайных величин

Х, Y (двух признаков). В результате получена двухмерная выборка объема n=30

приведенная в таблице 4.

4.1. Вычислим выборочные средние Хср, Yср выборочные дисперсии Dx, Dy и

среднеквадратические отклонения σ, σпо каждому из признаков (признак X

рассчитан в Задании 1 )

 

 

 

Xср=6,367; σx=2,738;

Yср=13,39; σy=4,543

Выборочный коэффициент корреляции между наблюдаемыми случайными

величинами вычислим по формуле:

где ( XY )ср = 1 X iYi

ρВ = (XY)ср ХсрYср ,

 

 

 

 

 

n

 

σ XσY

 

 

n i=1

получим выборочное среднее произведение (XY)ср =91,943 и коэффициент корре-

ляции ρВ= 0,538.

 

 

 

 

 

 

 

 

Таблица 4.

 

 

 

 

 

 

 

 

 

 

i

X

Y

i

X

Y

i

X

Y

 

 

 

 

 

 

 

 

 

 

 

1

2

14,7

11

8

13,3

21

6

9,9

 

2

5

4,4

12

6

4,9

22

7

17,5

 

3

7

19,9

13

2

6,5

23

3

6,3

 

4

1

5,2

14

3

15,1

24

9

17,9

 

5

12

14

15

7

14,8

25

4

15

 

6

5

7,9

16

6

18

26

7

15,3

 

7

9

19,6

17

8

20

27

6

15

 

8

6

11,3

18

3

3,8

28

8

12,2

 

9

8

14,2

19

8

17,7

29

11

12,6

 

10

6

12

20

12

17,5

30

6

14,7

 

 

 

 

 

 

 

 

 

 

 

Построим прямую линейной среднеквадратической регрессии

 

 

Y = ρ

 

σ Y

(x X

 

)

y

 

 

B σ

 

 

1

ср

X

 

ср

 

 

 

 

 

 

 

 

 

 

Вычислим коэффициенты этой прямой и получим ее уравнение y1 = 0,893x + 7,706 .

Оно представляет собой линейное приближение уравнения регрессии y = M [Y x] и

36

построено методом наименьших квадратов, т.е. сумма квадратов отклонения на-

блюдаемых в выборке точек (xi, yi) от соответствующих точек прямой (xi, y1 (xi)) яв-

ляется минимальной среди всех возможных прямых. Построенная прямая приведена на рис. 4, на нем же приведены и точки выборки.

 

Прямая линейной

 

 

среднеквадратической регрессии

25

 

 

 

20

 

 

 

15

 

 

Y

 

 

 

10

 

 

Y"

5

 

 

 

0

 

 

 

0

5

10

15

 

 

Рис.4.

 

4.2. Выборочный коэффициент корреляции ρВ является случайной величиной,

поэтому полученное на нашей выборке значение ρВ = 0,538 может не отражать ис-

тинного значения коэффициента корреляции ρ(X,Y).

Проверим гипотезу о значимости выборочного коэффициента корреляции, это позволит судить о наличии корреляционной связи между признаками Х и Y. В каче-

стве основной гипотезы возьмем предположение об отсутствии корреляции

Н0={ρ=0}, допустим так же что двухмерная случайная величина (X,Y) имеет нор-

мальное распределение. Примем за критерий случайную величину

Т= ρ B

 

 

n − 2

 

 

,

 

 

 

 

 

 

 

 

 

 

1 − ρ B2

которая, при справедливости основной гипотезы, имеет распределение Стьюдента с n-2 степенями свободы. Тогда, задаваясь уровнем значимости ошибки II-рода

37

(отвергнуть верную гипотезу) a4=0,05 и альтернативной гипотезой Н0={0},

находим критические точки двухсторонней критической области из решения уравнения

P(t >tкр) =a4

Эти решения представляются обратным распределением Стьюдента и находятся из таблиц tкр=Ткр(a/2; n-2), например в [1,2 приложение 6]. Тогда критерий проверки основной гипотезы Н0 об отсутствии корреляции между X и Y состоит в следующем:

если |tнабл | £ tкр

гипотеза принимается ( найденный коэффициент

корреляции не значителен, случайно отличен от нуля),

если |tнабл | > tкр

гипотеза отвергается (корреляция значительна )

В нашем примере tнабл =3,377, а tкркр(0,025,28)=2,05 и тогда согласно крите-

рию гипотеза об отсутствии корреляции наблюдаемых случайных величин Х и Y

отвергается, т.е. найденный выборочный коэффициент корреляции значим.

38

Литература

1. Гмурман В.Е. Теория вероятностей и математическая статистика.

М.,

“ Высшая школа”, 2001.

2.Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистике. М., “ Высшая школа”, 2001.

3.Большев Л.Н., Смирнов Н.В. Таблицы математической статистики.

М., “ Наука”, 1965.

4. Смирнов Н.В., Дунин-Барковский И.В. Курс теории вероятностей и математической статистики для технических приложений. М., “ Наука”, 1969.

Содержание

1.

Введение…………………………………………………………

…..3

2.

Простые и сложные статистические гипотезы ……………….…

..3

3.Проверка статистических гипотез …………………………………4

4.Построение критерия проверки гипотезы …………….……..……6

5.Примеры построения критериев проверки гипотез о значении

 

параметров распределения нормальной случайной величины ...8

6.

Примеры построения критериев значимости………………

.. ….14

7.

Критерий согласия Пирсона ……………………..………………..18

 

8.

Задания для выполнения расчетно-графических работ ………

....23

9.

Пример выполнения расчетно-графической работы .….……

.......28

 

Литература ………………………………….…………………..…..39

 

 

39

 

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]