Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Тема 10

.pdf
Скачиваний:
28
Добавлен:
18.04.2015
Размер:
459.97 Кб
Скачать

Лекции по математике. Тема 10

Страница 11

1. Найти по формуле Бернулли вероятности

Pi появления ровно i событий А в N

испытаниях (i=0,1,2,…,s, где s – максимальное число наблюдавшихся появлений события А в одном опыте, т.е. s N ).

2.Найти теоретические частоты ni′ = n Pi , где n – число опытов.

3.Сравнить эмпирические и теоретические частоты по критерию Пирсона, приняв число степеней свободы k=s-1 (при этом предполагается, что вероятность p появления события А задана, т.е. не оценивалось по выборке и не производилось объединение малочисленных частот).

Если же вероятность р была оценена по выборке, то k=s-2. Если, кроме того, было произведено объединение малочисленных частот, то s – число групп выборки, оставшихся после объединения частот.

Пример 3. Произведено n=100 опытов. Каждый опыт состоял из N=10 испытаний, в каждом из которых вероятность р появления события А равна 0,3. В итоге получено следующее эмпирическое распределение (в первой строке указано число xi появлений события А в одном опыте; во второй строке – частота ni , т.е. число

опытов, в которых наблюдалось xi

появлений события А):

 

xi

0

1

 

2

3

4

5

 

 

ni

2

10

 

27

32

23

6

 

Требуется при уровне значимости 0,05 проверить гипотезу о том, что дискретная величина Х (число появлений события А) распределена по биномиальному закону.

Решение. 1. По формуле Бернулли

Pi = PN (i) = CNi pi q N i

найдем вероятность Pi (i=0,1,2,3,4,5) того, что событие А появится в N=10 испытаниях ровно i раз.

Учитывая, что p=0,3, q=1-0,3=0,7, получим:

P0 = P10 (0) = 0,710 = 0,0282 ; P1 = P10 (1) =10 0,3 0,79 = 0,1211. Аналогично вычислим P2 =0,2335; P3 =0,2668; P4 =0,2001; P5 =0,1029.

2. Найдем теоретические частоты ni′ = n Pi . Учитывая, что n=100, получим: n0=2,82; n1=12,11; n2 =23,35; n3=26,68; n4 =20,01; n5=10,29.

3. Сравним эмпирические и теоретические частоты с помощью критерия Пирсона. Для этого составим расчетную таблицу:

i

n

i

n

n

i

n

(n

i

n)2

(n

i

n)2

/ n

 

i

 

i

 

i

 

i

i

1

12

14,93

-2,93

8,5849

 

 

0,5750

2

27

23,35

3,65

13,3225

 

 

0,5706

3

32

26,68

5,32

28,3024

 

 

1,0608

4

23

20,01

2,99

8,9401

 

 

0,4468

5

6

10,29

-4,29

18,4041

 

 

1,7886

n=100

 

 

 

 

 

 

 

χнабл2 =4,44

Поскольку частота n0 =2 малочисленная (меньше пяти), объединим ее с частотой n1 =10 и

в таблицу запишем 2+10=12; в качестве теоретической частоты, соответствующей объединенной частоте 12, запишем сумму соответствующих теоретических частот:

n0+ n1=2,82+12,11=14,93. Из таблицы находим χнабл2 =4,44.

Дмитриева М.В.

Редакция 31.08.2010

Лекции по математике. Тема 10

Страница 12

По таблице критических точек распределения χ2 по уровню значимости α =0,05 и числу степеней свободы k=5-1=4 находим критическую точку правосторонней критической области χкр2 (0,05; 4)=9,5 (см. Приложение 4).

Так как χнабл2 < χкр2 - нет оснований отвергнуть гипотезу о биномиальном распределении Х.

Проверка гипотезы о равномерном распределении генеральной совокупности.

Задано эмпирическое распределение непрерывной случайной величины Х в виде последовательности интервалов xi1 xi и соответствующих им частот ni , причем

ni = n (объем выборки). Требуется, используя критерий Пирсона, проверить гипотезу о том, что случайная величина Х распределена равномерно.

Правило. [7] Для того чтобы проверить гипотезу о равномерном распределении Х, т.е. по закону

f (x) = 1/(b a)

винтервале(a,b),

0

внеинтервала(a,b),

надо:

1. Оценить параметры a и b – концы интервала, в котором наблюдались возможные значения X, по формулам (через а* и b* обозначены оценки параметров):

a* = xB 3σB , b* = xB + 3σB . 2. Найти плотность вероятности предполагаемого распределения

f (x) =1/(b * a*) .

3. Найти теоретические частоты:

 

n1′ = nP1

= n[ f (x) (x1

a*)] = n

1

 

 

(x1 a*) ;

 

b * a *

 

 

 

 

 

 

 

 

1

 

 

 

 

 

=...

1

= n

 

 

 

(xi xi1 ) ,

(i = 2,3,..., s 1) ;

 

 

 

 

n2

= n3

= ns

b * a *

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ns

= n

 

1

 

 

 

(b * xs1 ) .

 

 

 

 

 

b * a *

 

 

 

 

 

 

 

 

 

 

 

 

 

4. Сравнить эмпирические и теоретические частоты с помощью критерия Пирсона, приняв число степеней свободы k = s 3 , где s – число интервалов, на которые разбита выборка.

Пример 4. Произведено n=200 испытаний, в результате каждого из которых событие А появлялось в различные моменты времени. В итоге было получено эмпирическое распределение, приведенное в таблице (в первом столбце указаны интервалы времени в минутах, во втором столбце – соответствующие частоты, т.е. число появлений события A в интервале). Требуется при уровне значимости 0,05 проверить гипотезу о том, что время появления событий распределено равномерно.

Интервал

Частота

Интервал

Частота

xi1 xi

ni

xi1 xi

ni

2-4

21

12-14

14

4-6

16

14-16

21

6-8

15

16-18

22

8-10

26

18-20

18

10-12

22

20-22

25

Решение. 1. Найдем оценки параметров a и b равномерного распределения по формулам: a* = xB 3σB , b* = xB + 3σB .

Дмитриева М.В.

Редакция 31.08.2010

Лекции по математике. Тема 10

Страница 13

Для вычисления

выборочной средней

xB и выборочного среднего квадратического

отклонения σB

примем середины xi*

интервалов в качестве вариант (наблюдаемых

значений Х). В итоге получим эмпирическое распределение равноотстоящих вариант:

 

xi*

3

5

7

9

 

11

13

15

17

19

21

 

 

ni

21

16

15

26

 

22

14

21

22

18

25

 

Найдем xB =12,31, σ

B =5,81. Следовательно,

 

 

 

 

 

 

 

а*=12,31-1,73*5,81=2,26,

b*=12,31+1,73*5,81=22,36.

2. Найдем плотность предполагаемого равномерного распределения:

f(x) =1/(b * a*) =1/(22,36-2,26)=0,05.

3.Найдем теоретические частоты:

n1′ = nP1 = n[ f (x) (x1 a*)] = n b *1a * (x1 a*) =200*0,05*(4-2,26)=17,4; n2′ = n b *1a * (x2 x1 ) =200*0,05*(6-4)=20.

Длины третьегодевятого интервалов равны длине второго интервала, поэтому теоретические частоты, соответствующие этим интервалам и теоретическая частота второго интервала одинаковы, т.е.

n3′ =... = n9′ = 20 ;

n10′ = n b *1a * (b * x9 ) =200*0,05*(22,36-20)=23,6.

4. Сравним эмпирические и теоретические частоты, используя критерий Пирсона, приняв число степеней свободы k = s 3 =10 3 = 7 . Для этого составим расчетную таблицу:

 

i

n

i

n

n

i

n

(n

i

n)2

(n

i

n)2

/ n

 

 

i

 

 

i

 

i

 

i

i

 

1

21

17,3

 

3,7

 

13,69

 

 

0,79

 

 

2

16

20

 

 

-4

 

 

 

16

 

 

0,8

 

 

3

15

20

 

 

-5

 

 

 

25

 

 

1,25

 

 

4

26

20

 

 

6

 

 

 

36

 

 

1,8

 

 

5

22

20

 

 

2

 

 

 

4

 

 

0,2

 

 

6

14

20

 

 

-6

 

 

 

36

 

 

1,8

 

 

7

21

20

 

 

1

 

 

 

1

 

 

0,05

 

 

8

22

20

 

 

2

 

 

 

4

 

 

0,2

 

 

9

18

20

 

 

-2

 

 

 

4

 

 

0,2

 

 

10

25

23,6

 

1,4

 

 

1,96

 

 

0,08

 

 

 

 

 

 

 

 

 

 

 

 

 

χнабл2 =7,17

Из расчетной таблицы получаем χнабл2

=7,17.

 

 

 

 

 

 

 

Найдем по таблице критических точек распределения χ2 (см. Приложение 4) по уровню значимости α =0,05 и числу степеней свободы k = s 3 =10 3 = 7 находим критическую точку правосторонней области χкр2 (0,05; 7)=14,1.

Так как χнабл2 < χкр2 - нет оснований отвергнуть гипотезу о равномерном распределении Х. Другими словами, данные наблюдений согласуются с этой гипотезой.

Дмитриева М.В.

Редакция 31.08.2010

Лекции по математике. Тема 10

Страница 14

Проверка гипотезы о распределении генеральной совокупности по показательному закону.

Задано эмпирическое распределение непрерывной случайной величины Х в виде последовательности интервалов xi xi+1 и соответствующих им частот ni , причем

ni = n (объем выборки). Требуется, используя критерий Пирсона, проверить гипотезу о том, что случайная величина Х имеет показательное распределение.

Правило. [7] Для того чтобы при уровне значимости α проверить гипотезу о том, что непрерывная случайная величина распределена по показательному закону, надо:

1.Найти по заданному эмпирическому распределению выборочную среднюю xB . Для этого, приняв в качестве «представителя» i-го интервала его середину xi* , составляют последовательность равноотстоящих вариант и соответствующих им частот.

2.Принять в качестве оценки параметра λ показательного распределения величину, обратную выборочной средней:

λ* =1/ xB .

3. Найти вероятности попадания X в частичные интервалы (xi , xi+1 ) по формуле

Pi = P(xi < X < xi+1 ) = eλxi eλxi +1 . 4. Вычислить теоретические частоты:

ni′ = ni Pi .

5.Сравнить эмпирические и теоретические частоты с помощью критерия Пирсона, приняв число степеней свободы k = s 2 , где s – число первоначальных интервалов выборки; если же было произведено объединение малочисленных частот, следовательно, и самих интервалов, то s – число интервалов, оставшихся после объединения.

Пример 5. В результате испытания 200 элементов на длительность работы получено эмпирическое распределение, приведенное в таблице (в первом столбце указаны интервалы времени в часах, во втором столбце – частоты, т.е. количество элементов, проработавших время в пределах соответствующего интервала).

Интервал

Частота

Интервал

Частота

xi xi+1

ni

xi xi+1

ni

0-5

133

15-20

4

5-10

45

20-25

2

10-15

15

25-30

1

Требуется, при уровне значимости 0,05, проверить гипотезу о том, что время работы элементов распределено по показательному закону.

Решение. 1. Найдем среднее время работы всех элементов (в качестве среднего времени работы одного элемента примем середину интервала, которому принадлежит элемент):

xB =(133*2,5+45*7,5+15*12,5+4*17,5+2*22,5+1*27,5)/200=1000/200=5.

2. Найдем оценку параметра предполагаемого показательного распределения:

λ* =1/ xB =1/5=0,2.

Таким образом, плотность предполагаемого показательного распределения имеет вид f (x) = 0,2e0,2 x (х>0).

3. Найдем вероятности попадания Х в каждый из интервалов по формуле

Дмитриева М.В.

Редакция 31.08.2010

Лекции по математике. Тема 10 Страница 15

Pi = P(xi < X < xi+1 ) = eλxi eλxi +1 .

Например, для первого интервала

P1 = P(0 < X < 5) = e0,2 0 e0,2 5 =1 e1 = 1-0,3679=0,6321.

Аналогично вычислим вероятности попадания Х в остальные интервалы: P2 =0,2326;

P3 =0,0855; P4 =0,0315; P5 =0,0116; P6 =0,0042.

4. Найдем теоретические частоты:

ni′ = ni Pi =200 Pi .

Итак, n1′ = 200 P1 = 200 0,6321 =126,42 , n2=46,52; n3=17,1; n4 =6,3; n5=2,32; n6=0,84.

5. Сравним эмпирические и теоретические частоты с помощью критерия Пирсона. Для этого составим расчетную таблицу, причем объединим малочисленные частоты (4+2+1=7) и соответствующие им теоретические частоты (6,3+2,32+0,84=9,46):

i

ni

ni

ni ni

1

133

126,42

6,58

2

45

46,52

-1,52

3

15

17,1

-2,1

4

7

9,46

-2,46

 

n=200

 

 

 

 

 

 

(ni ni)2

(ni ni)2 / ni

43,2964

0,3425

2,3104

0,0497

4,41

0,2579

6,0516

0,6397

 

χнабл2 =1,29

Из таблицы находим χнабл2 =1,29. По таблице критических точек распределения χ2 (см. Приложение 4) по уровню значимости α =0,05 и числу степеней свободы k = s 2 = 4 2 = 2 находим критическую точку правосторонней области χкр2 (0,05; 2)=6,0.

Так как χнабл2 < χкр2 - нет оснований отвергнуть гипотезу о распределении Х по

показательному закону. Другими словами, данные наблюдений согласуются с этой гипотезой.

9 Под статистическими гипотезами подразумеваются такие гипотезы, которые относятся или к виду случайной величины, или к отдельным параметрам распределения случайной величины.

9 Простой (сложной) называют гипотезу, содержащую одно (несколько) предположение (предположений).

9Проверяемую гипотезу обычно называют нулевой (или основной) и обозначают H0.

9Наряду с нулевой гипотезой H0 рассматривают альтернативную, или конкурирующую, гипотезу H1, являющуюся логическим отрицанием H0. Нулевая и альтернативная гипотезы представляют собой две возможности выбора, осуществляемого в задачах проверки статистических гипотез.

9Статистическим критерием называют правило, которое позволяет оценить меру расхождения результатов, полученных при оценке выборочного наблюдения и

основной выдвинутой гипотезы H0. Статистическим критерием также называют случайную величину К, служащую для проверки нулевой гипотезы.

9Областью принятия гипотезы (областью допустимых значений) О называют совокупность значений критерия, при которых эту гипотезу Н0 принимают.

9 Критической областью (областью отклонения гипотезы) W для данного статистического критерия называют множество значений критерия, при которых нулевую гипотезу Н0 отвергают.

Дмитриева М.В.

Редакция 31.08.2010

Лекции по математике. Тема 10

Страница 16

9Критерий К позволяет при заданном уровне значимости определить критическую точку Kкр , которая разделяет область значений критерия на две части: область

допустимых значений О, в которой результаты выборочного исследования выглядят более правдоподобно, и критическую область W, в которой результаты выборочного наблюдения менее правдоподобны в отношении гипотезы Н0 . Обычно

Kкр определяется по таблице соответствующего распределения.

9Ошибка первого рода - Отвергнута нулевая гипотеза Н0 , а принята гипотеза Н1 , в то время как в действительности все же верна гипотеза Н0 .

9Ошибка второго рода - Принимается нулевая гипотеза Н0 , в то время как верна гипотеза Н1 .

9Вероятность (1β) не допустить ошибку 2-го рода, т.е. отвергнуть гипотезу Н0 , когда она неверна, называется мощностью критерия.

9Параметрические критерии – критерии значимости, которые служат для проверки гипотез о параметрах распределения генеральной совокупности.

9Критерии согласия позволяют проверять гипотезы о соответствии распределений генеральной совокупности известной теоретической модели.

9В зависимости от содержания альтернативной гипотезы Н1 осуществляется выбор критической области: левосторонней, правосторонней или двусторонней в зависимости от того, как задана конкурирующая гипотеза Н1 .

Теоретические вопросы для самостоятельной работы.

1.Пример на отыскание мощности критерия. [1, стр. 313-314]

2.Сравнение наблюдаемой относительной частоты с гипотетической вероятностью появления события. [1, стр. 317-319]

3.Сравнение двух вероятностей биномиальных распределений. [1, стр. 319-322]

4.Сравнение нескольких дисперсий нормальных генеральных совокупностей по выборкам различного объема. Критерий Бартлетта. [1, стр. 322-325]

5.Сравнение нескольких дисперсий нормальных совокупностей по выборкам одинакового объема. Критерий Кочрена. [1, стр. 325-327]

Практические задания для самостоятельной работы.

1.Экстрасенсу предложили подтвердить диагноз 16 человек, в 10 из ответов был поставлен правильный диагноз. На уровне значимости 0,05 определите, случайно ли

это, или целитель обладает экстрасенсорными способностями? (Нулевая гипотеза Н0: случайная величина Х подчиняется равномерному распределению, при котором вероятность выбрать правильное решение равна 0,5. )

2.Результаты исследований прочности на сжатие 200 образцов бетона представлены в виде сгруппированного статистического ряда:

Интервалы прочности,

Среднее значение

Частота, ni

кг/см2

интервала, хi

 

190-200

195

10

200-210

205

26

210-220

215

56

220-230

225

64

230-240

235

30

240-250

245

14

Дмитриева М.В.

Редакция 31.08.2010

Лекции по математике. Тема 10

Страница 17

Требуется проверить нулевую гипотезу о нормальном законе распределения прочности на сжатие. Уровень значимости принять 0,01.

3.Из 200 участников экологической конференции 50 женщин. Существенно ли отличается удельный вес женщин на конференции, если по статистическим данным в области экологии трудятся 30% женщин. Уровень значимости принять равным 0,05.

4.Предприятие, производящее парфюмерную продукцию, предлагает покупателю новый вид губной помады. Новый вид помады был предложен на пробу 400 женщинам, и 275 из них сказали, что она лучше других. Может ли предприятие принять предположение о том, что хотя бы 70% всех ее потребителей предпочтут новую модификацию помады старой? Принять уровень значимости 0,05.

Дмитриева М.В.

Редакция 31.08.2010