Тема 10
.pdfЛекции по математике. Тема 10 |
Страница 11 |
1. Найти по формуле Бернулли вероятности |
Pi появления ровно i событий А в N |
испытаниях (i=0,1,2,…,s, где s – максимальное число наблюдавшихся появлений события А в одном опыте, т.е. s ≤ N ).
2.Найти теоретические частоты ni′ = n Pi , где n – число опытов.
3.Сравнить эмпирические и теоретические частоты по критерию Пирсона, приняв число степеней свободы k=s-1 (при этом предполагается, что вероятность p появления события А задана, т.е. не оценивалось по выборке и не производилось объединение малочисленных частот).
Если же вероятность р была оценена по выборке, то k=s-2. Если, кроме того, было произведено объединение малочисленных частот, то s – число групп выборки, оставшихся после объединения частот.
Пример 3. Произведено n=100 опытов. Каждый опыт состоял из N=10 испытаний, в каждом из которых вероятность р появления события А равна 0,3. В итоге получено следующее эмпирическое распределение (в первой строке указано число xi появлений события А в одном опыте; во второй строке – частота ni , т.е. число
опытов, в которых наблюдалось xi |
появлений события А): |
||||||||
|
xi |
0 |
1 |
|
2 |
3 |
4 |
5 |
|
|
ni |
2 |
10 |
|
27 |
32 |
23 |
6 |
|
Требуется при уровне значимости 0,05 проверить гипотезу о том, что дискретная величина Х (число появлений события А) распределена по биномиальному закону.
Решение. 1. По формуле Бернулли
Pi = PN (i) = CNi pi q N −i
найдем вероятность Pi (i=0,1,2,3,4,5) того, что событие А появится в N=10 испытаниях ровно i раз.
Учитывая, что p=0,3, q=1-0,3=0,7, получим:
P0 = P10 (0) = 0,710 = 0,0282 ; P1 = P10 (1) =10 0,3 0,79 = 0,1211. Аналогично вычислим P2 =0,2335; P3 =0,2668; P4 =0,2001; P5 =0,1029.
2. Найдем теоретические частоты ni′ = n Pi . Учитывая, что n=100, получим: n0′ =2,82; n1′=12,11; n′2 =23,35; n3′=26,68; n′4 =20,01; n5′=10,29.
3. Сравним эмпирические и теоретические частоты с помощью критерия Пирсона. Для этого составим расчетную таблицу:
i |
n |
i |
n′ |
n |
i |
−n′ |
(n |
i |
−n′)2 |
(n |
i |
−n′)2 |
/ n′ |
|
i |
|
i |
|
i |
|
i |
i |
|||||
1 |
12 |
14,93 |
-2,93 |
8,5849 |
|
|
0,5750 |
||||||
2 |
27 |
23,35 |
3,65 |
13,3225 |
|
|
0,5706 |
||||||
3 |
32 |
26,68 |
5,32 |
28,3024 |
|
|
1,0608 |
||||||
4 |
23 |
20,01 |
2,99 |
8,9401 |
|
|
0,4468 |
||||||
5 |
6 |
10,29 |
-4,29 |
18,4041 |
|
|
1,7886 |
||||||
∑ |
n=100 |
|
|
|
|
|
|
|
χнабл2 =4,44 |
Поскольку частота n0 =2 малочисленная (меньше пяти), объединим ее с частотой n1 =10 и
в таблицу запишем 2+10=12; в качестве теоретической частоты, соответствующей объединенной частоте 12, запишем сумму соответствующих теоретических частот:
n0′ + n1′=2,82+12,11=14,93. Из таблицы находим χнабл2 =4,44.
Дмитриева М.В. |
Редакция 31.08.2010 |
Лекции по математике. Тема 10 |
Страница 12 |
По таблице критических точек распределения χ2 по уровню значимости α =0,05 и числу степеней свободы k=5-1=4 находим критическую точку правосторонней критической области χкр2 (0,05; 4)=9,5 (см. Приложение 4).
Так как χнабл2 < χкр2 - нет оснований отвергнуть гипотезу о биномиальном распределении Х.
Проверка гипотезы о равномерном распределении генеральной совокупности.
Задано эмпирическое распределение непрерывной случайной величины Х в виде последовательности интервалов xi−1 − xi и соответствующих им частот ni , причем
∑ni = n (объем выборки). Требуется, используя критерий Пирсона, проверить гипотезу о том, что случайная величина Х распределена равномерно.
Правило. [7] Для того чтобы проверить гипотезу о равномерном распределении Х, т.е. по закону
f (x) = 1/(b −a) |
винтервале(a,b), |
0 |
внеинтервала(a,b), |
надо:
1. Оценить параметры a и b – концы интервала, в котором наблюдались возможные значения X, по формулам (через а* и b* обозначены оценки параметров):
a* = xB − 3σB , b* = xB + 3σB . 2. Найти плотность вероятности предполагаемого распределения
f (x) =1/(b * −a*) .
3. Найти теоретические частоты:
|
n1′ = nP1 |
= n[ f (x) (x1 |
−a*)] = n |
1 |
|
|
(x1 −a*) ; |
|||||||||
|
b * −a * |
|||||||||||||||
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|||
′ |
′ |
=... |
′ |
−1 |
= n |
|
|
|
(xi − xi−1 ) , |
(i = 2,3,..., s −1) ; |
||||||
|
|
|
|
|||||||||||||
n2 |
= n3 |
= ns |
b * −a * |
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
n′s |
= n |
|
1 |
|
|
|
(b * −xs−1 ) . |
|
||||
|
|
|
|
b * −a * |
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
4. Сравнить эмпирические и теоретические частоты с помощью критерия Пирсона, приняв число степеней свободы k = s −3 , где s – число интервалов, на которые разбита выборка.
Пример 4. Произведено n=200 испытаний, в результате каждого из которых событие А появлялось в различные моменты времени. В итоге было получено эмпирическое распределение, приведенное в таблице (в первом столбце указаны интервалы времени в минутах, во втором столбце – соответствующие частоты, т.е. число появлений события A в интервале). Требуется при уровне значимости 0,05 проверить гипотезу о том, что время появления событий распределено равномерно.
Интервал |
Частота |
Интервал |
Частота |
xi−1 − xi |
ni |
xi−1 − xi |
ni |
2-4 |
21 |
12-14 |
14 |
4-6 |
16 |
14-16 |
21 |
6-8 |
15 |
16-18 |
22 |
8-10 |
26 |
18-20 |
18 |
10-12 |
22 |
20-22 |
25 |
Решение. 1. Найдем оценки параметров a и b равномерного распределения по формулам: a* = xB − 3σB , b* = xB + 3σB .
Дмитриева М.В. |
Редакция 31.08.2010 |
Лекции по математике. Тема 10 |
Страница 13 |
|
Для вычисления |
выборочной средней |
xB и выборочного среднего квадратического |
отклонения σB |
примем середины xi* |
интервалов в качестве вариант (наблюдаемых |
значений Х). В итоге получим эмпирическое распределение равноотстоящих вариант:
|
xi* |
3 |
5 |
7 |
9 |
|
11 |
13 |
15 |
17 |
19 |
21 |
|
|
ni |
21 |
16 |
15 |
26 |
|
22 |
14 |
21 |
22 |
18 |
25 |
|
Найдем xB =12,31, σ |
B =5,81. Следовательно, |
|
|
|
|
|
|
|
|||||
а*=12,31-1,73*5,81=2,26, |
b*=12,31+1,73*5,81=22,36. |
2. Найдем плотность предполагаемого равномерного распределения:
f(x) =1/(b * −a*) =1/(22,36-2,26)=0,05.
3.Найдем теоретические частоты:
n1′ = nP1 = n[ f (x) (x1 −a*)] = n b *1−a * (x1 −a*) =200*0,05*(4-2,26)=17,4; n2′ = n b *1−a * (x2 − x1 ) =200*0,05*(6-4)=20.
Длины третьегодевятого интервалов равны длине второго интервала, поэтому теоретические частоты, соответствующие этим интервалам и теоретическая частота второго интервала одинаковы, т.е.
n3′ =... = n9′ = 20 ;
n10′ = n b *1−a * (b * −x9 ) =200*0,05*(22,36-20)=23,6.
4. Сравним эмпирические и теоретические частоты, используя критерий Пирсона, приняв число степеней свободы k = s −3 =10 −3 = 7 . Для этого составим расчетную таблицу:
|
i |
n |
i |
n′ |
n |
i |
− n′ |
(n |
i |
−n′)2 |
(n |
i |
−n′)2 |
/ n′ |
|
|
|
i |
|
|
i |
|
i |
|
i |
i |
|||||
|
1 |
21 |
17,3 |
|
3,7 |
|
13,69 |
|
|
0,79 |
|
||||
|
2 |
16 |
20 |
|
|
-4 |
|
|
|
16 |
|
|
0,8 |
|
|
|
3 |
15 |
20 |
|
|
-5 |
|
|
|
25 |
|
|
1,25 |
|
|
|
4 |
26 |
20 |
|
|
6 |
|
|
|
36 |
|
|
1,8 |
|
|
|
5 |
22 |
20 |
|
|
2 |
|
|
|
4 |
|
|
0,2 |
|
|
|
6 |
14 |
20 |
|
|
-6 |
|
|
|
36 |
|
|
1,8 |
|
|
|
7 |
21 |
20 |
|
|
1 |
|
|
|
1 |
|
|
0,05 |
|
|
|
8 |
22 |
20 |
|
|
2 |
|
|
|
4 |
|
|
0,2 |
|
|
|
9 |
18 |
20 |
|
|
-2 |
|
|
|
4 |
|
|
0,2 |
|
|
|
10 |
25 |
23,6 |
|
1,4 |
|
|
1,96 |
|
|
0,08 |
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
χнабл2 =7,17 |
|||
Из расчетной таблицы получаем χнабл2 |
=7,17. |
|
|
|
|
|
|
|
Найдем по таблице критических точек распределения χ2 (см. Приложение 4) по уровню значимости α =0,05 и числу степеней свободы k = s −3 =10 −3 = 7 находим критическую точку правосторонней области χкр2 (0,05; 7)=14,1.
Так как χнабл2 < χкр2 - нет оснований отвергнуть гипотезу о равномерном распределении Х. Другими словами, данные наблюдений согласуются с этой гипотезой.
Дмитриева М.В. |
Редакция 31.08.2010 |
Лекции по математике. Тема 10 |
Страница 14 |
Проверка гипотезы о распределении генеральной совокупности по показательному закону.
Задано эмпирическое распределение непрерывной случайной величины Х в виде последовательности интервалов xi − xi+1 и соответствующих им частот ni , причем
∑ni = n (объем выборки). Требуется, используя критерий Пирсона, проверить гипотезу о том, что случайная величина Х имеет показательное распределение.
Правило. [7] Для того чтобы при уровне значимости α проверить гипотезу о том, что непрерывная случайная величина распределена по показательному закону, надо:
1.Найти по заданному эмпирическому распределению выборочную среднюю xB . Для этого, приняв в качестве «представителя» i-го интервала его середину xi* , составляют последовательность равноотстоящих вариант и соответствующих им частот.
2.Принять в качестве оценки параметра λ показательного распределения величину, обратную выборочной средней:
λ* =1/ xB .
3. Найти вероятности попадания X в частичные интервалы (xi , xi+1 ) по формуле
Pi = P(xi < X < xi+1 ) = e−λxi −e−λxi +1 . 4. Вычислить теоретические частоты:
ni′ = ni Pi .
5.Сравнить эмпирические и теоретические частоты с помощью критерия Пирсона, приняв число степеней свободы k = s −2 , где s – число первоначальных интервалов выборки; если же было произведено объединение малочисленных частот, следовательно, и самих интервалов, то s – число интервалов, оставшихся после объединения.
Пример 5. В результате испытания 200 элементов на длительность работы получено эмпирическое распределение, приведенное в таблице (в первом столбце указаны интервалы времени в часах, во втором столбце – частоты, т.е. количество элементов, проработавших время в пределах соответствующего интервала).
Интервал |
Частота |
Интервал |
Частота |
xi − xi+1 |
ni |
xi − xi+1 |
ni |
0-5 |
133 |
15-20 |
4 |
5-10 |
45 |
20-25 |
2 |
10-15 |
15 |
25-30 |
1 |
Требуется, при уровне значимости 0,05, проверить гипотезу о том, что время работы элементов распределено по показательному закону.
Решение. 1. Найдем среднее время работы всех элементов (в качестве среднего времени работы одного элемента примем середину интервала, которому принадлежит элемент):
xB =(133*2,5+45*7,5+15*12,5+4*17,5+2*22,5+1*27,5)/200=1000/200=5.
2. Найдем оценку параметра предполагаемого показательного распределения:
λ* =1/ xB =1/5=0,2.
Таким образом, плотность предполагаемого показательного распределения имеет вид f (x) = 0,2e−0,2 x (х>0).
3. Найдем вероятности попадания Х в каждый из интервалов по формуле
Дмитриева М.В. |
Редакция 31.08.2010 |
Лекции по математике. Тема 10 Страница 15
Pi = P(xi < X < xi+1 ) = e−λxi −e−λxi +1 .
Например, для первого интервала
P1 = P(0 < X < 5) = e−0,2 0 −e−0,2 5 =1 −e−1 = 1-0,3679=0,6321.
Аналогично вычислим вероятности попадания Х в остальные интервалы: P2 =0,2326;
P3 =0,0855; P4 =0,0315; P5 =0,0116; P6 =0,0042.
4. Найдем теоретические частоты:
ni′ = ni Pi =200 Pi .
Итак, n1′ = 200 P1 = 200 0,6321 =126,42 , n2′ =46,52; n3′=17,1; n′4 =6,3; n5′=2,32; n6′ =0,84.
5. Сравним эмпирические и теоретические частоты с помощью критерия Пирсона. Для этого составим расчетную таблицу, причем объединим малочисленные частоты (4+2+1=7) и соответствующие им теоретические частоты (6,3+2,32+0,84=9,46):
i |
ni |
ni′ |
ni −ni′ |
1 |
133 |
126,42 |
6,58 |
2 |
45 |
46,52 |
-1,52 |
3 |
15 |
17,1 |
-2,1 |
4 |
7 |
9,46 |
-2,46 |
|
n=200 |
|
|
|
|
|
|
(ni −ni′)2 |
(ni −ni′)2 / ni′ |
43,2964 |
0,3425 |
2,3104 |
0,0497 |
4,41 |
0,2579 |
6,0516 |
0,6397 |
|
χнабл2 =1,29 |
Из таблицы находим χнабл2 =1,29. По таблице критических точек распределения χ2 (см. Приложение 4) по уровню значимости α =0,05 и числу степеней свободы k = s − 2 = 4 − 2 = 2 находим критическую точку правосторонней области χкр2 (0,05; 2)=6,0.
Так как χнабл2 < χкр2 - нет оснований отвергнуть гипотезу о распределении Х по
показательному закону. Другими словами, данные наблюдений согласуются с этой гипотезой.
9 Под статистическими гипотезами подразумеваются такие гипотезы, которые относятся или к виду случайной величины, или к отдельным параметрам распределения случайной величины.
9 Простой (сложной) называют гипотезу, содержащую одно (несколько) предположение (предположений).
9Проверяемую гипотезу обычно называют нулевой (или основной) и обозначают H0.
9Наряду с нулевой гипотезой H0 рассматривают альтернативную, или конкурирующую, гипотезу H1, являющуюся логическим отрицанием H0. Нулевая и альтернативная гипотезы представляют собой две возможности выбора, осуществляемого в задачах проверки статистических гипотез.
9Статистическим критерием называют правило, которое позволяет оценить меру расхождения результатов, полученных при оценке выборочного наблюдения и
основной выдвинутой гипотезы H0. Статистическим критерием также называют случайную величину К, служащую для проверки нулевой гипотезы.
9Областью принятия гипотезы (областью допустимых значений) О называют совокупность значений критерия, при которых эту гипотезу Н0 принимают.
9 Критической областью (областью отклонения гипотезы) W для данного статистического критерия называют множество значений критерия, при которых нулевую гипотезу Н0 отвергают.
Дмитриева М.В. |
Редакция 31.08.2010 |
Лекции по математике. Тема 10 |
Страница 16 |
9Критерий К позволяет при заданном уровне значимости определить критическую точку Kкр , которая разделяет область значений критерия на две части: область
допустимых значений О, в которой результаты выборочного исследования выглядят более правдоподобно, и критическую область W, в которой результаты выборочного наблюдения менее правдоподобны в отношении гипотезы Н0 . Обычно
Kкр определяется по таблице соответствующего распределения.
9Ошибка первого рода - Отвергнута нулевая гипотеза Н0 , а принята гипотеза Н1 , в то время как в действительности все же верна гипотеза Н0 .
9Ошибка второго рода - Принимается нулевая гипотеза Н0 , в то время как верна гипотеза Н1 .
9Вероятность (1− β) не допустить ошибку 2-го рода, т.е. отвергнуть гипотезу Н0 , когда она неверна, называется мощностью критерия.
9Параметрические критерии – критерии значимости, которые служат для проверки гипотез о параметрах распределения генеральной совокупности.
9Критерии согласия позволяют проверять гипотезы о соответствии распределений генеральной совокупности известной теоретической модели.
9В зависимости от содержания альтернативной гипотезы Н1 осуществляется выбор критической области: левосторонней, правосторонней или двусторонней в зависимости от того, как задана конкурирующая гипотеза Н1 .
Теоретические вопросы для самостоятельной работы.
1.Пример на отыскание мощности критерия. [1, стр. 313-314]
2.Сравнение наблюдаемой относительной частоты с гипотетической вероятностью появления события. [1, стр. 317-319]
3.Сравнение двух вероятностей биномиальных распределений. [1, стр. 319-322]
4.Сравнение нескольких дисперсий нормальных генеральных совокупностей по выборкам различного объема. Критерий Бартлетта. [1, стр. 322-325]
5.Сравнение нескольких дисперсий нормальных совокупностей по выборкам одинакового объема. Критерий Кочрена. [1, стр. 325-327]
Практические задания для самостоятельной работы.
1.Экстрасенсу предложили подтвердить диагноз 16 человек, в 10 из ответов был поставлен правильный диагноз. На уровне значимости 0,05 определите, случайно ли
это, или целитель обладает экстрасенсорными способностями? (Нулевая гипотеза Н0: случайная величина Х подчиняется равномерному распределению, при котором вероятность выбрать правильное решение равна 0,5. )
2.Результаты исследований прочности на сжатие 200 образцов бетона представлены в виде сгруппированного статистического ряда:
Интервалы прочности, |
Среднее значение |
Частота, ni |
кг/см2 |
интервала, хi |
|
190-200 |
195 |
10 |
200-210 |
205 |
26 |
210-220 |
215 |
56 |
220-230 |
225 |
64 |
230-240 |
235 |
30 |
240-250 |
245 |
14 |
Дмитриева М.В. |
Редакция 31.08.2010 |
Лекции по математике. Тема 10 |
Страница 17 |
Требуется проверить нулевую гипотезу о нормальном законе распределения прочности на сжатие. Уровень значимости принять 0,01.
3.Из 200 участников экологической конференции 50 женщин. Существенно ли отличается удельный вес женщин на конференции, если по статистическим данным в области экологии трудятся 30% женщин. Уровень значимости принять равным 0,05.
4.Предприятие, производящее парфюмерную продукцию, предлагает покупателю новый вид губной помады. Новый вид помады был предложен на пробу 400 женщинам, и 275 из них сказали, что она лучше других. Может ли предприятие принять предположение о том, что хотя бы 70% всех ее потребителей предпочтут новую модификацию помады старой? Принять уровень значимости 0,05.
Дмитриева М.В. |
Редакция 31.08.2010 |