
Курсовая по теории вероятности. Вариант №22
Вариант № 22
-
6;8
8;10
10;12
12;14
14;16
16;18
18;20
41
36
24
17
13
10
7
-
20;22
22;24
24;26
26;28
5
3
2
2
Построение интервального и точечного статистических распределений результатов наблюдений. Построение полигона и гистограммы относительных частот.
i– порядковый номер;
Ii– интервал разбиения;
xi– середина интервалаIi;
ni– частота (количество результатов наблюдений, принадлежащих данному интервалуIi);
wi=
- относительная частота (n=
-
объём выборки);
Hi=
- плотность относительной частоты (h– шаг разбиения, т.е. длина интервалаIi).
i |
Ii |
xi |
ni |
wi |
Hi |
1 2 3 4 5 6 7 8 9 10 11 |
6;8 8;10 10;12 12;14 14;16 16;18 18;20 20;22 22;24 24;26 26;28 |
7 9 11 13 15 17 19 21 23 25 27 |
41 36 24 17 13 10 7 5 3 2 2 |
0,25625 0,225 0,15 0,10625 0,08125 0,0625 0,04375 0,03125 0,01875 0,0125 0,0125 |
0,128125 0,1125 0,075 0,053125 0,040625 0,03125 0,021875 0,015625 0,009375 0,00625 0,00625 |
Объём выборки:
n
==160,
wi
=
;
контроль:
=1
Длина интервала
разбиения (шаг):
h = 2 ,
Hi
=
: 160 1,00
Статистическим распределениемназывается соответствие между результатами наблюдений (измерений) и их частотами и относительными частотами.Интервальное распределение– это наборы троек (Ii ; ni ; wi) для всех номеровi, аточечное– наборы троек (xi ; ni ; wi). Таким образом, в таблице имеются оба – и интервальное, и точечное - статистическое распределения.
Далее, строим полигон и гистограмму относительных частот.
Полигон.
Гистограмма.
Полигон относительных частот – ломаная, отрезки которой последовательно (в порядке возрастания xi) соединяют точки (xi ; wi).Гистограмма относительных частот – фигура, которая строится следующим образом: на каждом интервале Ii, как на основании, строится прямоугольник, площадь которого равна относительной частоте wi; отсюда следует, что высота этого прямоугольника равна Hi = wi/h – плотности относительной частоты. Полигон и гистограмма являются формами графического изображения статистического распределения.
2.Нахождение точечных оценок математического ожидания и
дисперсии.
В качестве точечных оценок числовых характеристик изучаемой случайной величины используются:
для математического ожидания
=
(выборочная
средняя),
для дисперсии
s2
=
(исправленная
выборочная),
где n– объём выборки,ni– частота значенияxi .
Таким образом, в статистических расчетах используют приближенные равенства
MX
, DX
s2 .
Нахождение точечных оценок математического ожидания и дисперсии по данным варианта осуществим с помощью расчетной таблицы.
i |
xi |
ni |
xi ni |
(xi
-
|
1 2 3 4 5 6 7 8 9 10 11 |
7 9 11 13 15 17 19 21 23 25 27 |
41 36 24 17 13 10 7 5 3 2 2 |
287 324 264 221 195 170 133 105 69 50 54 |
905,69 262,44 11,76 28,73 141,57 280,9 373,03 432,45 383,07 353,78 468,18 |
=
=
= 11,7
s2=
=
=
=
=
22,9
: 160 1872 3641,6
3.Выдвижение гипотезы о распределении случайной величины.
При выдвижении гипотезы (предположения) о законе распределения изучаемой случайной величины мы опираемся лишь на внешний вид статистического распределения. Т.е. будем руководствоваться тем, что профиль графика плотности теоретического распределения должен соответствовать профилю гистограммы: если середины верхних сторон прямоугольников, образующих гистограмму, соединить плавной кривой, то эта линия представляет в первом приближении график плотности распределения вероятностей.
Итак, изобразим
график и выпишем формулу плотности
показательного (экспонециального)
распределения с параметрами λ и
,
где λ>0, -
+,
x
Сравнение построенной гистограммы и графика плотности распределения приводит к следующему заключению о предполагаемом (теоретическом) законе распределения в рассматриваемом варианте исходных данных:
Вариант № 22 – показательное распределение.
4.Построение графика теоретической плотности распределения.
Чтобы выписать
плотность теоретического (предполагаемого)
распределения, нужно определить значения
параметров λии подставить их в соответствующую
формулу. Все параметры тесно связаны с
числовыми характеристиками случайной
величины, т.е.
MX=
,
DX=
Поскольку значения
математического ожидания и дисперсии
неизвестны, то их заменяют соответствующими
точечными оценками, т.е. используют (уже
упомянутые ранее) приближенные равенства
MX
,DXs2, что позволяет
найти значения параметров распределения.
По исходным данным была выдвинута гипотеза о нормальном распределении изучаемой случайной величины. Найдем параметры этого распределения:
,
,
=11,7-
=11,7-4,78=6,92
s2=
=
=0,21
Следовательно, плотность предполагаемого распределения задается формулой
f
(x)=.
приx≥ 6,92
0
приx<
6,92
Теперь необходимо
вычислить значения теоретической
плотности f
(x)
при
(то есть значение в «параметре
сдвига») и при
,
где
>
(то есть значения в серединах интервалов,
больших
) . Для этого воспользуемся следующей
схемой(ниже
или
,
где
>
:
=0,21
(x
-6,.92)
;
λ=
0,21; x
= 6,92
-
x
6,92
7
9
11
13
15
17
19
21
23
25
27
0,00
0,01
0,43
0,85
1,27
1,69
2,11
2,53
2,95
3,37
3,79
4,21
1,0000
0,9900
0,6505
0,4274
0,2808
0,1845
0,1212
0,0797
0,0523
0,0344
0,0226
0,0148
0,2100
0,2079
0,1366
0,0897
0,0589
0,0387
0,0254
0,0167
0,0109
0,0072
0,0047
0,0031
Далее, на одном
чертеже строим гистограмму и график
теоретической плотности распределения:
гистограмма была построена ранее, а для
получения графика плотности наносим
точки с координатами (x
; f(x
))и соединяем их плавной кривой.
5.Проверка гипотезы о распределении с помощью критерия согласия Пирсона.
Ранее была выдвинута гипотеза о законе распределения рассматриваемой случайной величины. Сопоставление статистического распределения (гистограмма) и предполагаемого теоретического (графика плотности) показывает наличие некоторых расхождений между ними. Поэтому возникает естественный вопрос: чем объясняются эти несовпадения? Ответить на него можно двояко:
Указанные расхождения несущественны и вызваны ограниченным количеством наблюдений и случайными факторами – случайностью результата единичного наблюдения, способа группировки данных и т.п. В этом случае выдвинутая гипотеза о распределении считается правдоподобной и принимается как не противоречащая опытным данным.
Указанные расхождения являются существенными (неслучайными) и связаны с тем, что действительное распределение случайной величины отличается от предполагаемого. В этом случае выдвинутая гипотеза о распределении отвергается как плохо согласующаяся данными наблюдений.
Для выбора первого или второго варианта ответа и служат так называемые критерии согласия. Словари толкуют слово критерий (от греч. kriterion– средство для суждения) как признак, на основании которого производится оценка, определение и классификация чего-либо.
Существуют различные критерии согласия: К. Пирсона, А.Н. Колмогорова, Н.В. Смирнова, В.И. Романовского и другие. Мы рассмотрим лишь один из них – критерий Пирсона, называемый также критерием 2(«хи - квадрат»). (К. Пирсон (1857 - 1936) – английский математик, биолог, философ – позитивист.)
Критерий Пирсона выгодно отличается от остальных, во – первых, применимостью к любым (дискретным, непрерывным) распределениям и, во – вторых, простотой вычислительного алгоритма.
Правило проверки статистических гипотез с помощью критерия Пирсона будет объяснено на примерах.
Группировка исходных данных.
Применяется критерий Пирсона к сгруппированным данным. Предположим, что произведено nнезависимых опытов, в каждом из которых изучаемая случайная величина приняла определенное значение. Предположим, что вся числовая ось разбита на несколько непересекающихся промежутков (интервалов и полуинтервалов). Обозначим черезI (- греческая буква «ню») количество результатов измерений (значений случайной величины), попавших вi-й промежуток. Очевидно, чтоI=n.
Отметим, что критерий 2 будет давать удовлетворительный для практических приложений результат, если:
количество nопытов достаточно велико, по крайней мереn100;
в каждом промежутке окажется не менее 5…10 результатов измерений, т.е. i5 при любомi; если количество полученных значений в отдельных промежутках мало (меньше 5), то такие промежутки следует объединить с соседними, суммируя соответствующие частоты.
Пусть концами построенного разбиения являются точки zi, гдеz1z2…zi – 1, т.е. само разбиение имеет вид
(- z0; z1) , z1; z2) , z2; z3) , … , zi – 1; zi ).
После объединения соответствующих промежутков (последних двух) и замены самой левой границы разбиения на - , а самой правой на +(поскольку на промежутки должна разбиваться вся числовая ось, а не только диапазон полученных в результате опыта значений), мы приходим к следующим интервальным распределениям, пригодным для непосредственного применения критерия Пирсона:
-
zi –1; zi
- ; 8
8;10
10;12
12;14
14;16
16;18
i
41
36
24
17
13
10
18;20 |
20;22 |
22;+ |
7 |
5 |
7 |
Вычисление теоретических частот.
Критерий Пирсона
основан на сравнении эмпирических
(опытных) частот с теоретическими.
Эмпирические частоты Iопределяются по фактическим результатам
наблюдений. Теоретические частоты,
обозначаемые далее,
находятся с помощью равенства
=
n
pi
,
где n– количество испытаний, аpi zi –1xzi- теоретическая вероятность попадания значений случайной величины вi-й промежуток (1i1).Теоретические вероятности вычисляются в условиях выдвинутой гипотезы о законе распределения изучаемой случайной величины.
В
данном варианте принята гипотеза о
показательном распределении случайной
величины. В этом случае теоретическая
вероятность pпри любомiвычисляется
по одной из следующих трёх формул ( в
зависимости от взаимного расположенияi-го промежутка и числаx
):
p=0,
если
≤x
(то естьi-й промежуток
расположен левееx
);
p=1-
, еслиzi
–1x
zi
(то есть i-й промежуток содержитx
);
p=
-
,
еслиx
zi
–1(то естьi-й промежуток
расположен правееx
).
Процедура отыскания теоретических вероятностей и частот показана в расчетной таблице:
n
= 160; λ= 0,21; x=
6,92
i |
Концы промежутков |
(при x |
|
|
|
P |
| |
zi -1 |
zi | |||||||
1 2 3 4 5 6 7 8 9
|
8 10 12 14 16 18 20 22
|
8 10 12 14 16 18 20 22 +
|
0,00 0,22 0,64 1,06 1,48 1,90 2,32 2,74 3,16
|
0,22 0,64 1,06 1,48 1,90 2,32 2,74 3,16 +
|
1,0000 0,8025 0,5273 0,3465 0,2276 0,1496 0,0983 0,0646 0,0424
|
0,8025 0,5273 0,3465 0,2276 0,1496 0,0983 0,0646 0,0424 0,0000
|
0,1975 0,2752 0,1808 0,1189 0,078 0,0513 0,0337 0,0222 0,0424
|
31,6 44,032 28,928 19,024 12,48 8,208 5,392 3,552 6,784
|
:1,0000 160,00
Статистика 2 и вычисление ее значения по опытным данным.
Для того чтобы принять или отвергнуть гипотезу о законе распределения изучаемой случайной величины, в каждом из критериев согласия рассматривается некоторая (специальным образом подбираемая) величина, характеризующая степень расхождения теоретического (предполагаемого) и статистического распределения.
В критерии Пирсона в качестве такой меры расхождения используется величина
,
называемая
статистикой «хи - квадрат» или
статистикой Пирсона(вообще, статистикой
называют любую функцию от результатов
наблюдений). Ясно, что всегда2
, причем2= 0, тогда и только тогда, когдапри каждомi, т.е. когда
все соответствующие эмпирические и
теоретические частоты совпадают. Во
всех остальных случаях2; при этом значение2тем больше,
чем больше различаются эмпирические и
теоретические частоты.
Прежде чем рассказать о применении статистики 2к проверке гипотезы о закон е распределения , вычислим ее значение для данного варианта; это значение, найденное по данным наблюдений и в рамках выдвинутой гипотезы, будем обозначать через2набл..
-
i
i
1
2
3
4
5
6
7
8
9
41
36
24
17
13
10
7
5
7
31,6
44,032
28,928
19,024
12,48
8,208
5,392
3,552
6,784
2,80
1,46
0,84
0,21
0,02
0,39
0,48
0,60
0,01
:
160 160 6,81
2набл. = 6,81