Математика Лабораторный практикум часть 2
.pdfНаходим точечные оценки математического ожидания m (выборочное среднее значение), дисперсии S и среднего квадратического отклонения s:
> m:=mean(Y);
m :=18.74512500
> S:=variance(Y);
S:=78.14432245
>s:=standarddeviation(Y1);
s :=8.839927740
Находим исправленные оценки дисперсии (несмещённая оценка дисперсии) и среднего квадратического отклонения:
> S1:=S*n/(n-1);
S1 :=79.13349109
> s1:=sqrt(S1);
s1 :=8.895700708
Находим точечные оценки параметров равномерного распреде-
ления: a xв 3 в ,b xв 3 в , где xв m, в s1
> a:= m-sqrt(3.0)*s1; b:= m+sqrt(3.0)*s1; a :=3.33731940
b :=34.15293060
Вычислим вероятности попадания значения случайной величины в первый и последний (k-ый) интервалы:
> p[1]:=(Z[2]-a)/(b-a);
p1 := .1427822875
> p[k]:=(b-Z[k])/(b-a);
p7 := .1275156749
Вычислим вероятности попадания значения случайной величи-
ны во 2, 3, …, k-1 интервалы по формулам pi Z( j 1) Z(J):
b a
> for j from 2 to 6 do p[j]:=(Z[j+1]-Z[j])/(b-a) od; p2 := .1459404074
p3 := .1459404076 p4 := .1459404076 p5 := .1459404073 p6 := .1459404076
Находим теоретические частоты npi:
> for j from 1 to k do n*p[j] od;
11.42258300
11.67523259
71
11.67523261
11.67523261
11.67523258
11.67523261
10.20125399
Так как все npi > 5, то пересчёт не делаем, число интервалов остаётся прежним: k = 7.
Сравним эмпирические ni и теоретические npi частоты, для этого
находим наблюдаемое значение по формуле 2набл k (ni npi )2 .
i 1 npi
> chi2:=sum((Y3f[i]-n*p[i])^2/(n*p[i]),i=1..7);
:=.9115218202
По таблице критических точек распределения 2, по заданному уровню значимости и числу степеней свободы ν = s-l-1 (s – число интервалов после пересчёта, l – число параметров в гипотетической функции распределения) находят критическую точку 2кр ( , ). В на-
шем случае = 0,01(см. задание), s = k = 7, l = 2, т.е. ν = 7-2-1=4, тогда
кр2 (0.01,4) 13.3.
Так как набл2 2кр , то гипотеза о равномерном распределении генеральной совокупности принимается.
Запишем гипотетическую функцию плотности распределения
0, |
x a, |
||
|
1 |
|
|
|
|
||
f (x) |
|
|
,a x b |
|
|
||
b a |
|||
0, |
x b |
||
|
|
|
и построим на одном рисунке гистограмму относительных частот и график плотности гипотетического распределения.
> f:=piecewise(x<a,0,x>=a and x<=b,1/(b-a),x>b,0);
|
|
0 |
x 3.33731940 |
|
|
f := |
|
.03245108440 |
3.33731940 x 0 and |
x 34.15293060 |
0 |
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0 |
34.15293060 x |
|
|
|
|
|
>f1:=plot(f,x=ymin-1..ymax+1):
>plots[display](Hist,f1);
72
Запишем гипотетическую функцию распределения
0, x a,
|
|
|
|
x a |
|||
F(x) |
|
|
, a x b |
|
|
||
b a |
|||
0, |
x b |
||
|
|
|
ипостроим её график.
>F:=piecewise(x<a,0,x>=a and x<=b,(x-a)/(b-a),x>b,1);
|
0 |
x 3.33731940 |
|
.1082996335 .03245108440 x |
3.33731940 x 0 and x 34.15293060 |
F := |
||
|
|
|
|
|
|
|
|
|
|
1 |
34.15293060 x |
|
>F1:=plot(F,x=0..ymax+10):
>plots[display](F1);
73
Проверка гипотезы о показательном распределении
Загрузим пакет stats и подпакеты transform, describe.
> restart:with(stats):with(transform):with(describe):
Вводим реализацию выборки (см. данные своего варианта): > Y:=[0.63,16.04,6.09,3.42,9.25,2.87,1.34,11.24,4.96,3.74, 9.25,1.71,20.96,6.72,8.71,1.06,19.12,0.02,8.58,31.52, 0.29,8.13,17.40,1.62,3.13,18.48,30.30,9.16,2.39,1.48, 5.28,13.82,1.77,2.26,1.70,7.87,9.74,21.21,7.79,.67, 18.76,8.34,1.87,7.02,2.32,2.43,3.07,4.85,5.14,5.85, 1.14,2.78,4.99,7.51,2.59,2.00,11.62,1.65,9.02,1.51, 11.21,22.13,0.48,13.20,12.34,5.25,5.73,0.72,14.11,9.62, 13.54,12.87,27.11,1.08,5.94,1.86,30.53,6.30,20.13,3.41];
Y := [.63, 16.04, 6.09, 3.42, 9.25, 2.87, 1.34, 11.24, 4.96, 3.74, 9.25, 1.71, 20.96, 6.72, 8.71, 1.06, 19.12, .02, 8.58, 31.52, .29, 8.13, 17.40, 1.62, 3.13, 18.48, 30.30, 9.16, 2.39, 1.48, 5.28, 13.82, 1.77, 2.26, 1.70, 7.87, 9.74, 21.21, 7.79, .67, 18.76, 8.34, 1.87, 7.02, 2.32, 2.43, 3.07, 4.85, 5.14, 5.85, 1.14, 2.78, 4.99, 7.51, 2.59, 2.00, 11.62, 1.65, 9.02, 1.51, 11.21, 22.13, .48, 13.20, 12.34, 5.25, 5.73, .72, 14.11, 9.62,
13.54, 12.87, 27.11, 1.08, 5.94, 1.86, 30.53, 6.30, 20.13, 3.41]
Определим объём выборки (подсчитаем количество значений в выборке) и рассчитаем количество интервалов разбиения k:
> n:=count(Y);k:=round(1+1.4*ln(n)); n:=80
k :=7
Проведём сортировку выборки (варианты расположим в порядке возрастания):
> Y1:=statsort(Y);
Y1 := [.02, .29, .48, .63, .67, .72, 1.06, 1.08, 1.14, 1.34, 1.48, 1.51, 1.62, 1.65, 1.70, 1.71, 1.77, 1.86, 1.87, 2.00, 2.26, 2.32, 2.39, 2.43, 2.59, 2.78, 2.87, 3.07, 3.13, 3.41, 3.42, 3.74, 4.85, 4.96, 4.99, 5.14, 5.25, 5.28, 5.73, 5.85, 5.94, 6.09, 6.30, 6.72, 7.02, 7.51, 7.79, 7.87, 8.13, 8.34, 8.58, 8.71, 9.02, 9.16, 9.25, 9.25, 9.62, 9.74, 11.21, 11.24, 11.62, 12.34, 12.87, 13.20, 13.54, 13.82, 14.11, 16.04, 17.40, 18.48, 18.76,
19.12, 20.13, 20.96, 21.21, 22.13, 27.11, 30.30, 30.53, 31.52]
Находим минимальное и максимальное значения выборки и длину интервала разбиения:
> ymin:=Y1[1];ymax:=Y1[n];h:=(ymax-ymin)/k; ymin :=.02
ymax:=31.52 h :=4.500000000
74
Вычислим границы интервалов разбиения:
> Y2:=[seq(ymin+(i-1)*(h+0.0001)..ymin+i*(h+0.0001),i=1..k)];
Y2 := [.02 .. 4.520100000 , 4.520100000 .. 9.020200000 , 9.020200000 .. 13.52030000 ,
13.52030000 .. 18.02040000 , 18.02040000 .. 22.52050000 ,
22.52050000 .. 27.02060000 , 27.02060000 .. 31.52070000 ]
Находим вектор точек разбиения:
> Z:=[seq(ymin+(i-1)*(h+0.0001),i=1..k+1)];
Z := [ .02 , 4.520100000 , 9.020200000 , 13.52030000 , 18.02040000 , 22.52050000 , 27.02060000 , 31.52070000 ]
Составляем интервальный ряд частот Y3 (каждому интервалу поставим в соответствие частоту ni, т.е. число элементов выборки, попадающих в данный интервал) и вектор частот Y3f:
> Y3:=statsort(transform[tallyinto](Y1,Y2));
Y3 := [Weight(.02 .. 4.520100000 , 32 ), Weight(4.520100000 .. 9.020200000 , 21 ), Weight(9.020200000 .. 13.52030000 , 11 ), Weight(13.52030000 .. 18.02040000 , 5), Weight(18.02040000 .. 22.52050000 , 7), Weight(22.52050000 .. 27.02060000 , 0), Weight(27.02060000 .. 31.52070000 , 4)]
> Y3f:=transform[frequency](Y3);
Y3f:=[32, 21, 11, 5, 7, 0, 4]
Получим интервальный ряд относительных частот (каждому интервалу поставим в соответствие относительную частоту, т.е. частоту, делённую на объём выборки):
> Y4:=transform[scaleweight[1/n]](Y3);
Y4 |
|
|
|
2 |
|
|
|
21 |
|
|
:= Weight |
.02 .. 4.520100000 , |
|
|
, Weight |
4.520100000 .. 9.020200000 , |
|
, |
|||
|
|
|
||||||||
|
|
|
|
5 |
|
|
|
80 |
|
|
|
|
|
|
|
|
|
|
|
|
|
11 |
||
Weight |
9.020200000 |
.. 13.52030000 , |
|
|
, |
|
|||||
|
|
|
80 |
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
Weight |
13.52030000 |
.. 18.02040000 , |
|
|
, |
|
|
||||
|
|
|
16 |
|
|
|
|
|
|
|
|
|
|
|
7 |
|
|
Weight |
18.02040000 |
.. 22.52050000 , |
|
|
, Weight(22.52050000 .. 27.02060000 , 0), |
|
|
||||
|
|
|
80 |
|
|
|
|
|
|
|
Weight |
|
27.02060000 .. 31.52070000 , |
1 |
|
|
|
|
||
|
||||
|
|
|
20 |
|
|
|
|
|
Строим гистограмму относительных частот:
>Hist:=statplots[histogram](Y4,color=green):
>plots[display](Hist);
75
По виду гистограммы выдвигаем гипотезу о показательном распределении генеральной совокупности.
Находим накопленные частоты Y5 (накопленная частота показывает, сколько наблюдалось значений, меньших заданного x) и относительные накопленные частоты Y6:
> Y5:=transform[cumulativefrequency](Y3);
Y5 :=[32, 53, 64, 69, 76, 76, 80]
> Y6:=transform[cumulativefrequency](Y4);
Y6 |
|
2 |
53 |
4 |
|
69 |
|
19 |
19 |
|
|
|
||||||
:= |
|
|
|
, |
|
, |
|
, |
|
|
, |
|
, |
|
|
, 1 |
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
5 |
80 |
5 |
|
80 |
|
20 |
20 |
|
|
|
|||||
|
|
|
|
|
|
|
|
Строим график эмпирической функции распределения: > p:=[seq(plot(Y6[i],Y2[i],color=blue),i=1..k)]:plots[display](p);
76
Находим точечные оценки математического ожидания a (выборочное среднее значение), дисперсии S и среднего квадратического отклонения s:
> a:=mean(Y);
a :=8.171750000
> S:=variance(Y);
S:=58.08411190
>s:=standarddeviation(Y1);
s :=7.621293322
Находим исправленные оценки дисперсии (несмещённая оценка дисперсии) и среднего квадратического отклонения:
> S1:=S*n/(n-1);
S1 :=58.81935382
> s1:=sqrt(S1);
s1 :=7.669377668
Находим точечную оценку параметра показательного распределения:
> lambda:=1/a;
:=.1223728088
Вычислим вероятности попадания значения случайной величины в первый и последний (k-ый) интервалы:
> p[1]:=int(lambda*exp(-lambda*t),t=0..Z[2]);
p[k]:=int(lambda*exp(-lambda*t),t=Z[k]..infinity); p1 := .4248574369
p7 := .03664102673
Вычислим вероятности попадания значения случайной величи-
zi 1
ны во 2, 3, …, k -1 интервалы по формулам pi e tdt:
zi
>for j from 2 to k-1 do p[j]:=int(lambda*exp(-
lambda*t),t=Z[j]..Z[j+1]) od;
p2 := .2435430122 p3 := .1404151921 p4 := .08095664905 p5 := .04667571172 p6 := .02691097136
Находим теоретические частоты npi: > for j from 1 to k do n*p[j] od;
77
33.98859495
19.48344098
11.23321537
6.476531924
3.734056938
2.152877709
2.931282138
Так как на трёх последних интервалах npi < 5, то объединим эти интервалы и пересчитаем соответствующие вероятности и частоты, при этом число интервалов будет 5:
> p[5]:= p[5]+p[6]+p[7];Y3f[5]:=Y3f[5]+Y3f[6]+Y3f[7];
p5 := .1737797079
Y3f5 := 15
Сравним эмпирические ni и теоретические npi частоты, для этого
|
k |
|
|
2 |
|
|
|
(ni |
npi ) |
|
|||
находим наблюдаемое значение по формуле набл2 |
|
, где i = |
||||
|
|
|||||
|
i 2 |
|
npi |
|
|
= 1,2,…,5, так как три последних интервала объединили.
> chi2:=sum((Y3f[i]-n*p[i])^2/(n*p[i]),i=1..5);
:=.6625187570
По таблице критических точек распределения 2, по заданному уровню значимости и числу степеней свободы ν = s-l-1 (s – число интервалов после пересчёта, l – число параметров в гипотетической функции распределения) находят критическую точку 2кр ( , ). В на-
шем случае = 0,01(см. задание), s = 5, l = 1, т.е. ν = 5-1-1=3, тогда
кр2 (0.01,2) 11.3.
Так как набл2 2кр , то гипотеза о показательном распределении
генеральной совокупности принимается.
Запишем гипотетическую функцию плотности распределения
0, |
x 0, |
f (x) |
и построим на одном рисунке гистограмму относи- |
e x , x 0
тельных частот и график плотности гипотетического распределения. > f:=piecewise(x<0,0,x>=0,evalf(lambda*exp(-lambda*x)));
0 |
|
x 0 |
f :={ |
( .1223728088x) |
0 x |
.1223728088 e |
>f1:=plot(f,x=-10..ymax+10):
>plots[display](Hist,f1);
78
Запишем гипотетическую функцию распределения
0, |
x 0, |
F(x) |
|
1 e x , x 0
ипостроим её график.
>F:=piecewise(x<0,0,x>=0,1-exp(-lambda*x));
F := { |
0 |
|
x 0 |
|
( .1223728088 |
x) |
0 x |
||
1 e |
>F1:=plot(F,x=-10..ymax+10):
>plots[display](F1);
79
Контрольные вопросы к лабораторным работам 4 и 5
1.Что называется генеральной совокупностью, выборкой, реализацией выборки? Привести примеры.
2.Как построить сгруппированный и интервальный статистические ряды?
3.В чём заключается выборочный метод построения математической модели эксперимента?
4.Что называется эмпирической функцией распределения? Какими свойствами она обладает?
5.В чём состоит отличие эмпирической функции распределения от теоретической?
6.Как построить гистограмму частот, относительных частот? Что называется статистикой, оценкой неизвестного параметра?
7.Какая оценка называется состоятельной, несмещённой, эффективной?
8.Какие оценки математического ожидания и дисперсии генеральной совокупности вы знаете?
9.Что такое интервальная оценка и чем она отличается от то-
чечной?
10.Что такое статистическая, нулевая и альтернативная гипотезы? Какую гипотезу называют простой, сложной, параметрической, непараметрической?
11.Дайте определение статистического критерия. Что такое ошибки первого и второго рода?
12.Какую гипотезу вы проверяете в этой работе? На какой статистике строится соответствующий критерий? Как найти число степеней свободы?
13.Какой смысл имеет уровень значимости критерия?
14.Опишите подробно критерий Пирсона.
80