Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Математика Лабораторный практикум часть 2

.pdf
Скачиваний:
90
Добавлен:
09.02.2015
Размер:
1.47 Mб
Скачать

Находим точечные оценки математического ожидания m (выборочное среднее значение), дисперсии S и среднего квадратического отклонения s:

> m:=mean(Y);

m :=18.74512500

> S:=variance(Y);

S:=78.14432245

>s:=standarddeviation(Y1);

s :=8.839927740

Находим исправленные оценки дисперсии (несмещённая оценка дисперсии) и среднего квадратического отклонения:

> S1:=S*n/(n-1);

S1 :=79.13349109

> s1:=sqrt(S1);

s1 :=8.895700708

Находим точечные оценки параметров равномерного распреде-

ления: a xв 3 в ,b xв 3 в , где xв m, в s1

> a:= m-sqrt(3.0)*s1; b:= m+sqrt(3.0)*s1; a :=3.33731940

b :=34.15293060

Вычислим вероятности попадания значения случайной величины в первый и последний (k-ый) интервалы:

> p[1]:=(Z[2]-a)/(b-a);

p1 := .1427822875

> p[k]:=(b-Z[k])/(b-a);

p7 := .1275156749

Вычислим вероятности попадания значения случайной величи-

ны во 2, 3, …, k-1 интервалы по формулам pi Z( j 1) Z(J):

b a

> for j from 2 to 6 do p[j]:=(Z[j+1]-Z[j])/(b-a) od; p2 := .1459404074

p3 := .1459404076 p4 := .1459404076 p5 := .1459404073 p6 := .1459404076

Находим теоретические частоты npi:

> for j from 1 to k do n*p[j] od;

11.42258300

11.67523259

71

11.67523261

11.67523261

11.67523258

11.67523261

10.20125399

Так как все npi > 5, то пересчёт не делаем, число интервалов остаётся прежним: k = 7.

Сравним эмпирические ni и теоретические npi частоты, для этого

находим наблюдаемое значение по формуле 2набл k (ni npi )2 .

i 1 npi

> chi2:=sum((Y3f[i]-n*p[i])^2/(n*p[i]),i=1..7);

:=.9115218202

По таблице критических точек распределения 2, по заданному уровню значимости и числу степеней свободы ν = s-l-1 (s число интервалов после пересчёта, l – число параметров в гипотетической функции распределения) находят критическую точку 2кр ( , ). В на-

шем случае = 0,01(см. задание), s = k = 7, l = 2, т.е. ν = 7-2-1=4, тогда

кр2 (0.01,4) 13.3.

Так как набл2 2кр , то гипотеза о равномерном распределении генеральной совокупности принимается.

Запишем гипотетическую функцию плотности распределения

0,

x a,

 

1

 

 

 

f (x)

 

 

,a x b

 

 

b a

0,

x b

 

 

 

и построим на одном рисунке гистограмму относительных частот и график плотности гипотетического распределения.

> f:=piecewise(x<a,0,x>=a and x<=b,1/(b-a),x>b,0);

 

 

0

x 3.33731940

 

f :=

 

.03245108440

3.33731940 x 0 and

x 34.15293060

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

34.15293060 x

 

 

 

 

>f1:=plot(f,x=ymin-1..ymax+1):

>plots[display](Hist,f1);

72

Запишем гипотетическую функцию распределения

0, x a,

 

 

 

x a

F(x)

 

 

, a x b

 

 

b a

0,

x b

 

 

 

ипостроим её график.

>F:=piecewise(x<a,0,x>=a and x<=b,(x-a)/(b-a),x>b,1);

 

0

x 3.33731940

 

.1082996335 .03245108440 x

3.33731940 x 0 and x 34.15293060

F :=

 

 

 

 

 

 

 

 

 

 

1

34.15293060 x

 

>F1:=plot(F,x=0..ymax+10):

>plots[display](F1);

73

Проверка гипотезы о показательном распределении

Загрузим пакет stats и подпакеты transform, describe.

> restart:with(stats):with(transform):with(describe):

Вводим реализацию выборки (см. данные своего варианта): > Y:=[0.63,16.04,6.09,3.42,9.25,2.87,1.34,11.24,4.96,3.74, 9.25,1.71,20.96,6.72,8.71,1.06,19.12,0.02,8.58,31.52, 0.29,8.13,17.40,1.62,3.13,18.48,30.30,9.16,2.39,1.48, 5.28,13.82,1.77,2.26,1.70,7.87,9.74,21.21,7.79,.67, 18.76,8.34,1.87,7.02,2.32,2.43,3.07,4.85,5.14,5.85, 1.14,2.78,4.99,7.51,2.59,2.00,11.62,1.65,9.02,1.51, 11.21,22.13,0.48,13.20,12.34,5.25,5.73,0.72,14.11,9.62, 13.54,12.87,27.11,1.08,5.94,1.86,30.53,6.30,20.13,3.41];

Y := [.63, 16.04, 6.09, 3.42, 9.25, 2.87, 1.34, 11.24, 4.96, 3.74, 9.25, 1.71, 20.96, 6.72, 8.71, 1.06, 19.12, .02, 8.58, 31.52, .29, 8.13, 17.40, 1.62, 3.13, 18.48, 30.30, 9.16, 2.39, 1.48, 5.28, 13.82, 1.77, 2.26, 1.70, 7.87, 9.74, 21.21, 7.79, .67, 18.76, 8.34, 1.87, 7.02, 2.32, 2.43, 3.07, 4.85, 5.14, 5.85, 1.14, 2.78, 4.99, 7.51, 2.59, 2.00, 11.62, 1.65, 9.02, 1.51, 11.21, 22.13, .48, 13.20, 12.34, 5.25, 5.73, .72, 14.11, 9.62,

13.54, 12.87, 27.11, 1.08, 5.94, 1.86, 30.53, 6.30, 20.13, 3.41]

Определим объём выборки (подсчитаем количество значений в выборке) и рассчитаем количество интервалов разбиения k:

> n:=count(Y);k:=round(1+1.4*ln(n)); n:=80

k :=7

Проведём сортировку выборки (варианты расположим в порядке возрастания):

> Y1:=statsort(Y);

Y1 := [.02, .29, .48, .63, .67, .72, 1.06, 1.08, 1.14, 1.34, 1.48, 1.51, 1.62, 1.65, 1.70, 1.71, 1.77, 1.86, 1.87, 2.00, 2.26, 2.32, 2.39, 2.43, 2.59, 2.78, 2.87, 3.07, 3.13, 3.41, 3.42, 3.74, 4.85, 4.96, 4.99, 5.14, 5.25, 5.28, 5.73, 5.85, 5.94, 6.09, 6.30, 6.72, 7.02, 7.51, 7.79, 7.87, 8.13, 8.34, 8.58, 8.71, 9.02, 9.16, 9.25, 9.25, 9.62, 9.74, 11.21, 11.24, 11.62, 12.34, 12.87, 13.20, 13.54, 13.82, 14.11, 16.04, 17.40, 18.48, 18.76,

19.12, 20.13, 20.96, 21.21, 22.13, 27.11, 30.30, 30.53, 31.52]

Находим минимальное и максимальное значения выборки и длину интервала разбиения:

> ymin:=Y1[1];ymax:=Y1[n];h:=(ymax-ymin)/k; ymin :=.02

ymax:=31.52 h :=4.500000000

74

Вычислим границы интервалов разбиения:

> Y2:=[seq(ymin+(i-1)*(h+0.0001)..ymin+i*(h+0.0001),i=1..k)];

Y2 := [.02 .. 4.520100000 , 4.520100000 .. 9.020200000 , 9.020200000 .. 13.52030000 ,

13.52030000 .. 18.02040000 , 18.02040000 .. 22.52050000 ,

22.52050000 .. 27.02060000 , 27.02060000 .. 31.52070000 ]

Находим вектор точек разбиения:

> Z:=[seq(ymin+(i-1)*(h+0.0001),i=1..k+1)];

Z := [ .02 , 4.520100000 , 9.020200000 , 13.52030000 , 18.02040000 , 22.52050000 , 27.02060000 , 31.52070000 ]

Составляем интервальный ряд частот Y3 (каждому интервалу поставим в соответствие частоту ni, т.е. число элементов выборки, попадающих в данный интервал) и вектор частот Y3f:

> Y3:=statsort(transform[tallyinto](Y1,Y2));

Y3 := [Weight(.02 .. 4.520100000 , 32 ), Weight(4.520100000 .. 9.020200000 , 21 ), Weight(9.020200000 .. 13.52030000 , 11 ), Weight(13.52030000 .. 18.02040000 , 5), Weight(18.02040000 .. 22.52050000 , 7), Weight(22.52050000 .. 27.02060000 , 0), Weight(27.02060000 .. 31.52070000 , 4)]

> Y3f:=transform[frequency](Y3);

Y3f:=[32, 21, 11, 5, 7, 0, 4]

Получим интервальный ряд относительных частот (каждому интервалу поставим в соответствие относительную частоту, т.е. частоту, делённую на объём выборки):

> Y4:=transform[scaleweight[1/n]](Y3);

Y4

 

 

 

2

 

 

 

21

 

:= Weight

.02 .. 4.520100000 ,

 

 

, Weight

4.520100000 .. 9.020200000 ,

 

,

 

 

 

 

 

 

 

5

 

 

 

80

 

 

 

 

 

 

 

 

 

 

 

 

11

Weight

9.020200000

.. 13.52030000 ,

 

 

,

 

 

 

 

80

 

 

 

 

 

 

 

 

 

 

1

 

 

Weight

13.52030000

.. 18.02040000 ,

 

 

,

 

 

 

 

 

16

 

 

 

 

 

 

 

 

 

 

7

 

 

Weight

18.02040000

.. 22.52050000 ,

 

 

, Weight(22.52050000 .. 27.02060000 , 0),

 

 

 

 

 

80

 

 

 

 

 

 

 

Weight

 

27.02060000 .. 31.52070000 ,

1

 

 

 

 

 

 

 

20

 

 

 

 

 

Строим гистограмму относительных частот:

>Hist:=statplots[histogram](Y4,color=green):

>plots[display](Hist);

75

По виду гистограммы выдвигаем гипотезу о показательном распределении генеральной совокупности.

Находим накопленные частоты Y5 (накопленная частота показывает, сколько наблюдалось значений, меньших заданного x) и относительные накопленные частоты Y6:

> Y5:=transform[cumulativefrequency](Y3);

Y5 :=[32, 53, 64, 69, 76, 76, 80]

> Y6:=transform[cumulativefrequency](Y4);

Y6

 

2

53

4

 

69

 

19

19

 

 

 

:=

 

 

 

,

 

,

 

,

 

 

,

 

,

 

 

, 1

 

 

 

 

 

 

 

 

 

 

 

 

5

80

5

 

80

 

20

20

 

 

 

 

 

 

 

 

 

 

 

Строим график эмпирической функции распределения: > p:=[seq(plot(Y6[i],Y2[i],color=blue),i=1..k)]:plots[display](p);

76

Находим точечные оценки математического ожидания a (выборочное среднее значение), дисперсии S и среднего квадратического отклонения s:

> a:=mean(Y);

a :=8.171750000

> S:=variance(Y);

S:=58.08411190

>s:=standarddeviation(Y1);

s :=7.621293322

Находим исправленные оценки дисперсии (несмещённая оценка дисперсии) и среднего квадратического отклонения:

> S1:=S*n/(n-1);

S1 :=58.81935382

> s1:=sqrt(S1);

s1 :=7.669377668

Находим точечную оценку параметра показательного распределения:

> lambda:=1/a;

:=.1223728088

Вычислим вероятности попадания значения случайной величины в первый и последний (k-ый) интервалы:

> p[1]:=int(lambda*exp(-lambda*t),t=0..Z[2]);

p[k]:=int(lambda*exp(-lambda*t),t=Z[k]..infinity); p1 := .4248574369

p7 := .03664102673

Вычислим вероятности попадания значения случайной величи-

zi 1

ны во 2, 3, …, k -1 интервалы по формулам pi e tdt:

zi

>for j from 2 to k-1 do p[j]:=int(lambda*exp(-

lambda*t),t=Z[j]..Z[j+1]) od;

p2 := .2435430122 p3 := .1404151921 p4 := .08095664905 p5 := .04667571172 p6 := .02691097136

Находим теоретические частоты npi: > for j from 1 to k do n*p[j] od;

77

33.98859495

19.48344098

11.23321537

6.476531924

3.734056938

2.152877709

2.931282138

Так как на трёх последних интервалах npi < 5, то объединим эти интервалы и пересчитаем соответствующие вероятности и частоты, при этом число интервалов будет 5:

> p[5]:= p[5]+p[6]+p[7];Y3f[5]:=Y3f[5]+Y3f[6]+Y3f[7];

p5 := .1737797079

Y3f5 := 15

Сравним эмпирические ni и теоретические npi частоты, для этого

 

k

 

 

2

 

 

(ni

npi )

 

находим наблюдаемое значение по формуле набл2

 

, где i =

 

 

 

i 2

 

npi

 

 

= 1,2,…,5, так как три последних интервала объединили.

> chi2:=sum((Y3f[i]-n*p[i])^2/(n*p[i]),i=1..5);

:=.6625187570

По таблице критических точек распределения 2, по заданному уровню значимости и числу степеней свободы ν = s-l-1 (s число интервалов после пересчёта, l – число параметров в гипотетической функции распределения) находят критическую точку 2кр ( , ). В на-

шем случае = 0,01(см. задание), s = 5, l = 1, т.е. ν = 5-1-1=3, тогда

кр2 (0.01,2) 11.3.

Так как набл2 2кр , то гипотеза о показательном распределении

генеральной совокупности принимается.

Запишем гипотетическую функцию плотности распределения

0,

x 0,

f (x)

и построим на одном рисунке гистограмму относи-

e x , x 0

тельных частот и график плотности гипотетического распределения. > f:=piecewise(x<0,0,x>=0,evalf(lambda*exp(-lambda*x)));

0

 

x 0

f :={

( .1223728088x)

0 x

.1223728088 e

>f1:=plot(f,x=-10..ymax+10):

>plots[display](Hist,f1);

78

Запишем гипотетическую функцию распределения

0,

x 0,

F(x)

 

1 e x , x 0

ипостроим её график.

>F:=piecewise(x<0,0,x>=0,1-exp(-lambda*x));

F := {

0

 

x 0

( .1223728088

x)

0 x

1 e

>F1:=plot(F,x=-10..ymax+10):

>plots[display](F1);

79

Контрольные вопросы к лабораторным работам 4 и 5

1.Что называется генеральной совокупностью, выборкой, реализацией выборки? Привести примеры.

2.Как построить сгруппированный и интервальный статистические ряды?

3.В чём заключается выборочный метод построения математической модели эксперимента?

4.Что называется эмпирической функцией распределения? Какими свойствами она обладает?

5.В чём состоит отличие эмпирической функции распределения от теоретической?

6.Как построить гистограмму частот, относительных частот? Что называется статистикой, оценкой неизвестного параметра?

7.Какая оценка называется состоятельной, несмещённой, эффективной?

8.Какие оценки математического ожидания и дисперсии генеральной совокупности вы знаете?

9.Что такое интервальная оценка и чем она отличается от то-

чечной?

10.Что такое статистическая, нулевая и альтернативная гипотезы? Какую гипотезу называют простой, сложной, параметрической, непараметрической?

11.Дайте определение статистического критерия. Что такое ошибки первого и второго рода?

12.Какую гипотезу вы проверяете в этой работе? На какой статистике строится соответствующий критерий? Как найти число степеней свободы?

13.Какой смысл имеет уровень значимости критерия?

14.Опишите подробно критерий Пирсона.

80