Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

MATLAB00 / method112ML_СТАТИСТИКА

.pdf
Скачиваний:
78
Добавлен:
09.04.2015
Размер:
753.56 Кб
Скачать

15

 

 

 

 

 

15

 

 

 

10

 

 

 

 

y

 

 

 

 

y

 

 

 

 

Y

10

 

 

 

 

 

 

 

 

 

 

 

 

5

 

 

 

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

My

5

 

 

 

5

10

15

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

Вычисление выборочных числовых характеристик

 

 

0

5

10

15

Mx := n1 xi

Mx = 9.531

Dx:= n1 (xi Mx)2

Dx = 3.646

 

 

 

 

x,x,X,Mx

 

i

 

 

i

 

Определение доверительных интервалов

Sx:=

 

 

 

 

 

 

 

 

Sx = 1.909

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

−(x − μ)

2

 

Dx

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

( ,μ,σ) :=

1

 

 

 

1

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

β :=

0.95

S :=

1 r

 

 

My :=

 

y

 

 

 

My = 9.583

Dy :=

 

(

y

 

My

)

2

Dy = 5.265

 

n

fn x

2 π σ2

exp

 

2

 

n

i

 

 

n

i

 

 

 

 

 

2 σ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

Процедура определения доверительного интервала

 

 

 

 

Sy :=

Dy

 

 

 

 

 

Sy = 2.294

 

 

 

 

 

 

 

 

 

 

 

 

 

 

CInt(μ,σ) :=

y ← μ

 

 

 

 

 

 

 

 

 

:=

 

1

 

 

 

 

 

 

Kxy = 2.678

 

 

 

:=

 

 

Kxy

 

r = 0.611

 

 

 

 

 

y

 

 

 

 

 

Kxy

 

 

 

 

 

 

x y

i

Mx My

 

 

 

 

 

 

r

 

 

Sx Sy

 

 

 

 

 

 

 

 

 

 

 

n i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

fn(x,μ,σ) dx − β,y

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

z root 2

 

 

 

 

 

b1 := r

Sy

 

 

 

 

b1 = 0.735

b2 := r Sx

 

 

b2 = 0.509

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ

 

 

 

 

 

 

 

 

 

Sx

 

 

 

 

 

 

Sy

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Эмпирические прямые регрессии

Xi := Mx + b2 (yi My)

 

 

 

 

 

dz z n

 

 

 

 

 

 

Yi := My + b1 (xi Mx)

 

 

 

 

 

(μ − dz μ + dz )

 

 

 

 

 

График эмпирических прямых регрессии

 

 

 

 

 

 

 

 

 

 

 

 

Определение

доверительного интервала для r

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

r = 0.611

CInt(r,S) = ( 0.561 0.662)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Определение доверительного интервала для b1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

b1 = 0.735

 

 

 

Sy

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

CInt b1

,S

Sx = ( 0.668 0.801)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Определение доверительного интервала для b2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

b2 = 0.509

 

 

 

Sx

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

CInt b2

,S

Sy = ( 0.47 0.547)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пример 6.2 (Maple)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

> restart: with(stats): randomize():

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

61

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

62

 

 

 

 

 

>n:=20: muX:=10: sigmaX:=2: muV:=0: sigmaV:=2:

>x:=[random[normald[muX,sigmaX]](n)]:

>v:=[random[normald[muV,sigmaV]](n)]:

>y:=x+v:

>pxy:=[[x[i],y[i]] $i=1..n]:

>plot(pxy,style=point,symbol=circle);

>Mx:=1/n*sum(x[i],i=1..n);

>Dx:=1/n*sum((x[i]-Mx)^2,i=1..n); Sx:=sqrt(Dx);

>My:=1/n*sum(y[i],i=1..n);

>Dy:=1/n*sum((y[i]-My)^2,i=1..n); Sy:=sqrt(Dy);

>Kxy:=1/n*sum(x[i]*y[i]-Mx*My,i=1..n);

>r:=Kxy/Sx/Sy; b1:=r*Sy/Sx; b2:=r*Sx/Sy;

>Y:=evalm(My+b1*(x-Mx)): X:=evalm(Mx+b2*(y-My)):

>pxY:=[[x[i],Y[i]] $i=1..n]:

>pXy:=[[X[i],y[i]] $i=1..n]:

>plot([pxy,pxY,pXy,[[Mx,My]]],style=[point,line,

line,point],symbol=circle,color=[red,green,blue,

black],symbolsize=[10,10,10,20]);

>beta:=0.95: S:=evalf((1-r^2)/sqrt(n)):

>fn:=(x,mu,sigma)->

>exp(-(x-mu)^2/2/sigma^2)/sqrt(2*Pi*sigma^2):

>CInt:=proc(mu,sigma)

>local z,dz,x,y;

>z:=solve(2*int(fn(x,mu,sigma),x=0..y)-beta,y);

>dz:=z*sqrt(sigma/n);

>RETURN([mu-dz,mu+dz]);

>end:

>'r'=r, CInt(r,S);

>'b1'=b1, CInt(b1,S*Sy/Sx);

>'b2'=b2, CInt(b2,S*Sx/Sy);

Пример 6.3 (Mathematica)

<<Graphics`Colors`

<<Statistics`ContinuousDistributions` n=20; muX=10; sigmaX=2; muV=0; sigmaV=2;

x=RandomArray[NormalDistribution[muX,sigmaX],n];

v=RandomArray[NormalDistribution[muV,sigmaV],n];

y=x+v;

pxy=Transpose[{x,y}]; p1=ListPlot[pxy,PlotStyle->{Red,PointSize[.03]}]; Mx=1/n*Apply[Plus,x]

Dx=1/n*Apply[Plus,(x-Mx)^2] Sx=Sqrt[Dx]

63

My=1/n*Apply[Plus,y] Dy=1/n*Apply[Plus,(y-My)^2] Sy=Sqrt[Dy] Kxy=1/n*Apply[Plus,x*y-Mx*My] r=Kxy/Sx/Sy

b1=r*Sy/Sx

b2=r*Sx/Sy

Y=My+b1*(x-Mx); X=Mx+b2*(y-My); pxY=Transpose[{x,Y}]; pXy=Transpose[{X,y}]; p2=ListPlot[pxY,PlotStyle->{Blue},

PlotJoined->True]; p3=ListPlot[pXy,PlotStyle->{Green},

PlotJoined->True]; p4=ListPlot[{{Mx,My}},

PlotStyle->{Black,PointSize[.05]}]; Show[{p1,p2,p3,p4}];

beta=0.95; S=(1-r^2)/Sqrt[n]; CInt[mu_,sigma_]:=Module[{z,dz},z=y1/.FindRoot[

2*CDF[NormalDistribution[mu,sigma],y1]-beta==0, {y1,mu}][[1]];dz=z*Sqrt[sigma/n]; {mu-dz,mu+dz}];

Print["r=",r," ",CInt[r,S]] Print["b1=",b1," ",CInt[b1,S*Sy/Sx]] Print["b2=",b2," ",CInt[b2,S*Sx/Sy]]

Пример 6.4 (Matlab)

function lab6

n=20; muX=10; sigmaX=2; muV=0; sigmaV=2; x=normrnd(muX,sigmaX,1,n); v=normrnd(muV,sigmaV,1,n);

y=x+v; plot(x,y,'ro'), pause

Mx=1/n*sum(x), Dx=1/n*sum((x-Mx).^2), Sx=sqrt(Dx) My=1/n*sum(y), Dy=1/n*sum((y-My).^2), Sy=sqrt(Dy) Kxy=1/n*sum(x.*y-Mx*My)

r=Kxy/Sx/Sy, b1=r*Sy/Sx, b2=r*Sx/Sy x1=min(x):0.1:max(x); y1=min(y):0.1:max(y); Y=My+b1*(x1-Mx); X=Mx+b2*(y1-My); plot(x,y,'ro',x1,Y,'b',X,y1,'g',Mx,My,'kd'), pause beta=0.95; S=(1-r^2)/sqrt(n); rCI=CInt(r,S,beta,n); r, rCI b1CI=CInt(b1,S*Sy/Sx,beta,n); b1, b1CI b2CI=CInt(b2,S*Sx/Sy,beta,n); b2, b2CI

64

%--------------------------------------------------

function CI=CInt(mu,sigma,beta,n)

fn=inline(...

'exp(-(x-mu).^2/2/sigma^2)/sqrt(2*pi*sigma^2)',...

'x','mu','sigma');

dfn=inline('2*quad(f,0,y,[],[],mu,sigma)-beta',...

'y','f','mu','sigma','beta');

zn=inline('fzero(df,mu,[],f,mu,sigma,beta)',...

'f','df','mu','sigma','beta');

z=zn(fn,dfn,mu,sigma,beta); dz=z*sqrt(sigma/n);

CI=[mu-dz,mu+dz];

Задание

1.Вывести равенство (6.7).

2.Найти теоретически кривые регрессии, если известна плотность вероятности системы случайных величин:

f (x, y) = 0,5(x + y)exy , x > 0 , y > 0 .

3. Доказать, что при нормальном законе распределения двумерной случайной величины регрессии линейные.

Указание. Плотность распределения имеет вид:

 

1

 

 

 

 

 

 

1

 

 

 

(x mξ )

2

f (x, y) =

 

 

 

 

 

 

 

 

 

 

 

 

exp

 

 

 

 

 

 

 

 

2(1ρ

 

)

 

σ 2

 

2πσξση 1ρ

2

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

ξ

 

 

 

2ρ (x mξ )( y

mη )

 

(y mη )2

 

 

 

 

 

 

 

 

 

 

+

 

ση2

 

 

.

 

 

 

σξση

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Сделать замену переменных

x mξ

= u ,

 

y mη

 

= v .

 

 

 

 

ση

 

 

 

 

 

 

σξ

 

 

 

 

 

 

 

 

 

 

 

 

4.Получить две выборки нормально распределенных случайных величин x и y .

5.По выборкам найти выборочные числовые характеристики. Начертить прямые регрессии.

6.Найти доверительные интервалы для r , β1 и β2 при доверительной вероятности 0,95 , предполагая нормальное распределение генеральной совокупности.

7.Провести расчеты по документу для объёмов выборок 10, 20 и 50.

Контрольные вопросы

1.В чем различие между функциональной и статистической зависимостями ?

2.Что такое условные математическое ожидание и дисперсия ?

3.Как найти плотности компонентов и условные плотности, если функция f (x, y) известна?

4.Что такое корреляционный момент, коэффициент корреляции, регрессия?

5.Вывести формулы (6.5) и (6.8).

6.Как решается вопрос: из какого класса функций искать оценку регрессии?

7.Решить задачу:

Интерпретируя yi как диаметр деревьев, а xi как высоту (см.

таблицу 6.1), найти средний диаметр деревьев, имеющих высоту 26 м. Таблица 6.1

X

22

28

24

25

31

Y

0.6

0.6

0.3

0.2

0.8

8. Решить задачи № 7.25–7.28 гл. 15[2].

Литература

1.Гмурман В.Е. Теория вероятностей и математическая статистика.

М.: Высш. шк., I977.

2.Сборник задач по математике. Специальные курсы / Под редакцией Ефимова А.В. М.: Наука, I984.

3.Фирсов И.П., Никитина А.В., Бутенков С.А. Методические указания к практическим занятиям по математической статистике с применением ЭВМ. Таганрог: ТРТУ, 1997.

65

66

Фирсов Иван Парфенович Семерий Олег Сергеевич

МЕТОДИЧЕСКИЕ УКАЗАНИЯ к лабораторным работам

по математической статистике

с применением ЭВМ

для студентов II курса всех специальностей ЕГФ

Ответственный за выпуск О.С. Семерий Редактор Маныч Э.И. Корректор Проценко И.А.

ЛР№020565

1

Подписано к печати 22.04.97

Формат60X 84

Бумага газетная

 

16

 

Офсетная печать Усл.п.л.-3,6

Уч.-изд. л.-3,4.

Заказ №

 

Тир. 500 экз.

«C»

Издательство Таганрогского государственного радиотехнического университета

ГСП 17А, Таганрог, 28, Некрасовский, 44. Типография Таганрогского государственного радиотехнического уни-

верситета ГСП 17А, Таганрог, 28, Энгельса, 1.

67

Соседние файлы в папке MATLAB00