Скачиваний:
21
Добавлен:
17.04.2013
Размер:
121.86 Кб
Скачать

Московский Государственный Институт

Электронной Техники (ТУ)

Курсовая работа по «Теории вероятностей и математической статистике»

« Анализ данных в линейной регрессионной модели»

Выполнил :

Кудинов П. В.

ЭКТ-21

Преподаватель:

Ремарова Т. В.

МОСКВА

2003 г

Статистическое описание и выборочные характеристики двумерного случайного вектора.

Пусть (xi,yi), i = 1,2,......,n ,- выборка объема n из наблюдений случайного двумерного вектора (X,Y). Предварительное представление о двумерной генеральной совокупности можно получить, изображая элементы выборки точками на плоскости с выбранной декартовой прямоугольной системой координат. Это представление выборки называется диаграммой рассеивания.

Построить диаграмму рассеяния нанести на нее уравнения регрессии Y на X

y=*0 +*1x и X на Y x=*0 +*1y.

Сначала вычислим суммы

xi , yi ,x2i ,y2i , xiyi , (xi+yi)2

Для контроля правильности вычислений используется тождество

 (xi+yi)2= x2i + 2 xiyi + y2i

Выборочные средние находятся по формулам

x*=*1,0=(1/n) xi , y*=*0,1=(1/n) yi . (1)

Затем вычисляются суммы квадратов отклонений от среднего и произведений отклонений от средних :

Qx=(xi – x*)2=x2i – (x)2i/n , (2)

Qy=(yi – y*)2=y2i – (y)2i/n , (3)

Qxy=(xi – x*)(yi – y*)=xiyi – (x i)(yi )/n , (4)

Отсюда

D*x= (1/n) Qx , D*y= (1/n) Qy ,

R=(*1,1)/ (D*x D*y)1/2= (Qxy)/( Qx Qy)1/2 (5)

Выборочная линейная регрессия Y на X по выборке (xi , yi ), i= 1,......, n определяется уравнением

y=*0 +*1x= y* + r (D*y / D*x ) (x – x*)

Коэффициенты *0 и *1 называются выборочными коэффициентами регрессии. Они вычисляются по формулам

1*=[n  xiyi – (x i)(yi )]/(n x2i - (xi)2 ) = Qxy / Qx (6)

0* = y*- 1*x* (7)

Аналогично определяется выборочная линейная регрессия X на Y :

x=*0 +*1y = x* + r (D*x / D*y ) (y – y*)

1*=[n  xiyi – (x i)(yi )]/(n y2i - (yi)2 ) = Qxy / Qy (8)

0*= x*- *1y* (9)

Для контроля правильности расчетов используют соотношение

(1*1*)1/2= r (10)

Прямые

y=*0 +*1x , x=*0 +*1y

Пересекаются в точке с координатами (x*, y* )

Функция y=*0 +*1x

Определяет выборочную (эмпирическую ) регрессию Y на x. Последняя является оценкой предполагаемой (теоретической) регрессии по результатам наблюдений. Разности между наблюдаемыми значениями переменной Y при x=xi , i=1,2,....,n, и расчетными значениями ŷi=*0 +*1x называются остатками и обозначаются ei :

ei = yi – ŷ i, i = 1,2,......,n . Все остатки приведены в таблице 1. (11)

Качество аппроксимации результатов наблюдений (xi,yi), i = 1,2,......,n , выборочной регрессии определяется величиной остаточной дисперсии , вычисляемой по формуле

S2= e2i /(n-2)=1/(n-2) [ yi – (*0 +*1xi)]2=Qe/(n-2) (12)

Величина Qe определяемая выражением

Qe =  e2i= (yi – ŷ i)2 (13)

Называется остаточной суммой квадратов.

В практических вычислениях остаточную сумму квадратов получают из тождества

 (yi – y*i)2 =  (ŷi – y*i )2 +  (yi – ŷi) 2 (14)

Которое записывается в виде

Qy = Qr + Qe , где

Qy=  (yi – y*i)2=  y2i – n*(y*i )2,

Qr = (ŷi – y*i )2=*1 Qxy=2*1 Qx= Q2xy/ Qx (15)

Величина Qr называется суммой квадратов, обусловленной регрессией

Полезной характеристикой линейной регрессии является коэффициент детерминации R2 , вычисляемый по формуле

R2= Qr / Qy =1 – (Qe / Qy) (16)

Коэффициент детерминации R2 равен той доле разброса результатов наблюдений (xi,yi), i = 1,2,......,n , относительно горизонтальной прямой y=y* , которая объясняется выборочной регрессией . Величина R= + (R2)1/2 является оценкой коэффициента корреляции между результатами наблюдений yi и вычисленными значениями ŷi , предсказываемыми регрессией , т.е.

R= p*yŷ= ryŷ

В случае линейной регрессии Yнаx(одной независимой переменнойx) между коэффициентомRи выборочным коэффициентом корреляцииrxyимеется следующее соотношение :

rxy = ( знак *1 ) R .

Соседние файлы в папке 15 вар