- •Курсовая работа по «Теории вероятностей и математической статистике»
- •Статистическое описание и выборочные характеристики двумерного случайного вектора.
- •Для контроля правильности вычислений используется тождество
- •Однофакторный дисперсионный анализ.
- •Границы доверительного интервала для Lk имеют вид
- •Практическая часть
- •Для контроля правильности вычислений используется тождество
- •2)Вычисление ei , Qe , Qr , s2 , r2, rxy
- •3)Доверительные интервалы
- •4)Однофакторный дисперсионный анализ
Московский Государственный Институт
Электронной Техники (ТУ)

Курсовая работа по «Теории вероятностей и математической статистике»
« Анализ данных в линейной регрессионной модели»
Выполнил :
Кудинов П. В.
ЭКТ-21
Преподаватель:
Ремарова Т. В.
МОСКВА
2003 г
Статистическое описание и выборочные характеристики двумерного случайного вектора.
Пусть (xi,yi), i = 1,2,......,n ,- выборка объема n из наблюдений случайного двумерного вектора (X,Y). Предварительное представление о двумерной генеральной совокупности можно получить, изображая элементы выборки точками на плоскости с выбранной декартовой прямоугольной системой координат. Это представление выборки называется диаграммой рассеивания.
Построить диаграмму рассеяния нанести на нее уравнения регрессии Y на X
y=*0 +*1x и X на Y x=*0 +*1y.
Сначала вычислим суммы
xi , yi ,x2i ,y2i , xiyi , (xi+yi)2
Для контроля правильности вычислений используется тождество
(xi+yi)2= x2i + 2 xiyi + y2i
Выборочные средние находятся по формулам
x*=*1,0=(1/n) xi , y*=*0,1=(1/n) yi . (1)
Затем вычисляются суммы квадратов отклонений от среднего и произведений отклонений от средних :
Qx=(xi – x*)2=x2i – (x)2i/n , (2)
Qy=(yi – y*)2=y2i – (y)2i/n , (3)
Qxy=(xi – x*)(yi – y*)=xiyi – (x i)(yi )/n , (4)
Отсюда
D*x= (1/n) Qx , D*y= (1/n) Qy ,
R=(*1,1)/ (D*x D*y)1/2= (Qxy)/( Qx Qy)1/2 (5)
Выборочная линейная регрессия Y на X по выборке (xi , yi ), i= 1,......, n определяется уравнением
y=*0 +*1x= y* + r (D*y / D*x ) (x – x*)
Коэффициенты *0 и *1 называются выборочными коэффициентами регрессии. Они вычисляются по формулам
1*=[n xiyi – (x i)(yi )]/(n x2i - (xi)2 ) = Qxy / Qx (6)
0* = y*- 1*x* (7)
Аналогично определяется выборочная линейная регрессия X на Y :
x=*0 +*1y = x* + r (D*x / D*y ) (y – y*)
1*=[n xiyi – (x i)(yi )]/(n y2i - (yi)2 ) = Qxy / Qy (8)
0*= x*- *1y* (9)
Для контроля правильности расчетов используют соотношение
(1*1*)1/2= r (10)
Прямые
y=*0 +*1x , x=*0 +*1y
Пересекаются в точке с координатами (x*, y* )
Функция y=*0 +*1x
Определяет выборочную (эмпирическую ) регрессию Y на x. Последняя является оценкой предполагаемой (теоретической) регрессии по результатам наблюдений. Разности между наблюдаемыми значениями переменной Y при x=xi , i=1,2,....,n, и расчетными значениями ŷi=*0 +*1x называются остатками и обозначаются ei :
ei = yi – ŷ i, i = 1,2,......,n . Все остатки приведены в таблице 1. (11)
Качество аппроксимации результатов наблюдений (xi,yi), i = 1,2,......,n , выборочной регрессии определяется величиной остаточной дисперсии , вычисляемой по формуле
S2= e2i /(n-2)=1/(n-2) [ yi – (*0 +*1xi)]2=Qe/(n-2) (12)
Величина Qe определяемая выражением
Qe = e2i= (yi – ŷ i)2 (13)
Называется остаточной суммой квадратов.
В практических вычислениях остаточную сумму квадратов получают из тождества
(yi – y*i)2 = (ŷi – y*i )2 + (yi – ŷi) 2 (14)
Которое записывается в виде
Qy = Qr + Qe , где
Qy= (yi – y*i)2= y2i – n*(y*i )2,
Qr = (ŷi – y*i )2=*1 Qxy=2*1 Qx= Q2xy/ Qx (15)
Величина Qr называется суммой квадратов, обусловленной регрессией
Полезной характеристикой линейной регрессии является коэффициент детерминации R2 , вычисляемый по формуле
R2= Qr / Qy =1 – (Qe / Qy) (16)
Коэффициент детерминации R2 равен той доле разброса результатов наблюдений (xi,yi), i = 1,2,......,n , относительно горизонтальной прямой y=y* , которая объясняется выборочной регрессией . Величина R= + (R2)1/2 является оценкой коэффициента корреляции между результатами наблюдений yi и вычисленными значениями ŷi , предсказываемыми регрессией , т.е.
R= p*yŷ= ryŷ
В случае линейной регрессии Yнаx(одной независимой переменнойx) между коэффициентомRи выборочным коэффициентом корреляцииrxyимеется следующее соотношение :
rxy = ( знак *1 ) R .
