
- •Курсовая работа по
- •Статистическое описание и выборочные характеристики двумерного случайного вектора.
- •Для контроля правильности вычислений используется тождество
- •Однофакторный дисперсионный анализ.
- •Границы доверительного интервала для Lk имеют вид
- •Практическая часть
- •Для контроля правильности вычислений используется тождество
- •2)Вычисление ei , Qe , Qr , s2 , r2, rxy
- •3)Доверительные интервалы
- •4)Однофакторный дисперсионный анализ
Московский Государственный Институт
Электронной Техники (ТУ)
Курсовая работа по
«Теории вероятностей и математической статистике»
« Анализ данных в линейной регрессионной модели»
Выполнил :
Павлов М.В.
ЭКТ-23
Преподаватель:
Мустафин Н.Н.
МОСКВА
2003 г
План.
1)Данные.
2)Теоретическая часть.
3)Практическая часть.
X |
Y |
Остатки |
6,15 |
18,94 |
0,849025 |
7,07 |
18,51 |
0,034005 |
7,35 |
18,46 |
-0,13318 |
8,16 |
18,58 |
-0,35216 |
3,73 |
16,18 |
-0,89821 |
5,67 |
17,84 |
-0,0501 |
4,95 |
17,42 |
-0,16878 |
4,11 |
17,19 |
-0,04724 |
7,81 |
19,05 |
0,264315 |
4,29 |
17,48 |
0,167435 |
6,68 |
17,91 |
-0,40278 |
3,25 |
16,82 |
-0,05732 |
6,49 |
18,44 |
0,206735 |
4,71 |
17,53 |
0,041665 |
3,25 |
17,29 |
0,412675 |
7,34 |
18,6 |
0,01101 |
7,4 |
18,96 |
0,3459 |
4,78 |
17,84 |
0,32237 |
6,18 |
18,82 |
0,71647 |
6,44 |
18,8 |
0,58766 |
6,45 |
17,73 |
-0,48653 |
7,58 |
18,57 |
-0,11943 |
6,18 |
17,74 |
-0,36353 |
7,53 |
19,89 |
1,221495 |
4,76 |
17,44 |
-0,06926 |
5,78 |
18,24 |
0,30387 |
6,97 |
19,01 |
0,575855 |
4,58 |
16,25 |
-1,18393 |
3,45 |
16,56 |
-0,40103 |
5,04 |
17,15 |
-0,47644 |
7,08 |
17,75 |
-0,73018 |
5,04 |
18,35 |
0,72356 |
4,92 |
16,77 |
-0,80622 |
5,82 |
17,41 |
-0,54287 |
6,31 |
18,71 |
0,552065 |
6,59 |
19,05 |
0,774885 |
9,11 |
17,32 |
-2,00974 |
9,91 |
19,65 |
-0,01454 |
5,78 |
18,22 |
0,28387 |
3,4 |
16,55 |
-0,3901 |
3,83 |
17,65 |
0,529945 |
4,75 |
17,86 |
0,354925 |
3,32 |
17,33 |
0,42338 |
5,82 |
17,16 |
-0,79287 |
4,79 |
17,42 |
-0,10181 |
5,13 |
16,54 |
-1,12411 |
8,63 |
19,92 |
0,791145 |
3,94 |
17,2 |
0,03391 |
5,21 |
18,57 |
0,872415 |
3,7 |
17,39 |
0,32435 |
Статистическое описание и выборочные характеристики двумерного случайного вектора.
Пусть (xi,yi), i = 1,2,......,n ,- выборка объема n из наблюдений случайного двумерного вектора (X,Y). Предварительное представление о двумерной генеральной совокупности можно получить, изображая элементы выборки точками на плоскости с выбранной декартовой прямоугольной системой координат. Это представление выборки называется диаграммой рассеивания.
Построить диаграмму рассеяния нанести на нее уравнения регресси Y на X
y=*0 +*1x и X на Y x=*0 +*1y.
Сначала вычислим суммы
xi , yi ,x2i ,y2i , xiyi , (xi+yi)2
Для контроля правильности вычислений используется тождество
(xi+yi)2= x2i + 2 xiyi + y2i
Выборочные средние находятся по формулам
x*=*1,0=(1/n) xi , y*=*0,1=(1/n) yi . (1)
Затем вычисляются суммы квадратов отклонений от среднего и произведений отклонений от средних :
Qx=(xi – x*)2=x2i – (x)2i/n , (2)
Qy=(yi – y*)2=y2i – (y)2i/n , (3)
Qxy=(xi – x*)(yi – y*)=xiyi – (x i)(yi )/n , (4)
Отсюда
D*x= (1/n) Qx , D*y= (1/n) Qy ,
R=(*1,1)/ (D*x D*y)1/2= (Qxy)/( Qx Qy)1/2 (5)
Выборочная линейная регрессия Y на X по выборке (xi , yi ), i= 1,......, n определяется уравнением
y=*0 +*1x= y* + r (D*y / D*x ) (x – x*)
Коэффициенты *0 и *1 называются выборочными коэффициентами регрессии. Они вычисляются по формулам
1*=[n xiyi – (x i)(yi )]/(n x2i - (xi)2 ) = Qxy / Qx (6)
0* = y*- 1*x* (7)
Аналогично определяется выборочная линейная регрессия X на Y :
x=*0 +*1y = x* + r (D*x / D*y ) (y – y*)
1*=[n xiyi – (x i)(yi )]/(n y2i - (yi)2 ) = Qxy / Qy (8)
0*= x*- *1y* (9)
Для контроля правильности расчетов используют соотношение
(1*1*)1/2= r (10)
Прямые
y=*0 +*1x , x=*0 +*1y
Пересекаются в точке с координатами (x*, y* )
Функция y=*0 +*1x
Определяет выборочную (эмпирическую ) регрессию Y на x. Последняя является оценкой предполагаемой (теоретической) регрессии по результатам наблюдений. Разности между наблюдаемыми значениями переменной Y при x=xi , i=1,2,....,n, и расчетными значениями ŷi=*0 +*1x называются остатками и обозначаются ei :
ei = yi – ŷ i, i = 1,2,......,n . Все остатки приведены в таблице 1. (11)
Качество аппроксимации результатов наблюдений (xi,yi), i = 1,2,......,n , выборочной регрессии определяется величиной остаточной дисперсии , вычисляемой по формуле
S2= e2i /(n-2)=1/(n-2) [ yi – (*0 +*1xi)]2=Qe/(n-2) (12)
Величина Qe определяемая выражением
Qe = e2i= (yi – ŷ i)2 (13)
Называется остаточной суммой квадратов.
В практических вычислениях остаточную сумму квадратов получают из тождества
(yi – y*i)2 = (ŷi – y*i )2 + (yi – ŷi) 2 (14)
Которое записывается в виде
Qy = Qr + Qe , где
Qy= (yi – y*i)2= y2i – n*(y*i )2,
Qr = (ŷi – y*i )2=*1 Qxy=2*1 Qx= Q2xy/ Qx (15)
Величина Qr называется суммой квадратов, обусловленной регрессией регрессией.
Полезной характеристокой линейной регрессии является коэффициент детерминации R2 , вычисляемый по формуле
R2= Qr / Qy =1 – (Qe / Qy) (16)
Коэффициент детерминации R2 равен той доле разброса результатов наблюдений (xi,yi), i = 1,2,......,n , относительно горизонтальной прямой y=y* , которая объсняется выборочной регрессией . Величина R= + (R2)1/2 является оценкой коэффициента корреляции между результатами наблюдений yi и вычисленными значениями ŷi , предсказываемыми регрессией , т.е.
R= p*yŷ= ryŷ
В случае линейной регрессии Yнаx(одной независимой переменнойx) между коэффициентомRи выборочным коэффициентом корреляцииrxyимеется следующее соотношение :
rxy = ( знак *1 ) R .