Границы доверительного интервала для Lk имеют вид
Lk* SLK [(n-l) F1-(l-1,n-l)]1/2
Практическая часть.
Построить диаграмму рассеяния нанести на нее уравнения регресси Y на X
y=*0 +*1x и X на Y x=*0 +*1y.
Объем выборки n=50. Предварительно вычислим
xi = 287,21, yi = 896,06 ,x2i = 1778,5947 ,y2i = 16099,5576 , xiyi = 5201,0637 .
Тогда по формуле (1)
x*=287,21/50= 5,7442 , y*=896,06 /50=17,9212
Для контроля правильности вычислений используется тождество
(xi+yi)2= 28280,2797
x2i + 2 xiyi + y2i = 1778,5947+2*5201,0637+16099,5576=28280,2797
Следовательно, вычисления проведены верно . Предварительно найдем
Qx=1778,5947 - (287,21)2/50= 128,803
Qy=16099,5576 - (896,06)2/50= 41,0871
Qxy=5201,0637 - (287,21)(896,06)/50= 53,9158
Окончательно из соотношений (5) получаем
D*x=2,5761 , D*y = 0,8217
R=0,7411
По формулам (6) и (7) найдем оценки коэффициентов регрессии
1*= 53,9158 / 128,803= 0,4185
0* = 17,9212- 0,4185*5,7442= 15,5172.
1*= 53,9158 / 41,0871=1,3122
0*=5,7442 - 1,3122 *17,9212=--17,7720.
Таким образом, выборочная линейная регрессия имеет вид
y=15,5172+0,4185*x
x=-17,7720+1,3122 *y
Точка пересечения (5,7442 ,17,9212)
ei = yi – ŷ i, i = 1,2,......,n . Все остатки приведены в таблице 1.
Находим остаточную сумму квадратов Qe
Qe = e2i=18,5184
По формуле (15) находим сумму квадратов, обусловленную регреггией Qr
Qr= Qy -Qe = 41,0871-18,5184=22,5687
Оценка дисперсии ошибок наблюдений по формуле (12) равна
S2=18,5184/(50-2)=0,3858 ,s=0,6211
Значение квантили t1-/2(n-2)= t1-/2(48) = 2,021 (таблица П6)
Границы доверительных интервалов равны: для коэффициента 0*
0* t1-/2(n-2) * s * [x2i/(n*Qx)]1/2 = 15,5172 2,021 * 0,6211* [(1778,5947/(50*128,803)]1/2= 15,5172 0,6596
для коэффициента 1*
1* t1-/2(n-2) * s * [1/Qx]1/2 = 0,4185 2,021 * 0,6211 (1/128,803)1/2=0,4185 0,1105
Границы доверительного интервала для значения Y0 соответствующего заданному значению переменной x=x0:
y0* t1-/2(n-2) * s *[1/n + {(x0-x*)2/Qx}]1/2= y0* 2,021 * 0,6211*[1/50 + {(x0- 5,7442 )2/128,803}]1/2 = y0* 1,2552*[1/50 + {(x0- 5,7442 )2/128,803}]1/2
Границы доверительного интервала для дисперсии ошибок наблюдений 2
[(n-2)* s2]/21-/2(n-2) < 2 < [(n-2)*s2]/2/2(n-2)
[48*0,3858]/67,5< 2 < [48*0,3858]/34,8
0,2743 < 2 < 0,5321
Коэффициент детерминации R2 по формуле (16)
R2= 1 – (18,5184 / 41,0871)=0,5493
Этот результат означает, что полученное уравнение регрессии на 54,93% объясняет общий разброс результатов наблюдений относительно горизонтальной прямой y=17,9212. Выборочный коэффициент корреляции
rxy= + (0,5493)1/2=0,7414
3)Однофакторный дисперсионный анализ
Задача заключается в проверке гипотезы H0 : m1=m2 где mk– математическое ожидание чисел k-й группы.В нашем случае l=2,n=100,
Вычисления удобно проводить в такой последовательности
x . .= xik=287,21+896,06=1183,27
x2ik=1778,5947 + 16099,5576 =17878,1523
Далее из (17) и (18) получаем
Q=17878,1523 – (1183,27)2 /100= 3876,8733
Q1=[(287,212+896,062)/50 ] - (1183,27)2 /100 =3706,9832
Q2 = Q - Q1=169,88
Найдем статистики S21 и S22
S21= Q1(l-1)= 3706,9832
S21= Q2/(n-1)= 169,88 / 98=1,7335
Найдем выборочное значение статистики H0
Fв= ( n-2 ) Q1 / [Q2 (l-1)]= S21 / S22 = 2138,4385
Так как квантиль распределения Фишера F1-(1,n-2)= F0,95(1,48)=251,1 ,что меньше выборочного значения статистики Fв, то гипотеза H0 отклоняется на уровне значимости = 0,05. Таким образом , линейная регрессия Y на x статистически значима.
Значения полученные на Statgrafics
Regression Analysis - Linear model: Y = a+bX
--------------------------------------------------------------------------------
Dependent variable: Y.Y Independent variable: X.X
--------------------------------------------------------------------------------
Standard T Prob.
Parameter Estimate Error Value Level
--------------------------------------------------------------------------------
Intercept 15.5167 0.326416 47.5366 .00000
Slope 0.418591 0.0547291 7.64843 .00000
--------------------------------------------------------------------------------
Analysis of Variance
--------------------------------------------------------------------------------
Source Sum of Squares Df Mean Square F-Ratio Prob. Level
Model 22.568715 1 22.568715 58.49845 .00000
Error 18.518413 48 .385800
--------------------------------------------------------------------------------
Total (Corr.) 41.087128 49
Correlation Coefficient = 0.74114 R-squared = 54.93 percent
Stnd. Error of Est. = 0.621128
