
- •Задание
- •Исходные данные
- •Составить корреляционную матрицу. Исследовать интеркорреляцию переменных. Проверить мультиколлинеарность переменных. Сделать вывод. Удалить из модели одну независимую переменную.
- •Построить уравнение множественной линейной регрессии по двум независимым переменным.
- •Найти коэффициент множественной детерминации, скорректированный коэффициент множественной детерминации, множественный коэффициент корреляции. Сделать вывод.
- •4. Оценить качество уравнения множественной регрессии:
- •4.1. Найти среднюю относительную ошибку аппроксимации.
- •4.2. Проверить статистическую значимость уравнения множественной регрессии в целом.
- •4.3. Проверить статистическую значимость параметров уравнения множественной регрессии. Построить интервальные оценки параметров.
- •6. Оценить силу влияния независимых переменных на y:
- •6.2. Найти средние по совокупности и частные коэффициенты эластичности.
4. Оценить качество уравнения множественной регрессии:
4.1. Найти среднюю относительную ошибку аппроксимации.
Средняя относительная ошибка аппроксимации оценивает математическую точность уравнения регрессии и находится по формуле:
Средняя относительная ошибка аппроксимации немногим больше 20%, точность уравнения можно считать близкой к удовлетворительной.
4.2. Проверить статистическую значимость уравнения множественной регрессии в целом.
Статистическая значимость уравнения множественной линейной регрессии в целом оценивается с помощью критерия Фишера.
Находится расчетное значение критерия:
где yi – фактические значения переменной y,
– теоретические значения переменной
y, найденные по уравнению
регрессии,
n = 18 – объем выборки (число наблюдений),
m = 2 – число параметров уравнения при независимых переменных.
Данное значение сходится со значением Fрасч в таблице 3. Значит расчет верен.
k1= m = 2;
k2 = n – m - 1 = 15;
Fтабл (0,05; 2; 15) = 3,68
Fрасч > Fтабл (0,05; 2; 15), что говорит о статистической значимости уравнения в целом.
4.3. Проверить статистическую значимость параметров уравнения множественной регрессии. Построить интервальные оценки параметров.
ma = 163,23 ta расч = |-1,16|;
mb2 = 15,68 tb2 расч = |-0,11|;
mb3 = 1,93 tb3 расч = 2,99;
tтабл (α=0,05; k=15) = 2,13.
Если tрасч. > tтабл. , то данный параметр статистически значим, а если tрасч. < tтабл. , то данный параметр статистически незначим.
tрасч.а < tтабл , следовательно параметр а статистически незначим.
tрасч.b2 < tтабл , следовательно параметр b2 статистически незначим.
tрасч.b3 > tтабл , следовательно параметр b3 статистически значим.
Построение доверительного интервала для параметров а и b. Предельные отклонения параметров находятся по формулам:
∆a = 163,23*2,13 = 347,68.
∆b2 = 15,68*2,13 = 33,40.
∆b3 = 1,93*2,13 = 4,11.
Доверительные интервалы имеют вид:
(a - ∆a; a + ∆a);
(b2 - ∆b2; b2 + ∆b2);
(b3 - ∆b3; b3 + ∆b3).
Следовательно, с вероятностью γ = 1 - 0,05 = 0,95 истинное значение параметра a находится в интервале (a – 347,68; a + 347,68), т. е. (-536,39;158,97). Доверительный интервал параметра а имеет разные знаки на концах, что подтверждает статистическую незначимость параметра а. А истинное значение параметра b2 лежит в интервале (b2 – 33,40; b2 + 33,40), т. е. (-35,12; 31,68). Доверительный интервал параметра b2 имеет разные знаки на концах, что подтверждает статистическую незначимость параметра b2.
А истинное значение параметра b3 лежит в интервале (b3 – 4,11; b3 + 4,11), т. е. (1,66; 9,77). Доверительный интервал параметра b3 имеет одинаковые знаки на концах, что подтверждает статистическую значимость параметра b3.
5. Провести анализ остатков регрессионной модели:
Поскольку модель линейной регрессии
имеет вид
,
необходимо проверить, удовлетворяют
ли остатки εi
следующим требованиям:
Остатки должны носить случайный характер;
Среднее значение остатков не зависит от хi;
Остатки должны обладать гомоскедастичностью – дисперсия остатков постоянна и не зависит от хi;
Остатки подчиняются нормальному закону;
Значения остатков распределены независимо друг от друга.
Проверка этих пяти требований заменяется проверкой критерия Дарбина-Уотсона.
Считаются расчетные значения критерия по формуле:
Находятся 2 критических значения dl , du при заданном значении уровня значимости α=0,05 и числе степеней свободы k=m=2 и объему выборки n=18 по таблице критических точек распределения Дарбина-Уотсона.
Есть положительная автокорреляция остатков |
Зона неопределен-ности |
Отсутствует автокорреляция остатков |
Зона неопределенности |
Есть отрицательная автокорреляция остатков |
0 dl =1,05 du =1,53 2 4 - du = 2,95 4*dl = 6,12 4
dрасч = 90067,26/39348,17 = 2,29.
dрасч = 2,29 попадает в зону отсутствия автокорреляции остатков.