
- •Компьютерный практикум Задание 1
- •Условия задачи (Вариант 1)
- •Построить матрицу парных коэффициентов корреляции. Выполнить тест на мультиколлинеарность Фаррара – Глоубера. Обосновать отбор факторов для регрессионного анализа.
- •Построить уравнение регрессии. Дать экономическую интерпретацию коэффициентов регрессии.
- •Привести график остатков. Проверить условие гомоскедастичности остатков.
- •Рассчитать прогнозное значение результата, если прогнозные значения факторов составляют 80% от их максимальных значений.
Построить уравнение регрессии. Дать экономическую интерпретацию коэффициентов регрессии.
В соответствии с общим подходом, пошаговый отбор следует начинать с включения в модель всех имеющихся факторов, то есть с четырехфакторной регрессии. Однако не будем включать в модель факторы из заранее известных коллинеарных пар – фактор Х2. Пошаговый отбор начнем с трехфакторного уравнения. Фрагмент трехфакторного регрессионного анализа представлен на рисунке 1.
|
tтабл(0,05;25-3-1=21) |
2,08 |
|
|
|
|
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Y-пересечение |
-8809,51 |
5238,136 |
-1,6818 |
0,10742 |
-19702,8 |
2083,793 |
X1 |
19,82353 |
2,288244 |
8,663207 |
2,24E-08 |
15,06487 |
24,58219 |
X3 |
446,1969 |
178,3564 |
2,501714 |
0,020701 |
75,28434 |
817,1094 |
X4 |
0,715267 |
0,445788 |
1,604501 |
0,123538 |
-0,2118 |
1,642334 |
Рисунок 1. Фрагмент регрессионного анализа для трехфакторной модели
Коэффициент уравнения регрессии признается значимым в том случае, если
наблюдаемое значение t-статистики Стьюдента для этого коэффициента больше, чем критическое (табличное) значение статистики Стьюдента; Фактические значения t-критериев сравниваются с табличным значением при степенях свободы n-k-1 = 25-3-1=21 и уровне значимости α=0,05.
Р-значение t-статистики Стьюдента для этого коэффициента меньше, чем уровень значимости (α=0,05);
доверительный интервал для этого коэффициента (вычисленный с некоторой доверительной вероятностью, например 95%) не содержит ноль внутри себя, т.е. если нижняя и верхняя границы 95%-го доверительного интервала имеют одинаковые знаки.
Статистически незначимым (tтабл>t) оказался один фактор, для которого также не соблюдаются остальные условия. На следующем этапе пошагового отбора удаляем статистически незначимый фактор с наименьшим значением t-критерия, то есть фактор Х4.
Фрагмент двухфакторного регрессионного анализа представлен на рисунке 2.
|
tтабл(0,05;25-2-1=22) |
2,0739 |
|
|
|
|
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Y-пересечение |
-9495,79 |
5404,223 |
-1,75711 |
0,09281 |
-20703,5 |
1711,88 |
X1 |
21,39038 |
2,142176 |
9,985351 |
1,24E-09 |
16,94778 |
25,83298 |
X3 |
540,2393 |
174,3743 |
3,098159 |
0,005248 |
178,6091 |
901,8694 |
Рисунок 2. Фрагмент регрессионного анализа для двухфакторной модели
Из рисунка 2 видно, что уравнение с двумя факторами Х1 и Х3 обладает статистически значимыми коэффициентами перед факторами (в нем незначим только свободный член), а, значит, и сами эти факторы статистически значимы.
Таким образом, в результате пошагового отбора получено двухфакторное уравнение регрессии, все коэффициенты которого (кроме свободного члена) значимы при 5%-ном уровне значимости.
Уравнение регрессии: У = -9495,79+21,39 Х1+540,2393Х3
Экономический смысл коэффициентов уравнения:
при увеличении X1 (численность промышленно-производственного персонала, чел.) на 1 чел. объем выпуска продукции Y (млн. руб.) увеличится на 21,39 млн. руб.,
при увеличении X3 (электровооруженность 1 чел.-ч., кВтч.) на 1 кВтч. объем выпуска продукции Y (млн. руб.) увеличится на 540,24 млн. руб.