
2. Многофакторный корреляционно-регрессионный анализ
Включим в модель
переменные Х5 Х6 Х7 Х9
Х17. Построим многофакторную
линейную регрессионную модель для
анализа влияния вариации факторных
признаков Х5 Х6 Х7 Х9
Х17 на результативный признак
.
Выявление и удаление выбросов проводятся аналогично описанному процессу для случая однофакторной регрессии.
Рис. «Поле корреляции и гистограммы переменных , Х5 Х6 Х7 Х9 Х17»
Корреляционная матрица содержит коэффициенты корреляции как между факторными и результирующей переменной, так и между самими факторными переменными.
Рис. «Корреляционная матрица»
Корреляционная
матрица показывает, что значение
коэффициента парной корреляции между
переменными
и
равно -0,419, т.е. направление связи –
обратное, связь слабая.
Х5 и =-0,434259, направление связи – обратное, связь слабая.
Х6и =-0,042073, направление связи – обратное, связь слабая.
Х7и =-0,132478, направление связи – обратное, связь слабая.
Х9и =0,164505, направление связи – обратное, связь слабая.
В случае построения многофакторной модели требуется проверить факторы на мультиколлинеарность. В нашем примере коэффициент корреляции между факторами (равный -0,434259) меньше коэффициентов корреляции факторов с результирующей переменной (соответственно -0,042073 и 0,031845), т.е. мультиколлинеарность отсутствует.
Определим значения параметров b0, b1 ,b2, b3, b4 ,b5, уравнения многофакторной линейной корреляционной связи вида ŷ=b0+b1x+ b2x+ b3x+ b4x+ b5x.
Рис. «Окно Regression Summary for dependent variable – Итоговая таблица регрессии зависимой переменной»
В нашем примере b0= -47,8959 b1= 0,0337, b2= 1,0036,
b3= 0,0420, b4= -0,1378, b5= 7,0899, уравнение регрессии имеет вид:
=-47,8959 +0,0337 Х5+1,0036 Х6+0,0420 Х7-0,1378 Х9+7,0899 Х17
Совокупный коэффициент множественной детерминации, равный 0,99920129, показывает, что 99,9% вариации показателя объясняется влиянием факторов, включенных в уравнение множественной регрессии (Х5 Х6 Х7 Х9 Х17).
Проверка адекватности уравнения, значимости найденных коэффициентов регрессии, построение прогноза осуществляются так же, как при проведении однофакторного корреляционно-регрессионного анализа.
Рис. «Окно результатов корреляционно-регрессионного анализа»
Значимость множественного коэффициента корреляции проверяется по таблице F-критерия Фишера. В нашем случае табличное значение F-критерия Фишера для степеней свободы ν1=1, ν2=18 (20 наблюдений минус 2 равно 18) при уровне значимости α=0,05 равно 4,41, а рассчитанное значение равно 4754,852. Расчетное значение больше табличного, поэтому найденный коэффициент парной корреляции имеет высокую значимость между переменными , Х5 Х6 Х7 Х9 Х17. Как правило Fрасч > Fтабл минимум в 4 раза.
Нажатие по кнопке Graph – График в диалоговом окне Review Descriptive statistics – Просмотр описательных статистических характеристик откроет график «поле корреляции» исследуемых переменных, а также соответствующие гистограммы.
Рис. «График распределения остатков»