
Глава II модель множественной регрессии
2.1. Методические указания
На любой экономический показатель чаще всего оказывает влияние не один, а несколько факторов. В этом случае вместо парной регрессии рассматривается множественная регрессия.
Множественная регрессия– уравнение связи с несколькими объясняющими (независимыми) переменными:
Y=f(х1,х2, …,хm), (2.1)
т.е. условное математическое ожидание имеет вид (2.1):
М(Y/х1,х2, …,хm) =f (х1,х2, …,хm). (2.2)
Теоретическое линейное уравнение регрессииимеет вид:
Y
= 0
+
1
Х1
+
2
Х2
+ …+
m
Хm
+
,
(2.3)
или для индивидуальных наблюдений i, i = 1,2,…,n:
yi
= 0
+
1
xi1
+
2
xi2
+ …+
m
xim
+
i
.
(2.4)
Как и в случае парной регрессии по выборочным данным мы можем получить только эмпирическое уравнение регрессии:
Y = b0 + b1 Х1 + b2 Х2 + …+ bm Хm + e . (2.5)
Или для индивидуальных наблюдений:
уi = b0 + b1 xi1 + b2 xi2 + …+ bm xim + ei . (2.5)
Для определения оценок b0,b1,b2, …,bmвоспользуемся матричным МНК. Представим данные наблюдений и коэффициенты в матричном виде:
,
,
,
.
Результатом МНК будет формула вычисления коэффициентов регрессии:
B= (XT X)-1XT Y. (2.6)
Вычислим дисперсии
коэффициентов регрессии b0,b1,b2, …,bm,
которые используются для оценки их
точности, определения доверительных
интервалов для теоретических коэффициентов0,
1,
2, …,
mи проверки соответствующих гипотез.
Дисперсии коэффициентов вычисляются по формулам:
,
(2.7)
В (2.7) S2– дисперсия регрессии, вычисляется по формуле:
S2= ((еi2))/(n–m– 1) , (2.8)
- j-й
(j = 0, 1,…,m)
диагональный элемент матрицы
Z-1= (XT X)-1. (2.9)
Проверка качества уравнения регрессии так же, как и в парной регрессии осуществляется по ряду позиций.
Проверка статистической значимости коэффициентов регрессии.
Используется критерий Стьюдента. Вычисляются Т bi=bi/Sbi,i= 0, 1, 2, …,mи сравниваются сtкрит. Результатом сравнения является вывод о значимости коэффициентов b0,b1,b2, …,bm.
Интервальные оценки коэффициентов уравнения регрессии.
Так как объем
выборки ограничен, то
b0
, b1
, b2
, …, bm
– случайные величины, поэтому желательно
найти доверительные интервалы для
истинных значений 0
,
1
,
2
, …,
m.
Для этого также используется t
– критерий Стьюдента.
Проверка общего качества уравнения регрессии.
Для этой цели, как и в случае парной регрессии, используется коэффициент детерминации R2:
R2= 1 -еi2/
(yi-
)2. (2.10)
В множественной регрессии каждая новая переменная хiприводит к увеличениюR2, хотя это еще не означает, что уравнение регрессии становится более значимым. Чтобы исключить эту зависимость от числа переменных, иногда используют так называемыйскорректированный коэффициент детерминации:
.
(2.11)
Или эту формулу можно преобразовать к виду:
.
(2.12)
Анализ статистической значимости коэффициента детерминации.
По величине R2можно только предполагать насколько значимо или не значимо уравнение регрессии. Даже при небольшой величинеR2(< 0,5) не всегда следует отказываться от уравнения регрессии. Для этого необходимо проверить статистическую значимость самого коэффициента детерминации. Для чего проверяются гипотезы
Н0:R2= 0,
Н1:R2> 0.
Для проверки используется распределение Фишера. Вычисляется F– статистика:
.
(2.13)
При заданном уровне
значимости
по таблице критических точек Фишера
находитсяfкр,
и еслиF> fкр, тоR2статистически
значим.
Проверка выполнимости предпосылок МНК с помощью статистики Дарбина-Уотсона.
Статистическая
значимость коэффициентов регрессии и
близкое к единице значение коэффициента
детерминации R2еще не гарантируют высокое качество
уравнения регрессии. Если не выполняются
необходимые предпосылки МНК об отклонениях,
то коэффициенты регрессии и само
уравнение являются не вполне состоятельными,
а это значит что внешние признаки
«хорошего» уравнения не отвечают
действительности. Поэтому следующим
этапом проверки качества уравнения
регрессии является проверка соответствия
выборочных данных предпосылкам МНК.
Для этого воспользуемся статистикой
Дарбина – Уотсона, которая устанавливает,
в частности, наличие или отсутствие
статистической зависимости между
ошибками
.
Так как истинные значения
неизвестны,
то проверка осуществляется в отношении
оценок ошибокеi. При этом проверяется некоррелированность
соседних значенийеi.
Статистика Дарбина – Уотсона DWрассчитывается по формуле:
.
(2.14)
По таблицам
критических точек Дарбина – Уотсона,
входными параметрами которых являются:
n– число наблюдений;m– количество
объясняющих переменных;-
уровень значимости, определяются два
числа:d1– нижняя
граница;du– верхняя граница.
Выводы осуществляются по следующей схеме.
Если DW<d1, то это свидетельствует о положительной автокорреляции остатков.
Если DW> 4 -d1, то это свидетельствует об отрицательной автокорреляции остатков.
При du<DW< 4 –duпринимается гипотеза об отсутствии автокорреляции остатков.
Если d1<DW<duили 4 –du<DW< 4 –d1, то остается неопределенность по вопросу наличия или отсутствия автокорреляции остатков.
В случае обнаружения признака автокорреляциинеобходимо скорректировать уравнение регрессии в соответствии с рекомендациямиГлавы IV
Прогноз значений зависимой переменной.
По аналогии с парной регрессией может быть построена интервальная оценка для среднего значения прогноза. Здесь речь идет о возможных значениях Yрпри определенных значенияхвектораобъясняющей переменнойХр.
Интервальный прогноз для среднего значениявычисляется следующим образом:
р
tкрS
, (2.15)
где
р =b0+b1x1р+b2x2р+ …+bmxmр;tкр– критическое
значение, полученное по распределению
Стьюдента при количестве степеней
свободы
=n-m-1
и заданной вероятности
/2.