- •Тема 4 Линейная модель множественной регрессии
- •1. Гетероскедастичность. Тесты на гетероскедастичность
- •Обнаружение гетероскедастичности
- •Графический анализ остатков
- •Тест ранговой корреляции Спирмена
- •Тест Голдфелда-Квандта
- •2. Автокорреляция регрессионных остатков. Методы выявления
- •Методы обнаружения автокорреляции
- •Метод рядов.
- •Ограничения на применение теста Дарбина—Уотсона
- •3. Обобщенный метод наименьших квадратов для смягчения гетероскедастичности и устранения автокорреляции
Тест ранговой корреляции Спирмена
При использовании данного теста предполагается, что дисперсия отклонения будет либо увеличиваться, либо уменьшаться с увеличением значений X. Поэтому для регрессии, построенной по МНК, абсолютные величины отклонений εi и значения хi будут коррелированны.
Значения хi и εi ранжируются (упорядочиваются по величинам). Затем определяется коэффициент ранговой корреляции:
![]()
где di — разность между рангами хi и εi, i = 1, 2, ..., п;
п — число наблюдений.
Например, если х20 является 15 по величине среди всех наблюдений, а ε20 – 21, то d20 = 15-21= - 6.
Если
коэффициент корреляции
для генеральной совокупности равен
нулю, то статистика

имеет
распределение Стьюдента с числом
степеней свободы
v=n-2.
Следовательно, если наблюдаемое значение
t-статистики
превышает табличное, то необходимо
отклонить гипотезу о равенстве нулю
коэффициента корреляции
,а,
следовательно, и об отсутствии
гетероскедастичности.
Если в модели регрессии больше чем одна объясняющая переменная, то проверка гипотезы может осуществляться с помощью t-статистики для каждой из них отдельно.
Тест Голдфелда-Квандта
Самым популярным тестом обнаружения гетероскедастичности является тест, предложенный С. Голдфелдом и Р. Квандтом.
В
данном случае также предполагается,
что стандартное отклонение
пропорционально
значениюxi
переменной
X
в этом наблюдении, т, е.
![]()
Предполагается,
что
имеет нормальное распределениеи
отсутствует автокорреляция остатков.
Тест Голдфелда-Квандта состоит в следующем:
1. Все п наблюдений упорядочиваются по величине X.
2. Вся упорядоченная выборка после этого разбивается на три подвыборки размерностей k, (п-2k), k соответственно.
3.
Оцениваются отдельные регрессии для
первой подвыборки
(k
первых наблюдений) и для третьей
подвыборки
(k
последних наблюдений). Если предположение
о пропорциональности дисперсий отклонений
значениям X
верно, то дисперсия регрессии
по первой подвыборке (сумма квадратов
отклонений
)
будет существенно меньше дисперсии
регрессии по третьей подвыборке(суммы
квадратов отклонений
).
4 Для сравнения соответствующих дисперсий строится следующая F-статистика:
![]()
При сделанных предположениях относительно случайных отклонений, построенная F-статистика имеет распределение Фишера с числами степеней свободы v1=v2=k-m-l.
Если
![]()
![]()
то
гипотеза об отсутствии гетероскедастичности
отклоняется
(
- выбранный уровень значимости).
Тест Уайта (White test, 1980).
Если в модели присутствует гетероскедастичность, то очень часто это связано с тем, что дисперсии ошибок некоторым образом зависят от регрессоров, а гетероскедастичность отражается в остатках обычной регрессии исходной модели.
Проводится этот тест следующим образом:
1) допустим, исходная модель имеет вид:
![]()
МНК оцениваются
ее параметры и получают
регрессионные остатки
;
2) оценивается вспомогательная регрессия квадратов остатков на все регрессоры, их квадраты, попарные произведения и константу:
![]()
где
- нормально распределенная ошибка,
независимая отεi.
Напомним,
что
.
Однако
поскольку предполагается,
что M(ε)
=
0, то D(εi)
= M(
).Так
как нам неизвестна
истинная величина квадратов остатков
,
то
вопрос о
наличии гетероскедастичности решается
на основе их выборочных
аналогов,
.
Вспомогательная
регрессия имеет именно такую форму,
потому
что необходимо исследовать, существует
ли систематическая
зависимость между изменениями
и какой-либо релевантной
переменной модели (чтобы увидеть, что
релевантными
являются именно переменные, включенные
во вспомогательную
регрессию, следует представить ошибку
в виде
и
возвести данное выражение в квадрат).
3) Проверяется нулевая гипотеза:
Н0:
и
и
и
и
.
с помощью F – критерия Фишера.
Если фактические значения статистики превышают критические величины распределения Fрасч > Fкр (α, v1=p, v2=n-p-1) то нулевая гипотеза о гомоскедастичности остатков отвергается, то есть делается вывод о присутствии гетероскедастичности.
