- •О выполнении практического задания
- •Описание исходных данных.
- •Предварительный анализ данных.
- •Построение моделей регрессии на всей выборке
- •Регрессионная модель
- •Тесты на гетероскедастичность
- •Тесты на автокорреляцию остатков
- •Тест на нормальность остатков
- •Тест Рамсея
- •Регрессионная модель
- •Тесты на гетероскедастичность
- •Тесты на автокорреляцию остатков
- •Тест на нормальность остатков
- •Тест Рамсея
- •Регрессионная модель
- •Тесты на гетероскедастичность
- •Тесты на автокорреляцию остатков
- •.Тест на нормальность остатков
- •Тест Рамсея
- •Регрессионная модель
- •Тесты на гетероскедастичность
- •Тесты на автокорреляцию остатков
- •Тест на нормальность остатков
- •Тест Рамсея
- •Построение моделей регрессии на выборке без аномальных
Тесты на гетероскедастичность
Рис.9. Остатки модели
Судя по графику
можно предположить, что в остатках
просматривается гетероскедастичность,
поскольку с ростом
растет и разброс остатков относительно
среднего.
Воспользуемся тестом Вайта, чтобы точно определить наличие/отсутствие гетероскедастичности.
Рис.10. Тест Вайта на гетероскедастичность, Y от X2.
Итак, нулевая гипотеза: гетероскедастичность в остатках отсутствует.
P
– значение =
.
Следовательно, нулевую гипотезу отклоняем
в пользу альтернативной: с вероятностью
95% гетероскедастичность в остатках
есть.
Рис.11. Тест Бриша – Пэгана на гетероскедастичность, Y от X2.
Итак, в нашем случае тесты говорят о наличии гетероскедастичности на уровне доверия 99%.
Тесты на автокорреляцию остатков
Посчитаем коэффициент корреляции.
Рис.12. Коэффициент автокорреляции первого порядка остатков
Нужное нам значение:
.
Проверим коэффициент на значимость.
Поскольку P
– значение = 0.0977 > 0,05, коэффициент
незначим, и автокорреляции в остатках
нет.
Тест на нормальность остатков
Рис.13. Тест на нормальность распределения остатков модели
Рис.14. Тест на нормальность распределения остатков
P – значение < 0,05. Нулевая гипотеза отвергается с вероятностью 95%, остатки модели не распределены нормально.
Тест Рамсея
Рис.15. Тест Рамсея
P – значение < 0,05. Нулевая гипотеза отвергается, и с вероятностью 95% в модели не хватает важного объясняющего фактора.
Исправление ошибок спецификации
Так как тест Вайта показал наличие гетероскедастичности, то остатки модели зависят от квадратов факторов модели. В таком случае воспользуемся встроенной процедурой коррекции гетероскедастичности, которая представляет собой взвешенный метод наименьших квадратов, где веса пропорциональны квадратам значений факторов.
Рис.16. Модель
с
коррекцией гетероскедастичности
остатков
Рис.17. Регрессия Y от X2 c коррекцией гетероскедастичности и график остатков
Регрессионная модель
Рис.18. Результаты оценки регрессии
Модель имеет вид:
Проверим гипотезы о незначимости параметров модели:
Константа (
Нулевая гипотеза ( ): в генеральной совокупности константа незначима.
Альтернативная гипотеза ( ): , в генеральной совокупности константа значима.
P – значение = 0,6928 >0,05. Следовательно, нулевая гипотеза не отклоняется с вероятностью (1-0,05) = 0,95, или 95%, то есть константа модели незначима.
Коэффициент перед X1 (
, в генеральной совокупности коэффициент перед X1 незначим.
, в генеральной совокупности коэффициент перед X1 значим.
P
– значение =
.
Следовательно,
нулевая гипотеза отклоняется в пользу
альтернативной с вероятностью (1-0,05) =
0,95, или 95%, то есть коэффициент модели
при X1 значим.
В данном случае незначима константа, из модели ее исключать не будем.
Проверим гипотезу о незначимости модели в целом.
: все параметры модели (кроме константы) равны друг другу и равны нулю, т.е. модель в целом незначима.
: все параметры модели (кроме константы) не равны друг другу и не равны нулю, т.е. модель в целом значима.
P-значение (F) = . Следовательно, нулевая гипотеза отклоняется в пользу альтернативной с вероятностью 95%, то есть модель в целом значима.
Оценка качества модели по графикам
Рис.19. График «прогноз-реализация» для модели
Рис.20. Линия регрессии
На рис.20. видно, что присутствуют аномальные значения: IOC.BO, ORG.AX, LIN.DE. С целью точностью их определения, посмотрим на отчет по остаткам.
Рис.21. Выдержка из отчета по предсказанным значениям
Итак, выявлено одно аномальное наблюдение: IOC.BO.
С помощью отчета по значимым наблюдениям определим значимые наблюдения.
Рис.22. Выдержка из отчета по значимым наблюдениям
Итак, выявлено одно значимое наблюдение: 0857.HK
Исходя из проделанного анализа, можно сделать вывод, что модель неплохая.
Проверка наличия ошибок спецификации модели
