- •О выполнении практического задания
- •Описание исходных данных.
- •Предварительный анализ данных.
- •Построение моделей регрессии на всей выборке
- •Регрессионная модель
- •Тесты на гетероскедастичность
- •Тесты на автокорреляцию остатков
- •Тест на нормальность остатков
- •Тест Рамсея
- •Регрессионная модель
- •Тесты на гетероскедастичность
- •Тесты на автокорреляцию остатков
- •Тест на нормальность остатков
- •Тест Рамсея
- •Регрессионная модель
- •Тесты на гетероскедастичность
- •Тесты на автокорреляцию остатков
- •.Тест на нормальность остатков
- •Тест Рамсея
- •Регрессионная модель
- •Тесты на гетероскедастичность
- •Тесты на автокорреляцию остатков
- •Тест на нормальность остатков
- •Тест Рамсея
- •Построение моделей регрессии на выборке без аномальных
Тесты на гетероскедастичность
Рис.36. Остатки модели
Воспользуемся тестом Вайта, чтобы определить наличие/отсутствие гетероскедастичности.
Рис.37.
Тест Вайта на гетероскедастичность, Y
от X4.
Так как P – значение > 0,05, то принимается нулевая гипотеза. Следовательно, гетероскедастичность в остатках отсутствует.
Рис.38. Тест Бриша – Пэгана на гетероскедастичность, Y от X4.
В нашем случае все тесты говорят об отсутствии гетероскедастичности в остатках на уровне доверия 99%.
Тесты на автокорреляцию остатков
Рассчитаем коэффициент корреляции.
Рис.39. Коэффициент автокорреляции первого порядка остатков
Нужное нам значение:
.
Проверим коэффициент на значимость.
Поскольку P
– значение = 0.0871 > 0,05, коэффициент
незначим, и автокорреляции в остатках
нет.
.Тест на нормальность остатков
Рис.40. Тест на нормальность распределения остатков
Рис.41. Тест на нормальность распределения остатков
P – значение < 0,05. Нулевая гипотеза отвергается с вероятностью 95%, остатки модели не распределены нормально.
Тест Рамсея
Рис.42. Тест Рамсея для модели зависимости Y от X4
P – значение < 0,05. Нулевая гипотеза отвергается, и с вероятностью 95% в модели не хватает важного объясняющего фактора.
В данном случае мы не будем пользоваться встроенной процедурой коррекции гетероскедостичности, поскольку гетероскедастичность в остатках отсутствует.
Регрессионная модель
Рис.43. Результаты оценки регрессии
Модель имеет вид:
Проверим гипотезы о незначимости параметров модели:
Константа (
Нулевая гипотеза ( ): в генеральной совокупности константа незначима.
Альтернативная гипотеза ( ): , в генеральной совокупности константа значима.
P – значение = 0,5036 >0,05. Следовательно, нулевая гипотеза не отклоняется с вероятностью (1-0,05) = 0,95, или 95%, то есть константа модели незначима.
Коэффициент перед X1 (
, в генеральной совокупности коэффициент перед X3 незначим.
, в генеральной совокупности коэффициент перед X3 значим.
P
– значение =
.
Следовательно,
нулевая гипотеза отклоняется в пользу
альтернативной с вероятностью (1-0,05) =
0,95, или 95%, то есть коэффициент модели
при X3 значим.
В данном случае незначима константа, из модели ее исключать не будем.
Проверим гипотезу о незначимости модели в целом.
: все параметры модели (кроме константы) равны друг другу и равны нулю, т.е. модель в целом незначима.
: все параметры модели (кроме константы) не равны друг другу и не равны нулю, т.е. модель в целом значима.
P-значение (F) = . Следовательно, нулевая гипотеза отклоняется в пользу альтернативной с вероятностью 95%, то есть модель в целом значима.
Оценка качества модели по графикам
Рис.44. График «прогноз-реализация» для модели
Рис.45. Линия регрессии
На рис.45. видно, что присутствуют аномальные значения. С целью точностью их определения, посмотрим на отчет по остаткам.
Рис.46. Выдержка из отчета по предсказанным значениям
Итак, выявлены следующие аномальные значения: IOC.BO, M6B1.DE, 0135.HK.
С помощью отчета по значимым наблюдениям определим значимые наблюдения.
Рис.47. Выдержка из отчета по значимым наблюдениям
Итак, выявлено одно значимое наблюдение: 0857.HK
Проверка наличия ошибок спецификации модели
