
- •Подбор стационарной arma-модели.
- •Процедуры идентификации и диагностики:
- •Автокорреляционная и частная автокорреляционная функции
- •- Статистика
- •Информационные критерии
- •Нелинейный мнк
- •(Лежат вне единичного круга).
- •Какой смысл имеет константа в этой модели???
- •Значения критерия Акаике
- •Значения критерия Шварца-Байеса
Подбор стационарной arma-модели.
Очень часто при анализе данных типа временной ряд мы сталкиваемся с наличием автокорреляции и нестационарности. Визуальный анализ графика наблюдений может выявить очевидный на глаз тренд или сезонную (периодичную) компоненту или изменение разброса наблюдений с течением времени – гетероскедастичность. Все это может служить указанием на непостоянство среднего или дисперсии ряда (их зависимость от времени), то есть нестационарность изучаемого ряда. Анализ автокорреляционной функции и статистик, основанных на значениях корреляционных коэффициентов, позволяет выявить зависимость текущих значений изучаемых показателей от их предыдущих значений, то есть наличие авторкорреляции.
Замечание:
Более формальные процедуры проверки
на нестационарность (тесты Дики –
Фуллера и Перрона, интегральная статистика
)
будут рассматриваться на последующих
занятиях.
Процедуры идентификации и диагностики:
Процедура подбора конкретной модели состоит из трех этапов:
Идентификация модели;
Оценивание модели;
Диагностика модели.
На этапе идентификации проводится предварительный анализ данных с целью выяснения возможных порядков p и q для ARMA - модели. Используемые при этом процедуры являются не вполне точными, что, впоследствии, может привести к выводу о непригодности идентифицированной модели и необходимости замены ее на альтернативную. На этом этапе можно провести пердварительную грубую оценку параметров модели.
На втором этапе проводится оценка модели с использованием эффективных статистических методов и уточнение полученных оценок.
На третьем этапе оцененная модель проверяется на адекватность имеющимся данным. Если выбранная модель не удовлетворяет критериям адекватности, запускается новый цикл подбора и т.д. до тех пор, пока не будет получена удовлетворительная модель.
Пусть предполагается, что анализируемые данные описываются ARMA(p,q) - моделью:
где
-
белый шум.
Автокорреляционная и частная автокорреляционная функции
Наиболее известный способ идентификации ARMA моделей основан на анализе автокорреляционной – ACF (autocorrelation function) и частной автокорреляционной – PACF(partial autocorrelation function).
Aвтокорреляционная функция (ACF) вычисляется по формуле:
(1)
где
В Eviews применяется несколько другая формула для расчета коэффициента автокорреляции
(1’)
Частная
автокорреляционная функция – PACF
описывает
«чистую корреляцию» между
и
,
когда устранено влияние всех промежуточных
членов ряда
.
Теоретически значение PACF определяются по формуле:
(2)
функций изучаемого временного ряда.
Напомним,
что частный
коэффициент корреляции
измеряет «чистую» корреляцию
между случайными величинами
и
при исключении влияния всех промежуточных
случайных величин
.
Значение
находится из системы уравнений
Юла-Уолкера
для
решения которой используется правило
Крамера.
В Eviews используется итеративная процедура вычисления значений PACF, поэтому значения
коэффициентов могут различаться.
На лекции будет показано, что
процесс можно идентифицировать по поведению ACF, поскольку,
,
процесс – по поведению PACF, для которой .
Идентификация
модели на основе ACF
и PACF
является более трудной задачей поскольку
при
на
поведение ACF
влияют как
,
так и
компоненты, но
начиная с
, поведение ACF аналогично поведению ACF для процесса.
PACF для модели убывает подобно PACF для процесса.
При
работе с реальными данными неизвестные
истинные
значения
и
заменяются их оценками
и
– выборочные
коэффициенты корреляции,
которые
являются состоятельными в случае
стационарной модели.
В
силу того, что
и
это
всего
лишь оценки
для
и
характер
изменения реальных ACF
и PACF
может не воспроизводиться в их выборочных
аналогах. Тем не менее в большинстве
случаев поведение истинных ACF
и PACF
в той или иной мере отражается на
поведении выборочных аналогов, что
позволяет их использовать для идентификации
моделей из класса ARMA.
МОДЕЛЬ |
ACF |
PACF |
(Белый шум) |
|
|
|
Монотонное убывание Осциллирующее убывание |
|
|
Убывание к нулю монотонное или осциллирующее |
Зануление
при
|
|
Положительный
пик при
Отрицательный пик при , зануление при . |
Осциллирующее
убывание
Убывание
по абсолютной величине
|
|
Зануление при |
|
|
Экспоненциальное
убывание с лага 1, знак
Осциллирующее убывание с лага 1, знак совпадает со знаком |
Осциллирующее
убывание с лага 1,
Экспоненциальное
убывание с лага 1,
|
|
Осциллирующее или монотонное убывание |
Осциллирующее или монотонное убывание |
Для обоснованного выбора структуры модели хотелось бы иметь какие-нибудь статистические критерии для проверки гипотез о равенстве нулю тех или иных значений и на основании наблюдаемых значений и . Вообще говоря, это довольно нетривиальный вопрос.
Однако заметим, что в модели с константой среднее остатков равно 0, поэтому выборочная автокорреляционная функция остатков
.
(3)
Если модель
адекватна данным и ошибки
являются белым шумом,
то при больших значениях
и
(асимптотически) случайная величина
имеет распределение близкое к нормальному
.
Хорошая аппроксимация достигается
начиная с
.
Таким образом, значение
вне интервала
позволяет на 5% уровне значимости
отвергнуть гипотезу о равенстве нулю
коэффициента
.
Аналогичным
образом, если рассматриваемый
процесс
описывается моделью
моделью, то при больших
и
распределение случайной величины
близко к нормальному
.
И опять же значение
вне интервала
позволяет на 5% уровне значимости
отвергнуть гипотезу о равенстве нулю
коэффициента
(гипотезы
проверяются при каждом отдельном
!!!)
Можно использовать стандартные методы проверки коэффициентов и
на значимость.
Для
тестирования гипотезы
используется
- статистика:
,
(4)
которая
при верной гипотезе
имеет распределение
Стьюдента
с
степенями свободы.
Гипотеза
также проверяется с помощью
- критерия Стьюдента:
,
(5)
где
– это число устраненных переменных
Замечание: К интерпретации графиков ACF и PACF следует подходить с осторожностью.
Пусть
есть процесс белого шума,
.
Согласно рассмотренному выше критерию,
.
Оценим вероятность того, что за пределы
полосы
выйдут
значений
(биномиальная модель – выход за пределы
полосы=успех), где
- рассматриваемое количество значений
ACF:
.
Возьмем для примера
.
Т.е. вероятность выхода PACF
за пределы критической полосы вовсе
не мала, даже
в ситуации, когда процесс моделируется
как белый шум (DGP=data
generating
process)
можно
ошибочно интерпретировать модель как
процесс
(SM=statistical
model).
Сюда же можно
отнести и то обстоятельство, что в
некоторых статистических пакетах, в
том числе и в Eviews
при расчете выборочная ковариационная
функция делится не на
,
а на
.
Этот приводит к смещению оценки
в сторону нуля.