книги / Эконометрика. Начальный курс
.pdf11.4. Модели Бокса-Дженкинса (AR1MA) |
|
|
|
|
303 |
|||
Autocorrelation |
Partial Correlation |
|
АС |
РАС Q-Stat Prob |
||||
1 |
н |
1 |
1 |
1 |
0.887 |
0.887 |
189.53 |
0.000 |
J |
|
2 |
0.336 |
-0.259 |
235.01 |
0.000 |
||
1 ■ |
1 1 |
3 |
0Л77 |
0.129 |
247.59 |
0.000 |
||
1 |
» |
1 |
1 |
4 |
0.071 |
-0.107 |
249.63 |
0.000 |
1 1 |
1 |
1 |
5 |
0.003 |
0.018 |
249.63 |
0.000 |
|
1 1 |
\ |
1 |
в -0.013 |
0.004 |
249.70 |
0.000 |
||
1 J |
1 |
1 |
7 -0.015 |
-0.009 |
249.79 |
0.000 |
||
1 1 |
1 |
» |
8 |
0.016 |
0.067 |
249.90 |
0.000 |
|
> || |
1 |
1 |
9 |
0.051 |
0.009 |
250.97 |
0.000 |
|
J |
1 |
1 |
1 |
10 |
0.066 |
0.023 |
252.76 |
0.000 |
1 |1 |
|| |
\ |
11 |
0.042 |
-0.044 |
253.50 |
0.000 |
|
1 |
1 |
1 || |
12 |
0.039 |
0.057 |
254.13 |
0.000 |
Рис. 11.20. ARMA(1,1). Yt = 0.4У»_1 + et + 0.5et-i- Корни цац = 2ф м а = -2
Autocorrelation |
Partial Correlation |
|
АС |
РАС |
Q-Stat |
Prob |
|
1 |
1 |
1 |
1 -0.662 -0.662 |
175.75 |
0.000 |
||
|
■ 1 |
2 |
0.281 |
-0.279 |
207.58 |
0.000 |
|
1 Г |
1 1 |
3 |
-0.114 |
-0.117 |
212.83 |
0.000 |
|
J |
1 |
1 1 |
4 |
0.082 |
0.021 |
215.55 |
0.000 |
1 1 |
|| 1 |
5 |
-0.095 |
-0.047 |
219.20 |
0.000 |
|
1 1 |
1 1 |
6 |
0.095 |
0.008 |
222.85 |
0.000 |
|
1 1 |
|| 1 |
7 |
-0.095 |
-0.047 |
226.53 |
0.000 |
|
|
» |
1 1 |
8 |
0.082 |
-0.006 |
229.26 |
0.000 |
1 1 |
|| 1 |
9 -0.079 |
-0.046 |
231.83 |
0.000 |
||
1 1 |
1 || |
10 |
0.102 |
0.054 |
236.10 |
0.000 |
|
1 |
|
1 1 |
11 |
-0.091 |
0.029 |
239.50 |
0.000 |
1 |
|
1 1 |
12 |
0.063 |
0.014 |
241.12 |
0.000 |
Рис. 11.21. ARMA(1,1). Yt = -0.4У»_1 + et - 0.5et_i Корни мая = -2, ммA = 2
II. Оценивание модели и проверка адекватности модели
II.1. Для каждой из выбранных на первом этапе моделей оцени ваются их параметры и вычисляются остатки.
II.2. Каждая из моделей проверяется, насколько она соответству ет данным. Из моделей, адекватных данным, выбирается самая простая модель, т. е. модель с наименьшим количеством парамет ров.
304 |
Гл. 11. Временные ряды |
III. Прогнозирование
После того как на втором этапе выбрана модель, можно строить прогноз на один или несколько шагов по времени и оценивать доверительные границы прогнозных значений.
Остановимся подробнее на втором и третьем этапах методики Бокса-Дженкинса.
Оценивание ARMA моделей
В современные компьютерные пакеты включены различные ме тоды оценивания ARMA моделей, такие, как линейный или нели нейный МНК, полный или условный метод максимального прав доподобия.
Рассмотрим пример ARMA(1,1) модели (11.86). Запишем ее в виде:
0 (L )-1yt = e ( L ) - \6 + Фт- i) + ей |
(11.89) |
где 0(L) = 1 —9iL и 0(L)_1 = 1 + 0I L + ^ L 2+ . .. В (11.89) надо каким-то образом интерпретировать переменную у* = 0(L )-1yt, которая является бесконечной взвешенной суммой предыдущих значений ytОдним из возможных решений является следующее. Приравняем нулю все значения, предшествующие началу наблю дений: уо = у - 1 = ... = 0. При этом получим:
3/1 = У ь Уг = 3 /2 + 013/1. ••• У? = |
Уг + 0\V t-i + • • • + |
0 i- 1 !/l- |
В этих обозначениях уравнение (11.89) принимает вид |
|
|
Уг = <5*+ ФхУ'г- 1 + £t, |
** = |
U1-90) |
В том случае, если вх известно, это уравнение является линейным по 6*, ф\, однако в общем случае оно нелинейно по параметрам.
Для оценивания уравнения (11.89) применим условный метод максимального правдоподобия (conditional ML)t когда у\ предпо лагается заданным, считая, что ошибки £f ~ iidN(0,<r2). Условная
306 Гл. 11. Временные ряды
Во-первых, оценки коэффициентов модели должны статисти чески достоверно отличаться от нуля, т. е. соответствующие Р- значения t-статистик должны быть меньше выбранного порого вого значения.
Во-вторых, согласно модели ошибки et являются белым шу мом. Соответственно их оценки, т.е. остатки регрессии et, долж ны быть также похожи на белый шум. Поэтому остатки должны иметь нулевую автокорреляцию.
В модели, включающей константу, среднее остатков равно 0. Поэтому выборочная автокорреляционная функция остатков вы
числяется по формуле: |
|
|
|
Гк = |
Ht=fc+16tet-fc |
fc = 1,2,. |
(11.94) |
V'" *>2 ’ |
|||
|
2^t=i et |
|
|
Если модель адекватна данным, ошибки являются белым шумом, и при больших значениях п и к величина г*. имеет распределе ние, близкое к нормальному N (0, ^). Причем на практике хоро шая аппроксимация начинается с к = 5 ч- 6. Поэтому значение г* вне интервала 0 ± позволяет на 5%-ном уровне значимости от вергнуть гипотезу равенства нулю коэффициента корреляции рк-
Другие тесты проверяют гипотезу равенства нулю сразу К первых значений автокорреляционной функции остатков.
Q-статистика Бокса-Пирса (Box, Pierce, 1970) определяется
как
к |
(11.95) |
Q = n ' £ r l |
|
fc=i |
|
При нулевой гипотезе отсутствия автокорреляции Q имеет рас пределение х 2(К — р - q), где p,q — параметры ARMА модели. Нулевая гипотеза отвергается, если полученное значение Q боль ше соответствующего критического значения.
Тест Лъюнга-Бокса (Ljung, Box, 1978) является модификаци ей теста Бокса-Пирса. Соответствующая статистика
к |
гк2 |
|
Q п(п + 2 )] £ |
||
(11.96) |
||
fc=i |
п — к |
11.4. Модели Бокса-Дженкинса (ARIMA) |
307 |
имеет такое же асимптотическое распределение, как и Q, однако ее распределение ближе к х 2 Для конечных выборок.
Бели тесты показывают наличие автокорреляции остатков, это означает, что рассматриваемая ARMA модель не подходит, и ее надо модифицировать. Например, если в автокорреляцион ной функции отличны от нуля значения с номерами, кратными 4, то стоит попробовать ввести сезонную авторегрессию четвертого порядка. Если единственное отличающееся от нуля значение со ответствует лагу, равному 4, можно попробовать ввестн сезонный МА-член порядка 4.
Если мы имеем ситуацию, когда несколько ARMA моделей оказываются адекватными данным, то, руководствуясь принци пом «экономии мышления», следует выбрать модель с наимень шим количеством параметров.
В компьютерных пакетах среди результатов оценивания при водится информационный критерий Акаике AIC (Akaike informa tion criterion) (Akaike, 1973), определяемый формулой
(11.97)
Критерий Акаике является эвристической попыткой свести в одни показатель два требования: уменьшение числа параметров модели и качество подгонки модели. Согласно этому критерию, из двух моделей следует выбрать модель с меньшим значением AIC.
Обычно также приводится значение критерия Шварца (Schwarz criterion) (Schwarz, 1978)
(11.98)
отличие которого от AIC состоит в большем штрафе за количество параметров.
Заметим, что по своей идеологии критерии Акаике и Шварца близки к скорректированному R2 (3.28).
308 |
Гл. 11. Временные ряды |
Прогнозирование с ARIMA моделями
Главная цель использования ARIMA моделей — построение про гноза за пределы выборки. Есть два источника неточности про гноза: первый — игнорирование будущих ошибок et>второй — от клонение оценок коэффициентов модели от их истинных значе ний. В данном разделе мы будем рассматривать только первый источник ошибок прогноза или, другими словами, прогнозирова ние в рамках теоретических моделей.
Рассмотрим проблему прогнозирования на примере ARMA(1,1) и АШМА( 1,1,0) моделей (несколько более простых примеров вы несено в упражнения).
ARMA(1,1) модель. Прогнозирование
Из (11.86) получаем значение у в момент п + 1:
Уп+1 = 6 + ф\уп + £п+1 - #1 £»»•
Используя обозначение /х = E(yt) = 6 / ( 1 - фi), получаем:
( з /п + 1 “ /* ) = Ф\(Уп — /* ) + £ п + 1 - 0 1 £ п - |
( 1 1 . 9 9 ) |
Прогноз на один шаг, минимизирующий среднеквадратичное от клонение, равен Уп+i = Е(уп+х|/п) (см. МС, п.2), где 1п — инфор мация, доступная в момент п. Из (11.99) получаем:
(Уп+i - м) = ФЛУп - м) - 01 |
( 11.100) |
Ошибка прогноза и ее дисперсия равны
en+i = Уп+i - Уп+i = £п+ь |
V(e„+i) = <T2. |
(11.101) |
Используя две итерации уравнения (11.99), получаем
(Уп+2 —р) = ф\(Уп — р) + еп+2 + (Ф\ —0l)£n+l —Ф1@1£п- (11.102)
Отсюда аналогично (11.100) вычисляется прогноз на два шага:
(Уп+2 - м) = Ф\{Уп - /*) - Ф\0\£п>
(11.103)
V(en+2)=<72 (l + ( ^ i - 0 1)2).
Продолжая итерации, можно получить
(Уп+s —р) —Ф\(Уп —р) —Ф\ % е п> |
(11.104) |
11.4. Модели Бокса-Дженкинса (ARJMA) |
309 |
откуда видно, что прогноз стремится к среднему д, когда горизонт прогноза возрастает. Можно показать, что
Д ш У (е*+,) = ^ ( ^ М р 1 ) . |
(11.105) |
Заметим, что это выражение совпадает с дисперсией ряда у, по лученной в (11.876).
АШМА(1,1,0) модель. Прогнозирование
Прогноз нестационарного временного ряда несколько отличается от выше разобранного случая. Рассмотрим временной ряд yt, пер вые разности которого zt являются AR(1) процессом (см. (11.67)):
zt = y t - V t~ 1, |
Н~Р- = Ф\(.Ч-\ ~ p) + £t- |
(11.106) |
Многократное применение (11.106) дает
Уп+8 — Уп + «п+1 + Zn+2 + •••+ Zn+s
= (Уп + Sfl) + (z„+1 - д) + • • • + (2n+s - д). |
(11.107) |
Подставляя zt —д из (11.106) в (11.107), получаем:
Уп+з = Уп + sp, + ~ r ~ T ^ ( j / n Уп—1 - ^) + еп+а» |
(11.108) |
1 - 0 1 |
|
где |
|
&П+3 — £n+s + (1 + 0 i ) e n+ a - l Н------ |
|
+ (1 + 01 + 01-1— ' + 01 l)£n+i- |
(11.109) |
Очевидно, что прогноз, минимизирующий среднеквадратичное отклонение, решен сумме первых трех слагаемых в (11.108). За метим, что второе и третье слагаемые растут с ростом s. Ошибка прогноза на з шагов равна e„+s. В силу формулы (11.109) диспер сия ошибки равна
V(en+e) = <T2(1 + (1 + 0I )2 + >-- |
|
+ (1 + 01 + 0? + --> + 0 Г 1)2). |
(И.110) |
Мы видим, что в случае нестационарного временного ряда дис персия ошибки прогноза монотонно растет с ростом горизонта прогноза з.
310 |
Гл. 11. Временные ряды |
Еще раз отметим, что все вычисления в этом разделе бы ли проведены для теоретической модели, т.е. в предположении, что коэффициенты модели известны точно. Обычно на практи ке мы имеем дело с оценками коэффициентов, что добавляет до полнительную неопределенность в прогноз. Поэтому полученные оценки точности прогноза являются излишне «оптимистически ми». Заметим, что некоторые компьютерные пакеты (например, EViews) корректно рассчитывают дисперсии ошибок прогноза, учитывая и неопределенность в коэффициентах.
Сезонность в ARIMA моделях
В этом разделе мы лишь кратко упомянем обобщение АШМА моделей на случай наличия сезонной компоненты. Рассмотрим следующий пример. Пусть ряд yt имеет сезонную (квартальную) компоненту. Тогда можно написать простейшую модель, связыва ющую значение переменной в текущем квартале с ее значением в том же квартале предыдущего года:
Vt = 4>[a)yt-A + «t-
Так как временные ряды обладают статистической связью сосед них значений, то можно предположить, что ошибки щ удовлетво ряют AR(1) процессу
щ = Ф1Щ - 1 + £ (, |
et ~ iid ( 0 , а 2). |
Из двух последних уравнений получаем:
(1 - фгЩ 1 - ^ s)L4)y{ = £t,
или
Vt = Ф т - 1 + |
- Ф х Ф ^ У ^ ь + S t- |
Такая модель обозначается AR(l)xSAR(l). Она похожа на AR(5) модель с тремя (нелинейными) ограничениями на коэффициенты.
Подробнее о свойствах подобных моделей можно прочитать, например, в (Johnston and DiNardo, 1997), (Box and Jenkins, 1976).