ЭКОНОМЕТРИКА и математическая экономика / Эконометрика. Учебник продвинутый (2005)
.pdf14.8. Прогнозирование по модели Бокса—Дженкинса |
483 |
Точно так же можно рассматривать формулу (14.69) как разностное уравнение, решая которое относительно ψi , получим в явном виде общую формулу для функции реакции на импульсы. По формуле (14.69) получаем
ψ0 = 1, ψ1 = (1 + ϕ1)ψ0 − θ1 = 1 + ϕ1 − θ1,
ψ2 = (1 + ϕ1)ψ1 − ϕ1ψ0,
.
.
.
ψi = (1 + ϕ1)ψi−1 − ϕ1ψi−2, i > 1.
Легко показать, что решение этого разностного уравнения имеет следующий общий вид:
|
|
|
|
|
|
|
|
|
|
|
|
ψi = B0 |
+ B1 |
ϕi |
, |
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
где B |
0 |
= |
1 − θ1 |
, B |
1 |
= 1 |
− |
B |
0 |
= |
θ1 − ϕ1 |
. С учетом этого модель ARIMA(1, 1, 1) |
||||||||
|
|
1 ϕ1 |
|
|
|
|
1 |
− |
ϕ1 |
|
|
|
||||||||
представляется− в виде: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
x |
|
= |
∞ |
B |
|
+ B ϕi |
ε |
. |
|||||
|
|
|
|
|
|
|
t |
|
|
0 |
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
1 |
t−i |
|
i=0
Используя полученную формулу для коэффициентов ψi , найдем также дисперсию прогноза:
2 |
2 |
τ −1 |
|
σ2 τ −1 |
i |
2 |
|
2 |
|
ε |
|
||||
σp |
= σε |
i=0 ψi |
= |
|
|
1 − θ1 + (θ1 − ϕ1) ϕ1 . |
|
(1 − ϕ1)2 i=0 |
Отметим, что в пределе слагаемые стремятся к положительному числу 1 − θ1. Это означает, что с ростом горизонта прогноза τ дисперсия (а, следовательно, ширина прогнозного интервала) неограниченно возрастает. Такое поведение дисперсии связано с тем, что рассматриваемый процесс является нестационарным.
Прогнозирование по модели Бокса—Дженкинса в конечных выборках
Выше мы предполагали, что в момент t известна полная предыстория Ωt = (xt, xt−1, . . . ). Фактически, однако, человеку, производящему прогноз, известен только некоторый конечный ряд (x1, . . . , xt). В связи с этим для практического использования приведенных формул, требуется внести в них определенные поправки.
484 |
Глава 14. Линейные стохастические модели ARIMA |
В частности, параметры модели на практике не известны, и их требуется оценить. Это вносит дополнительную ошибку в прогноз.
Кроме того, ошибки εt , вообще говоря, неизвестны, и вместо них в выражении (14.65) следует использовать остатки et , полученные в результате оценивания модели. При наличии в модели скользящего среднего (т.е. при q > 0) ошибки не выражаются однозначно через наблюдаемый ряд {xt} и требуется использовать какое-то приближение. Наиболее простой метод состоит в том, чтобы положить остатки et при t 0 равными нулю, а остальные остатки вычислять рекуррентно, пользуясь формулой
p+d q
εt = xt − fj xt−j + θj εt−j , j=1 j=1
где вместо ошибок εt используются остатки et , а вместо неизвестных истинных параметров fj и θj — их оценки.
Из-за того, что параметры не известны, а оцениваются, дисперсия ошибки прогноза будет выше, чем следует из (14.8). Имея некоторую оценку ковариационной матрицы оценок параметров, можно было бы внести приблизительную поправку, но эти расчеты являются достаточно громоздкими.
Далее, расчеты дисперсии прогноза с использованием (14.8) сами по себе являются приближенными, поскольку встречающиеся там величины приходится оценивать. Это относится и к функции реакции на импульсы ψi , и к дисперсии ошибки σε2 .
Приложение.
Неоптимальность линейных прогнозов в модели ARMA
То, что ошибка εt представляет собой белый шум (т.е. ошибки некоррелированы, имеют нулевое математическое ожидание и одинаковую дисперсию), не подразумевает, что E (εt+k |Ωt) = 0 при k > 0. Поэтому в общем случае прогнозная функция, полученная по формуле (14.64) (или, эквивалентно, (14.65)) не будет оптимальной в среднеквадратическом смысле. Однако она, как было показано, является оптимальной среди линейных прогнозных функций. Кроме того, если ошибки независимы, то требуемое свойство выполнено. В частности, оно верно для гауссовского белого шума, т.к. для гауссовских процессов некоррелированность эквивалентна независимости.
Рассмотрим в качестве примера неоптимальности прогноза (14.64) следующий процесс {εt}. Значения, соответствующие четным t независимы и распределены как N (0; 1). При нечетных же t значения определяются по формуле
ε2−1 − 1
εt = t √ .
2
14.9. Модели, содержащие стохастический тренд |
485 |
Таким образом, при нечетных t значения ряда полностью предопределены предысторией. Несложно проверить, что данный процесс представляет собой белый шум. Он имеет нулевое математическое ожидание, единичную дисперсию и не автокоррелирован. Если же построить на основе такого белого шума марковский процесс
x |
t |
= ϕ x |
t−1 |
+ ε , то при нечетных t оптимальным прогнозом на один шаг вперед |
|||||
|
1 |
|
t |
2 |
√ |
|
|
||
|
|
|
|
|
2, причем прогноз будет безошибочным. |
||||
будет не ϕ1xt−1 |
, а ϕ1xt−1 + εt−1 − 1 / |
|
|||||||
При четных же |
t |
стандартная формула будет оптимальной. |
Приведенный пример наводит на мысль о том, что во многих случаях можно подобрать нелинейную прогнозную функцию, которая позволяет сделать более точный прогноз, чем полученная нами оптимальная линейная прогнозная функция. В качестве менее экзотического примера можно привести модели с авторегрессионной условной гетероскедастичностью, о которых речь идет в одной из последующих глав.
14.9. Модели, содержащие стохастический тренд
Модели со стохастическим трендом можно отнести к классу линейных нестационарных моделей ARIMA(p, d, q), но они имеют свои особенности.
Рассмотрим эти модели.
1. Модель случайного блуждания (The Random Walk Model).
Эта модель является частным случаем модели AR(1) с единичным корнем:
xt = xt−1 + εt. |
(14.72) |
Если начальное условие x0 известно, общее решение может быть представлено в виде
t
xt = x0 + εi.
i=1
Безусловное математическое ожидание: E(xt) = E(xt+k ) = x0 . Условное математическое ожидание:
k t
E(xt+k |Ωt) = E((xt + εt+i)|Ωt) = xt = x0 + εi.
i=1 i=1
Таким образом, условное математическое ожидание E(xt+k |Ωt) обязательно
|
t |
включает в себя случайную компоненту, равную |
εi , которую называют сто- |
хастическим трендом. |
i=1 |
|
14.9. Модели, содержащие стохастический тренд |
487 |
На практике многие ряды, включая предложение денег и реальный ВНП, ведут себя как процесс случайного блуждания с дрейфом.
Заметим, что первая разность ряда стационарна, т.е. переход к первой разности создает стационарную последовательность: {∆xt} = {a0 + εt} с математическим ожиданием, равным a0 , дисперсией σε2 и γk = 0 для всех t, следовательно, это тоже ARIMA(0, 1, 0).
3. Модель случайного блуждания с шумом (The Random Walk plus Noise Model).
Эта модель представляет собой совокупность стохастического тренда и компоненты белого шума. Формально модель описывается двумя уравнениями:
xt = µt + ηt,
(14.74)
µt = µt−1 + εt,
где {ηt} — белый шум с распределением N (0, ση2 ), εt и ηt независимо распределены для всех t и k: E(εt, ηt−k ) = 0.
Общее решение системы (14.74) имеет вид:
t
xt = µ0 + εi + ηt.
i=1
Легко убедиться в том, что все моменты второго порядка зависят от времени:
|
|
|
|
|
|
var(xt) = tσε2 + ση2, |
|
|
|
|
|
|||
γ |
= cov(x |
, x |
t+k |
) = E((ε |
+ . . . + ε |
+ η )(ε |
1 |
+ . . . + ε |
+ η )) = tσ2 |
, |
||||
k |
t |
|
1 |
t |
t |
|
t−k |
t |
ε |
|
||||
|
|
|
|
ρk = |
|
|
t σε2 |
|
|
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
(tσε2 + ση2) ((t + k) σε2 + ση2) |
|
|
|
Следовательно, процесс 14.74 нестационарен. Но первая разность этого процесса ∆xt = εt + ∆ηt стационарна с параметрами:
E(∆xt) = E(εt + ∆ηt) = 0,
var(∆xt) = E((∆xt)2) = E((εt + ∆ηt)2) =
= σ2 + 2E(εt∆ηt) + E(η2 − 2ηtηt−1 + η2−1) = σ2 + 2σ2,
ε t t ε η
γ1 = cov(∆xt, ∆xt−1) = E((εt + ηt − ηt−1)(εt−1 + ηt−1 − ηt−2)) = −ση2,
γk = cov(∆xt, ∆xt−k ) = E((εt + ηt − ηt−1)(εt−k + ηt−k − ηt−k−1)) = 0, k > 1.
Таким образом, первые разности ведут себя как MA(1)-процесс, а модель случайного блуждания с шумом можно квалифицировать как ARIMA(0, 1, 1).
488 |
Глава 14. Линейные стохастические модели ARIMA |
4. Модель общего тренда с нерегулярностью (The General Trend plus Irregular Model).
Эта модель содержит детерменированный и стохастический тренды, а также MA(q)-ошибку. Частный ее вариант:
xt = µt + ηt,
(14.75)
µt = µt−1 + a0 + εt.
t
Решением (14.75) является модель общего тренда a0t + εi с шумом:
i=1
t
xt = µ0 + a0t + εi + ηt.
i=1
Первая разность этой модели отличается от предыдущего варианта на константу a0 : ∆xt = a0 + εt + ∆ηt. Поэтому
E(∆xt) = a0, var(∆xt) = σε2 + 2ση2, γ1 = −ση2,
γk = 0, k > 1.
Следовательно, модель общего тренда с шумом — это также ARIMA(0, 1, 1).
В более общей постановке эта модель формулируется при помощи оператора θ(L):
t
xt = µ0 + a0t + εi + θ(L)ηt.
i=1
5. Модель локального линейного тренда (The Local Linear Trend Model).
Пусть {εt}, {ηt} и {δt} — три взаимно некоррелированных процесса белого шума. Тогда модель представляется следующими уравнениями:
xt = µt + ηt, |
|
µt = µt−1 + at + εt, |
(14.76) |
at = at−1 + δt. |
|
Легко показать, что рассмотренные ранее модели являются частными случаями данной модели.
14.9. Модели, содержащие стохастический тренд |
489 |
Для нахождения решения выражаем at из последнего уравнения системы (14.76):
t
at = a0 + δi.
i=1
Этот результат используется для преобразования µt:
t
µt = µt−1 + a0 + δi + εt.
i=1
Далее,
t t−1
µt = µ0 + εi + a0t + (t − j)δj+1.
i=1 j=0
Наконец, находим решение для xt:
t t−1
xt = µ0 + εi + a0t + (t − j)δj+1 + ηt.
i=1 j=0
Каждый элемент в последовательности {xt} содержит детерминированный тренд, причем весьма специфического вида, стохастический тренд и шум ηt.
Модель локального линейного тренда ведет себя как ARIMA(0, 2, 2). Действительно, первые разности процесса ∆xt = at + εt + ∆ηt нестационарны, поскольку at — процесс случайного блуждания. Однако, вторая разность
∆2xt = δt + ∆εt + ∆2ηt
уже стационарна и имеет с параметры:
E(∆2xt) = 0,
var(∆2xt) = σδ2 + σε2 + 6ση2, γ1 = −σε2 − 4ση2, γ2 = ση2.
Все остальные коэффициенты автоковариации γk для k > 2 равны нулю.
490 |
Глава 14. Линейные стохастические модели ARIMA |
14.10. Упражнения и задачи
Упражнение 1
Сгенерируйте ряд длиной 4000 наблюдений по модели AR(1) с параметром ϕ = 0.5 и нормально распределенной неавтокоррелированной ошибкой с единичной дисперсией, предполагая что значение ряда в момент t = 0 равно нулю. В действительности вид модели неизвестен, а задан только ряд.
1.1.Разбейте ряд на 200 непересекающихся интервалов по 20 наблюдений. По каждому из них с помощью МНК оцените модель AR(1). Проанализируйте распределение полученных оценок авторегрессионного параметра. Насколько велика дисперсия оценок и есть ли значимое смещение по сравнению с истинным параметром?
1.2.Рассмотрите построение прогноза на 1 шаг вперед с помощью трех моделей: AR(1), AR(2) и модели линейного тренда. Для этого ряд следует разбить на 200 непересекающихся интервалов по 20 наблюдений. По каждому из этих интервалов с помощью МНК необходимо оценить каждую из трех моделей, построить прогноз и найти ошибку прогноза. Сравните среднеквадратические ошибки прогноза по трем моделям и сделайте выводы.
Упражнение 2
Сгенерируйте 200 рядов длиной 20 наблюдений по модели AR(1) с авторегрессионным параметром ϕ1 = (k − 1)/200, k = 1, . . . , 200, с нормально распределенной неавтокоррелированной ошибкой и единичной дисперсией. По каждому ряду с помощью МНК оцените модель AR(1). Постройте график отклонения оценки от истинного значения параметра в зависимости от истинного значения параметра ϕ1 . Что можно сказать по этому графику о поведении смещения оценок в зависимости от ϕ1 ? Подтверждается ли, что оценки смещены в сторону нуля и смещение тем больше, чем ϕ1 ближе к единице?
Упражнение 3
Сгенерируйте 200 рядов длиной 20 наблюдений по модели MA(2) с параметрами θ1 = 0.5, θ2 = 0.3 и нормально распределенной неавтокоррелированной ошибкой с единичной дисперсией.
3.1.Для каждого из рядов постройте выборочную автокорреляционную функцию для лагов 1, 2, 3. Рассмотрите распределение коэффициентов автокорреляции и сравните их с теоретическими значениями.
14.10 Упражнения и задачи |
491 |
3.2.По каждому ряду на основе выборочных коэффициентов автокорреляции оцените модель MA(2), выбирая то решение квадратного уравнения, которое соответствует условиям обратимости процесса. Рассмотрите распределение оценок и сравните их с истинными значениями.
Упражнение 4
Имеется информация о реальных доходностях ценных бумаг для трех фирм Blaster, Mitre, и Celgene (дневные доходности, приведенные к годовым). (См. табл.
14.1.)
4.1.Изобразите график ряда для каждой из фирм и кратко охарактеризуйте свойства ряда.
4.2.Для каждой из фирм посчитайте среднее по двум разным непересекающимся подпериодам. Проверьте гипотезу равенства двух средних, используя простой t-критерий.
4.3.Для каждой из фирм посчитайте дисперсию по тем же двум подпериодам. Проверьте гипотезу равенства дисперсий, используя F -критерий. Какой вывод можно сделать относительно стационарности рядов?
4.4.Для каждой из фирм рассчитайте выборочные автоковариации, автокорреляции и выборочные частные автокорреляции для лагов 0, . . . , 6. Постройте соответствующие графики. Оцените значения параметров p и q модели
ARMA(p, q).
4.5.Оцените параметры ϕ и θ модели ARMA(p, q) для каждой фирмы.
4.6.Постройте прогнозы доходности ценных бумаг на основе полученных моделей на 6 дней вперед.
Упражнение 5
Для данных по производству природного газа в СССР (табл. 12.2, с. 403) постройте модель ARIMA(p, d, q) и оцените доверительный интервал для прогноза на 5 шагов вперед.
Задачи
1.Записать с использованием лагового оператора случайный процесс: а) xt = µ + ϕ1xt−1 + ϕ2xt−2 + . . . + ϕpxt−p + εt;