Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Диплом / suslov_ibragimov_ekonometrika

.pdf
Скачиваний:
46
Добавлен:
24.03.2015
Размер:
5.55 Mб
Скачать

472

 

 

Глава14.Линейные стохастические модели

ARIMA

 

 

 

 

 

0.8

 

 

 

 

0.8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0.6

 

 

 

 

0.6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0.4

 

 

 

 

0.4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0.2

 

 

 

 

0.2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

0

50

100

150

200

0

50

100

150

200

0

Рис. 14.6.Автокорреляционная функция интегрированного процесса(слева)и стационарного процесса(справа)

Они будут обладать не только свойством состоятельности,но и свойством эффективности.

К примеру,для парной регрессии xt = αzt + wt, где w = ϕwt−1 + εt , преобразование(14.63)приводит к уравнениям

GG

1 − ϕ2x1 = α 1 − ϕ2z1 + ε1

и

xt − ϕxt−1 = α(zt − ϕzt−1) + εt , t > 1,

для оценивания которых при данном ϕ применим обычный МНК.

После получения эффективных оценок параметров регрессии можно пересмотреть оценки параметров процесса ARMA.Можно продолжать такие итерации и далее до тех пор,пока не будет достигнута требуемая сходимость(см.метод КочренаÑОркатта,описанный в п. 8.3).

Распознавание порядка модели

Сначалавычисляютсяразностиисходногорядадотехпор,покаонинеокажутся стационарными относительно математического ожидания и дисперсии,и отсюда получают оценку d.

Если процесс является интегрированным,то его выборочная автокорреляционная функция затухает медленно,причем убывание почти линейное.Если же автокорреляционная функция затухает быстро,то это является признаком стационарности.В качестве примера на рисуке 14.6слева изображена коррелограмма

14.7Оценивание,распознавание и диагностика модели ARIMA

473

ряда длиной в1000наблюдений,полученного по модели ARIMA(3, 1, 2),заданной уравнением(14.53).Справа на том же рисунке изображенакоррелограмма первых разностей того же ряда,которые подчиняются стационарной модели ARMA(3, 2), заданной уравнением(14.54).

Формальные критерии выбора d рассматриваются в пункте17.4.

Следует понимать,что достаточно сложно отличить процесс,который имеет единичный корень,от стационарного п роцесса,в котором есть корень близкий к единице.

Если d окажется меньше,чем требуется,то дальнейшее оценивание будет применяться к нестационарному процессу,что должно проявиться в оценках параметров авторегрессииÑв сумме они будут близки к единице.Если d окажется больше,чем требуется,то возникнет эффект избыточного взятия разности (overdifferencing),которыйпроявляется втом,чтовхарактеристическомуравнении скользящегосреднего появляется единичный корень.Это может создать трудности при оценивании скользящего среднего.

Для выбора порядка авторегрессии можно использовать выборочную частную автокорреляционнуюфункцию.Какизвестно,теоретическаячастная автокорреляционная функция процесса AR(p) обрывается на лаге p.Таким образом, p следует выбрать равным порядку,при котором наблюдается последнее достаточно большое(по модулю)значение выборочной частной автокорреляционной функции.Доверительные интервалы можно основывать на стандартной ошибке"выборочного частного коэффициента автокорреляции,которая равна примерно 1 T для по-

рядков выше p (для которых теоретическая автокорреляционная функция равна нулю).

Аналогично,для выбора порядка скольз ящего среднего можно использовать выборочную автокорреляционную функцию,поскольку теоретическая автокорреляционнаяфункцияпроцессаMA(q) обрываетсяналаге q.Такимобразом, q следует выбрать равным порядку,при котором наблюдается последнее достаточно боль-

шое(помодулю)значениевыборочнойавтокорреляционнойфункции.Стандартная

"

ошибка выборочного коэффициента автокорреляции тоже примерно равна 1 T .

Болееточнаяформуластандартнойошибкидляавтокорреляциипорядка k ( k > q)

A

имеет вид

T − k

(см.стр. 367).

 

T (T + 2)

 

Если же нет уверенности,что процес с является чистой авторегрессией или чистымпроцессомскользящегосреднего,тоэтиметодынеподходят.Но,покрайней мере,по автокорреляционной функции и частной автокорреляционной функции можно проследить,насколько быстро угасает зависимость в ряде.

474

Глава14.Линейные стохастические модели ARIMA

Порядок модели ARMA(p, q) можно выбирать на основе информационных критериев:

информационный критерий Акаике:

AI C = ln(se2) +

2(p + q + n + 1)

;

 

T

 

 

 

 

байесовский информационный критерий Шварца:

 

 

BI C = ln(se2) +

(p + q + n + 1) ln T

.

 

 

 

T

 

 

Здесь s2e Ñостаточная дисперсия,рассчитанная по модели, n + 1 относится к дополнительным оцениваемым параметрамÑконстанте и коэффициентам при факторах регрессии(14.60).Порядок (p, q) выбирается посредством перебора из некоторого множества моделей так,чтобы информационный критерий достигал минимума.Критерий Акаике нацелен на повышение точности прогнозирования, а байесовский критерийÑна максимизацию вероятности выбора истинного порядка модели.

Можно также выбирать порядок по тому принципу,что остатки должны быть похожи на белый шум,для чего использовать проверку остатков на автокорреляцию.Если остатки автокоррелированы,то следует увеличить p или q.

Диагностика

В основе модели ARIMA лежит предположение,что ошибки εt являются белым шумом.Это предполагает отсутствие автокорреляции и гомоскедастичность ошибок.Для проверки ошибок на гомоскедастичность могут использоваться те же критерии,которые были рассмотрены ранее в других главах.Здесь мы рассмотрим диагностику автокорреляции ошибок.

Простейший способ диагностикиÑграфический,состоящий в изучении коррелограммы и спектрограммы остатков.Кореллограмма должна показывать только малые,статистически не значимые значения автокорреляций.Спектрограмма должна быть достаточноÇплоскойÈ,не иметь наклона и не содержать сильно выделяющихся пиков.

Для формальной проверки отсутствия автокорреляции ошибок можно использовать Q-статистику БоксаÑПирса и ее модификациюÑстатистику ЛьюнгаÑ Бокса,которые основаны на квадратах нескольких( m)первых выборочных коэффициентов автокорреляции9 (см.стр. 368).

9Привыборечисла m следуетпомнить,чтопрималом m,еслиимеетсяавтокорреляциявысокого порядка,критерий может не показать автокорреляцию.При большом же m присутствие значитель-

14.8.Прогнозирование по модели БоксаÑДженкинса

475

Статистика БоксаÑПирса:

 

 

 

 

 

 

 

 

m

 

 

 

 

 

 

k!

2

 

 

 

 

÷

 

 

 

 

 

Q = n

 

rk .

 

 

 

 

 

=1

 

 

 

 

 

 

Статистика ЛьюнгаÑБокса:

 

 

 

 

 

 

 

 

m

 

r2

 

 

 

Q = n(n + 2)

k!

 

 

 

 

 

n

k .

 

 

 

 

 

k

 

 

 

 

=1

 

 

 

 

 

Здесь в качестве rk следует использовать выборочные коэффициенты автокорреляции,рассчитанные на основе остатков et модели ARIMA:

 

n

n

.

rk = t=%k

 

 

et et−k

 

+1

 

 

t%

 

 

 

e2

 

 

 

t

 

 

 

=1

 

Поскольку для вычисления rk используется не белый шум,а остатки,то асимпто-

тическое распределение этих Q-статистик отличается оттого,которое имеетместо

для истинного белого шума,на количест во параметров авторегрессии и скользя-

щего среднего,оцененных по модели,т.е.на величину

(p + q).Обе статистики

асимптотически распределены как χ2mpq .Как показали Льюнг и Бокс,предложенная имимодифицированная Q-статистика,которая придает меньший весдальним автокорреляциям,имеет распределение,которое ближе аппроксимирует свой асимптотический аналог,поэтому более предпочтительно использовать именно ее.

Нулевая гипотеза состоит в том,что ош ибка представляет собой белый шум (автокорреляция отсутствует).Если Q-статистика превышает заданный квантиль распределенияхи-квадрат,тонулеваягипотезаотвергаетсяиделаетсявыводотом, что модель некорректна.Возможная причина некорректностиÑнеудачный выбор порядка модели(слишком малые значения p и q).

14.8.Прогнозирование по модели БоксаÑДженкинса

Прогнозирование стационарного процессаARMA

ПустьдлястационарногообратимогопроцессаARMA вмомент t делаетсяпрогноз процесса x на τ шагов вперед,т.е.прогноз величины xt+τ .Для упрощения

ных автокорреляций может быть не замечено при наличии большого числа незначительных.То есть мощность критерия зависит от правильного выбора m.

476

Глава14.Линейные стохастические модели ARIMA

рассуждений предположим,что при прог нозировании доступна вся информация о процессе x до момента t включительно,т.е.информация,на основе которой строится прогноз,совпадает с полной предысторией процесса

Ωt = (xt , xt−1, . . . ) .

Заметим,что на основе (xt , xt−1, . . . ) можно однозначно определить ошибки (εt , εt−1, . . . ) и наоборот,поэтому при сделанных предположениях ошибки (εt , εt−1, . . . ) фактически входят в информационное множество.Кроме того,имея полнуюпредысторию,можноточновычислитьпараметрыпроцесса,поэтомубудем далее исходить из того,что пар аметры процесса нам известны.

Из теории прогнозирования известно,что прогнозом,минимизирующим среднийквадратошибки,будетматематическоеожидание xt+τ ,условноеотносительно Ωt ,т.е. E (xt+τ t ).Убедимся в этом,воспользовавшись представлением модели ARMA в виде модели линейного фильтра(разложением Вольда) (14.52)

xt+τ = εt+τ + ψ1εt+τ −1 + . . . + ψτ −1εt+1 + ψτ εt + ψτ +1εt−1 + . . . ,

где во вторую строчку вынесены слагаемые,относящиеся к предыстории;получим таким образом следующее представление условного математического ожидания:

E(xt+τ t) = E (εt+τ t) + ψ1E (εt+τ −1t) + . . . +

+ψτ −1E (εt+1t) + ψτ εt + ψτ +1εt−1 + . . . .

Вторую строчку формулы пишем без оператора условного математического ожидания,поскольку соответствующие слагаемые входят в предысторию Ωt .

Будем предполагать,что условное относительно предыстории математическое ожидание будущих ошибок равно нулю,т.е. E (εt+k t) = 0 при k > 0.Это будет выполнено,наприм ер,если все ошибки εt независимы между собой. (Отсутствия автокорреляции тут недостаточно.В приложении приводится пример белого шума, для которого это неверно.)Тогда рассм атриваемое выражение упрощается:

E (xt+τ t) = ψτ εt + ψτ +1εt−1 + . . . ,

что дает нам линейную по ошибкам формулу для оптимального прогноза:

 

 

xt (τ ) = ψτ εt + ψτ +1εt−1 + . . . =

!i

(14.64)

ψτ +iεt−i ,

 

=0

 

где мы обозначили через xt (τ ) прогноз на τ периодов,сделанный в момент t.

14.8.Прогнозирование по модели БоксаÑДженкинса

477

Проверим,чтоэтапрогнознаяфункциябудетоптимальной(всмыслеминимума среднего квадрата ошибки)среди линейных прогнозных функций,т.е.среди прогнозных функций,представимых в виде л инейной комбинации случайных ошибок, входящих в предысторию:

 

xt (τ ) = ψτ εt + ψτ +1εt−1 + ψτ +2εt−2 + . . . =

!i

ψτ +iεt−i .

 

=0

Для этого найдем веса ψτ , ψτ +1, ψτ +2, . . .,которые обеспечивают минимум сред-

него квадрата ошибки.С учетом того,что x

t+τ

=

ψ ε

,ошибка такого

 

 

 

 

i t+τ −i

 

прогноза ηt (τ ) равна

 

 

 

 

=0

 

 

 

 

 

i%

 

 

 

 

 

 

ηt (τ ) = xt+τ − xt(τ ) =

!

 

 

!i

=

ψi εt+τ −i ψτ +iεt−i

 

τ −1

i=0

 

 

=0

 

 

 

 

 

 

 

!

!i

− ψτ +i t−i ,

 

=

ψi εt+τ −i +

(ψτ +i

 

 

i=0

=0

 

 

 

 

асредний квадрат ошибкипрогноза(сучетом некоррелированности ошибок)равен

E[ηt (τ )2] = E ,τ −1 ψi εt+τ −i

+ τ +i − ψτ +i t−i .2

=

 

 

!

!i

 

 

 

 

= E P

i=0

=0

 

 

 

 

ψi2εt2+τ −i + (ψτ +i − ψτ +i )2εt2−i Q =

 

 

τ

−1

 

 

 

 

 

!i

!

 

 

 

 

 

 

=0

i=0

 

 

 

 

 

 

. . . + ψτ2−1) + σε2

!i

 

 

= σε2(1 + ψ12 + ψ22 +

τ +i − ψτ +i )2.

 

 

 

 

 

=0

 

 

Очевидно,что средний квадрат ошибки достигает минимума при

ψτ +i = ψτ +i

и равен

E[ηt(τ )2] = σε2 P1 + ψi2Q.

 

 

 

 

 

 

 

 

 

 

 

τ −1

 

 

 

 

 

 

 

!i

 

 

 

 

 

 

 

=1

 

 

 

Ошибка такого прогноза рассчитывается по формуле

 

 

 

 

 

τ −1

 

 

 

 

 

 

ηt (τ ) =

!i

ψiεt+τ −i .

 

 

 

 

 

=0

 

 

 

 

 

Из формулы видно,что эта ошибка проистекает из будущих ошибок

εt+k ,которые

в момент t еще неизвестны.Беря математичес кое ожидание от обеих частей,

478

Глава14.Линейные стохастические модели ARIMA

видим,чтоматематическоеожиданиеошибкипрогнозаравнонулю.Такимобразом, прогноз,полученный по формуле(14.64),будет несмещенным.

Из несмещенности прогноза следует,что дисперсия ошибки прогноза равна среднему квадрату ошибки прогноза,т.е.

σp2 = E[ηt(τ )2] = σε2

P1 + ψi2Q.

 

τ −1

 

!i

 

=1

или

 

 

τ −1

 

σ2

= σ2

!i

 

ψ2

,

p

ε

i

 

 

 

=0

 

где ψ0 = 1.

Хотя представление в виде бесконечного скользящегосреднего удобно для анализа прогнозирования,однако для выч исления прогноза предпочтительнее вернуться к исходному представлению модели ARMA в виде разностного уравнения (со сдвигом на τ периодов вперед):

xt+τ = ϕ1xt+τ −1 + . . . + ϕp xt+τ −p + +εt+τ − θ1εt+τ −1 − . . . θq εt+τ −q .

Возьмем от обеих частей уравнения условное относительно предыстории математическое ожидание:

xt (τ ) = E[xt+τ t ] = ϕ1E[xt+τ −1t ] + . . . + ϕp E[xt+τ −p t] +

+ E[εt+τ t ] − θ1E[εt+τ −1t ] − . . . − θq E[εt+τ −q t].

Введем более компактные обозначения:

E[xt+it ] = xøt+i , E[xt+τ i] = εøt+i.

Вэтих обозначениях

xt (τ ) = xøt+τ = ϕ1t+τ −1 + . . . + ϕp t+τ −p +

+εøt+τ − θ1εøt+τ −1 − . . . − θq εøt+τ −q . (14.65)

14.8.Прогнозирование по модели БоксаÑДженкинса

479

При вычислении входящих в эту формулу условных математических ожиданий используют следующие правила:

t+i = E[xt+i Ωt ] =

xt+i, i ! 0,

|

 

 

 

 

 

x

(i),

i > 0,

 

 

t

 

 

 

 

 

 

 

εøt+i = E[εt+i Ωt ] =

 

εt+i ,

i ! 0,

|

 

0,

 

i > 0,

 

 

 

 

 

 

 

 

 

 

 

 

 

дающие удобную рекуррентную формулу для вычисления прогнозов.

Для вычисления показателя точности прогноза(дисперсии ошибки прогноза или,что в данном случае то же самое,пос кольку прогноз несмещенный,среднего квадрата ошибки прогноза),удобно опять вернутся к представлению модели в виде бесконечного скользящего среднего.Как мы видели,дисперсия ошибки прогно-

за равна σ2

= σ2

(1 +

 

τ −1

ψ2).Формулы для вычисления коэффициентов ψi

p

ε

 

 

 

i=1

i

скользящего среднего

приведены на стр. 462.

 

%

 

 

МывывелиформулыдлярасчетаточечногопрогнозапомоделиARMA идисперсииэтогопрогноза.Еслидополнительно предположить,что ошибки εt подчиняются нормальному закону(т.е.представляют собой гауссовский процесс),то можно получить также интервальный прогноз.При этом предположении при известных значенияхпроцессадомомента t распределениебудущегозначенияпроцесса xt+τ (т.е.условное распределение xt+τ t )также будет нормальным со средним значением xt (τ ) и дисперсией σp2:

( ) xt+τ t N xt (τ ), σp2 .

Учитывая это,получаем доверительный интервал для xt+τ ,т.е.интервальный прогноз:

[xt(τ ) − ξ1−α σp, xt (τ ) + ξ1−α σp] ,

 

 

 

 

или

 

 

 

 

 

 

 

 

 

Pxt (τ ) − ξ1−ασε

@

 

 

, xt(τ ) + ξ1−α σε@

 

 

Q

,

(14.66)

!i=0

ψi

!i=0

ψi

 

 

τ −1

2

 

τ −1

2

 

 

 

где ξ1−α Ñдвусторонний (1 − α)-квантиль стандартного нормального распределения.Это (1 − α) á 100-процентный доверительный интервал.

480 Глава14.Линейные стохастические модели ARIMA

Прогнозирование процессаARIMA

Для прогнозирования процесса ARIMA(p, d, q) при d > 0 можно воспользоваться представлением его в виде ARMA(p + d, q):

f(L)xt = θ(L)εt ,

где

f(L) = 1 − f1L − f2L2 − . . . − fp+dLp+d = ϕ(L)(1 − L)d ,

а коэффициенты f1, f2, . . . , fp+d выражаются через ϕ1, ϕ2, . . . ,ϕ p .В развернутой записи

p+d

q

 

j!

!

 

xt =

fj xt−j + εt θj εt−j .

(14.67)

=1

j =1

 

Например,модель ARIMA(1, 1, 1),

(1 − ϕ1L)(1 − L)xt = (1 − θ1L)εt ,

можно записать в виде:

xt = (1 + ϕ1)xt−1 − ϕ1xt−2 + εt − θ1εt−1 = f1xt−1 + f2xt−2 + εt − θ1εt−1,

где f1 = 1 + ϕ1, f2 = −ϕ1.

При расчетах можно использовать те же приемы,что и выше для ARMA. Некоторую сложность представляет интерпретация ARIMA(p, d, q) в виде модели линейного фильтра,поскольку ряд модулей коэффициентов такого разложения является расходящимся.Однако это только технические сложности обоснования формул(в которые мы не будем вдаваться),а сами формулы фактически не меняются.

Таким образом,отвлекаясь от технических тонкостей,можем записать

ARIMA(p, d, q) в виде MA(∞):

x

 

=

θ(L)

ε

 

= ε + ψ ε

+ ψ ε

+ . . . = ψ(L)ε .

(14.68)

 

 

 

 

t

 

f(L)

t

t 1 t−1

2 t−2

t

 

Функцию реакции на импульсы можно рассчитать по рекуррентной формуле

 

p+d

 

ψi =

j!

(14.69)

fj ψi−j − θi,

 

=1

 

14.8.Прогнозирование по модели БоксаÑДженкинса

481

где ψ0 = 1, ψi = 0 при i < 0 и θi = 0 при i > q.

Кроме того,прогнозы xt(τ ) можно вычислять по рекуррентной формуле,которая получается из(14.67)по аналогии с(14.65):

p+d

q

 

j!

!

 

xt (τ ) = xøt+τ =

fj xøt+τ −j + εøt+τ θj εøt+τ −j ,

(14.70)

=1

j =1

 

где условные математические ожидания xøt+i = E[xt+it ] и εøt+i = E[εt+i t] рассчитываются по тому же принципу,что и в(14.65).

Таким образом,для прогнозирования в модели

ARIMA можно использовать

формулы(14.70), (14.8)и(14.66),где коэффициенты

ψi рассчитываются в соот-

ветствии с(14.69).

 

Альтернативный подход к прогнозированию в модели ARIMA(p, d, q) состоит в том,чтобы сначала провести необходимые вычисления для wt = (1 − L)d xt , т.е.процесса ARMA(p, q),который лежит в основе прогнозируемого процесса ARIMA(p, d, q),апотомнаихосновеполучитьсоответствующиепоказателидля xt .

Так, (14.70)можно записать в виде

E[f(L)xt+τ t] = E[ϕ(L)(1 − L)d xt+τ t ] = E[θ(L)εt+τ t],

 

т.е.

 

 

 

 

 

 

 

 

E[ϕ(L)wt+τ t ] = E[θ(L)εt+τ t]

 

или

 

 

 

 

 

 

 

 

ϕ(L)wøt+τ = θ(L)øεt+τ .

 

Здесь по аналогии wøt+i = E[wt+it ],причем

t+i = wt(i) (равно прогнозу)при

i > 0 и wøt+i = wt+i (равно значению самого ряда)при i ! 0.

 

Отсюда видно,что можно получить сначала прогнозы для процесса wt

по фор-

мулам(14.65),заменив

xt на wt ,а затем применить к полученным прогнозам

оператор Sd = (1 − L)−d ,т.е.попросту говоря,просуммировать такой ряд

d раз,

добавляя каждый раз нужную константу суммирования.В частности,при

d = 1

получаем

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

j!

 

 

 

 

 

xt (i) = xt +

wt (j).

 

 

 

 

=0

 

 

Далее, ψ(L) можно записать в виде

 

 

 

θ(L)

 

θ(L)

 

 

ψ(L) =

 

 

= (1 − L)−d

 

= (1 − L)−d ψw (L) = Sdψw (L).

 

f(L)

ϕ(L)

 

Соседние файлы в папке Диплом