
Диагностика оцененной модели
После выбора типа и оценивания коэффициентов модели производится диагностика оцененной модели, т.е. выяснение того, насколько хорошо модель соответствует данным наблюдений (адекватна данным наблюдений) – это является третьим этапом процедуры подбора модели.
Для целей диагностики можно использовать целый ряд различных статистических процедур, которые направлены в основном на проверку гипотезы H0 о том, что в модели, порождающей наблюдения, последовательность εt действительно образует процесс белого шума.
Пусть мы остановили свой выбор на этапе идентификации на модели ARMA(p, q)
a(L) Xt = b(L) εt ,
т.е.
Xt = a1 Xt–1 + … + ap Xt–p + εt + b1 εt–1 + … + bq εt–q ,
и на втором этапе оценили ее как
,
где
,
.
Если MA составляющая модели ARMA(p, q) обратима, то тогда
Xt
,
и оценки для εt
теоретически
можно получить заменой a(L)
и b(L)
на
и
,
соответственно:
.
На практике, конечно, мы можем использовать эту формулу лишь частично, поскольку бесконечный ряд в правой части приходится обрывать из-за наличия только конечного количества наблюдений.
При большом количестве
наблюдений поведение
должно имитировать
поведение самих εt
. Cледовательно,
если ошибки εt
образуют процесс
белого шума, то остатки должны имитировать
процесс белого шума.
Основываясь на этом соображении,
было предложено исследовать статистическую
значимость выборочных автокорреляций
для
ряда оцененных инноваций
и суммы их
квадратов
(Q-статистика
Бокса – Пирса).
Если модель правильно специфицирована, то QBP имеет распределение, которое близко к распределению χ2(M – p – q), при условии, что T и M велики, а отношение (M/T) мало. Гипотеза адекватности подобранной модели отвергается, если
QBP > χ20.95(M – p – q).
Однако впоследствии было замечено, что при конечных T распределение статистики QBP может существенно отличаться от распределения χ2(M – p – q). Лучшую аппроксимацию дает Q-статистика Люнга – Бокса
,
которая имеет то же асимптотическое распределение χ2(M – p – q), что и QBP , но зато при конечных T распределение статистики QLB гораздо ближе к χ2(M – p – q), чем распределение статистики QBP . При этом качество приближения ухудшается, если значения параметров находятся вблизи границы стационарности или обратимости модели; особенно это заметно при малых M .
Хотя первоначально вывод асимптотического распределения статистики Люнга – Бокса производился в предположении, что εt – гауссовский белый шум, в дальнейшем было установлено, что этот критерий достаточно устойчив к отклонениям распределения εt от нормального. Важно только, чтобы была конечной дисперсия D(εt). Последнее условие часто нарушается для рядов, описывающих эволюцию быстро изменяющихся финансовых показателей – цен на акции, биржевых индексов, обменных курсов. Для таких рядов εt обычно имеет распределение с “тяжелыми” хвостами (heavy-tailed distribution), т.е достаточно часто наблюдаются большие по абсолютной величине значения εt . И это требует привлечения для описания таких рядов более сложных моделей.
В пакете EVIEWS в распечатке результатов оценивания моделей ARMA рядом с коррелограммой ряда остатков приводятся P-значения для наблюдаемых значений Q–статистики Люнга – Бокса.
Проверка предположения о нормальности
Многие статистические
процедуры, используемые при анализе
временных рядов, опираются на предположение
гауссовости (нормальности) анализируемого
ряда. Последнее означает, что для любого
набора t1,
…, tn
случайные величины
имеют совместное
нормальное распределение.
Имея в распоряжении одну единственную реализацию временного ряда, просто невозможно проверить справедливость такого утверждения. В то же время, еще возможно проверить гипотезу о нормальности одномерного (маргинального) распределения стационарного временного ряда. Соответствующая процедура была предложена в работе Ломницкого [Lomnicki Z.A. “Tests for Departure from Normality in the Case of Linear Stochastic Processes”, Metrika, 1961, №4, p. 37–62].
Пусть
,
.
В указанной работе было доказано, что если Xt – стационарный гауссовский временной ряд, то при больших T статистики G1 и G2 имеют приближенно нормальные распределения с нулевыми математическими ожиданиями и дисперсиями
Оценить эти дисперсии можно,
заменив бесконечные суммы степеней
автокорреляций ρ(k)
конечными суммами степеней выборочных
автокорреляций r(k).
Используя такие оценки
получаем статистики
,
которые при гипотезе нормальности имеют распределения, аппроксимируемые стандартным нормальным распределением. Поскольку последние статистики еще и асимптотически независимы, то при T → ∞
Моделирование показывает,
однако, что при умеренных значениях T
распределение
статистики
плохо приближается нормальным
распределением. Более того, процедура
проверки здесь весьма общая (структура
временного ряда не специфицируется).
Поэтому критерий нормальности, основанный
на статистике
,
имеет довольно низкую мощность при
применении его к моделям AR
и MA, т.е. слишком часто не
отвергает гипотезу нормальности ряда
Xt ,
когда она не верна.
Более подходящей является в
этом отношении аналогичная процедура,
применяемая не к самому ряду Xt
, а к остаткам
,
полученным при оценивании специфицированной
модели ряда Xt
. В стационарных и
обратимых моделях ARMA
остатки
состоятельно оценивают инновации
εt ,
которые, в предположении нормальности,
являются независимыми, одинаково
распределенными случайными величинами,
имеющими распределение N(0, σ2).
Поэтому при применении метода Ломницкого
для проверки предположения о нормальности
инноваций, мы получаем:
(т.к. для ряда инноваций ρ(k) = 0 при k ≠ 0), причем при построении статистик G1 и G2 вместо
используются
.
Соответственно,
так что
,
а это есть статистика, используемая для проверки нормальности в популярном критерии Харке – Бера [Jarque C., A. Bera “Efficient Tests for Normality, Homoskedasticity, and Serial Independence of Regression Residuals”, Economics Letters, 1980, №6, p. 255–259].
Таким образом, критерий Харке – Бера можно использовать не только в рамках классической модели регрессии (с фиксированными значениями объясняющих переменных), но и для проверки нормальности инноваций в моделях временных рядов, помня, конечно, о том, что это всего лишь асимптотический критерий. Для улучшения приближения статистики критерия распределением хи-квадрат, в пакете EVIEWS в статистике критерия вместо множителя T используется множитель (T– K), где K – количество коэффициентов, оцениваемых при построении модели исследуемого ряда.
Правда, здесь мы не заметили еще одного ”подводного камня”. Мы предполагали неявно, что остатки берутся как результат оценивания правильно идентифицированной модели. Как будет влиять на свойства критерия неправильное определение порядка модели?
При больших T критерий Шварца достаточно надежно определяет порядок (p, q) модели ARMA, так что проверка нормальности инноваций по модели, выбранной критерием Шварца, асимптотически равносильна проверке нормальности инноваций по правильно идентифицированной модели.
На третьем шаге производят также проверку выбранной модели на “оптимальность”, имея в виду, что “более сложные” модели не должны существенно отличаться от подобранной модели. Точнее говоря, при увеличении порядка модели оценки коэффициентов при добавленных составляющих должны быть статистически незначимыми, а оценки коэффициентов при сохраняемых составляющих должны изменяться не очень существенно.
Замечание 1.2.1
При построении статистики
Харке – Бера
для проверки нормальности инноваций в
модели ARMA существенным
является центрирование
остатков, полученных
в результате оценивания модели, т.е.
вычитание из каждого остатка
среднего
всех полученнных
остатков.
При оценивании модели линейной
регрессии методом наименьших квадратов
сумма полученных остатков равна нулю,
так что остатки автоматически являются
центрированными. Поскольку же при
оценивании ARMA моделей
приходится привлекать метод максимального
правдоподобия, получаемые остатки не
обязательно являются центрированными,
и надо позаботиться об их центрировании.
В противном случае статистика Харке – Бера
уже не имеет асимптотического распределения
.