
- •Тема 1-3. Arima – моделі: практика побудови із використанням програмного пакту e.Views.6.0. Детальні інструкції побудови arima моделі на прикладі реального часового ряду. Вступ.
- •1.1. В яких випадках доцільно використовувати arima-моделі на практиці?
- •1. 2. Організація даних для побудови arima-моделей
- •1. 2.1. Які дані можна використовувати для аналізу?
- •1. 2. 2. Як створити робочий файл в e.Views та імпортувати або копіювати в нього дані?
- •1. 2. 3. Як провести первинний статистичний аналіз даних?
- •1.3. Перевірка часового ряду на стаціонарність. Визначення порядку інтеграції.
- •1.3.1. Перевірка часового ряду на стаціонарність. Перетворення нестаціонарного часового ряду в стаціонарний.
- •1. 3. 2. Проблема сезонності в часових рядах
- •1.4. Ідентифікація arima-моделі.
- •1.4.1. Як визначити значимі лаги для побудови моделі?
- •1.4. 2. Як знайти найкращу специфікацію для arima-моделі (визначити оптимальний порядок ar та ма- складових)?
- •1.5. Остаточне оцінювання arima моделі та її перевірка на адекватність.
- •1.5.1. Як переоцінити та перевірити модель на адекватність?
- •1.6. Прогнозування на основі побудованої arima- моделі.
- •1.6.1. Розрахунок прогнозних значень на основі побудованої моделі
- •1.6.2. Як побудувати інтервали довіри для прогнозу?
1.4. Ідентифікація arima-моделі.
1.4.1. Як визначити значимі лаги для побудови моделі?
Для попереднього визначення загального вигляду специфікації майбутньої ARIMA -моделі і кількості лагів для кожної складової скористаємося графіками автокореляційної і часткової автокореляційної функції досліджуваного показника, для нашого прикладу реального ефективного обмінного курсу в перших різницях (нагадаємо, що саме в перших різницях ряд є стаціонарним). Зауважимо, що візуальний аналіз ACF/PACF дозволяє зробити висновок чи можна вважати часовий ряд чистим AR або МА процесом, чи він є змішаним ARMA процесом. В випадку чистих процесів аналіз графіків ACF/PACF функцій дозволяє зробити попередній висновок про максимально можливу кількість лагів. В випадку змішаного процесу необхідно застосовувати спеціальні процедури ідентифікації, зокрема процедуру Хеннона-Ріссанена. Основні властивості графіків ACF та PACF функцій для MA, AR та ARMA процесів наведено в таблиці 1.1.
Таблиця 1.1. Властивості ACF та PACF функцій для MA, AR та ARMA процесів
Процеси |
Поведінка ACF |
Поведінка PACF |
AR(p).
|
Нескінченно зменшується до нуля |
Скінченний: дорівнює нулю після лагу p. Максимальний порядок процесу – останній ненульовий лаг в PACF (р) |
MA(q)
|
Скінченний: дорівнює нулю після лагу q. Максимальний порядок процесу – останній ненульовий лаг в ACF(q) |
Нескінченно зменшується до нуля |
ARMA(p,q) |
Нескінченно зменшується до нуля Максимальні порядки (р,q) процесу визначаються за спеціальними процедурами |
Нескінченно зменшується до нуля Максимальні порядки (р,q) процесу визначаються за спеціальними процедурами |
Отже, для попереднього можливого визначення типу процесу та кількості лагів для включення в модель, повернемось знову до графіку автокореляційної і часткової автокореляційної функції перших різниць реального обмінного курсу (нагадаємо, що отримати його можна задавши послідовність команд: View>Correlorgam). Вигляд графіку наведено на рис.1.16 ( див. також аналогічний рис.1.13)
Рис. 1.16. Графік корелограм ряду REER в перших різницях.
Аналіз наведеного рисунку показує, що в даному випадку значимим ( відмінним від нуля) є 7-й лаг, а також, можливо, 32-й (що цілком імовірно враховуючи «велику хвилю» майже трирічної циклічності показника, за візуальним аналізом графіка). Крім того, аналіз поведінки ACF/PACF свідчить про змішаний характер процесу, отже для виявлення порядків AR та MA складової необхідно застосовувати спеціальні процедури.
Примітка. Якщо автокореляції виявляють сезонний характер, слід спробувати застосувати сезонну компоненту в рівнянні. Особливість введення такої компоненти в модель буде пояснено далі.
1.4. 2. Як знайти найкращу специфікацію для arima-моделі (визначити оптимальний порядок ar та ма- складових)?
Якщо процес не є чистим авторегресійним процесом або процесом ковзного середнього, слід визначити порядок AR та MA складових, наприклад за допомогою процедури Хеннона-Ріссанена, яку розглянемо детальніше.
Згідно даної процедури, спочатку оцінюється AR- складова ARMA/ARIMA моделі звичайним методом найменших квадратів. При цьому, оптимальними лагами для включення в модель вважаються такі, при яких досягається мінімальне значення Акайк- інформаційного критерію (AIC).
Процедуру
починають з послідовного оцінювання
AR- моделей різного порядку, починаючи
з першого, наприклад AR(1), AR(2),…,AR(k). Для
кожної з даних моделей аналізується
значення AIC –критерію (зауважимо, що в
пакеті E.Views даний критерій розраховується
автоматично і надається в вихідній
інформації). Оптимальним вважається
таке значення лагу, наприклад
при
якому досягається найменше значення
Акайк-критерію.
Примітка 1. Зауважимо, що, в випадку, коли таких лагів-кандидатів декілька, або є сумніви щодо остаточного вибору лагу, можна додатково застосувати таку процедуру:
1. Першою оцінити регресію, в яку включити максимально можливу кількість лагів. Проаналізувати значення AIC-критерію для даної моделі.
2. Видалити з оціненої регресії лаг з найбільшим значенням p-value для відповідного коефіцієнта і порівняти отримане значення АІС – критерію з попереднім значенням.
3. Якщо АІС став меншим, повторити процедуру з наступним лагом. Якщо значення АІС- критерію зросло, вернути виключену на попередньому кроці лагову змінну в рівняння і виключити змінну з лагом, для якого p-value є наступним за величиною;
4. Продовжувати процедуру до моменту, коли будь-який виключений лаг збільшуватиме значення АІС.
Примітка 2. Початкове рівняння може включати не тільки одну лагову змінну, а декілька, зокрема це можуть бути ті лагові змінні, які є статистично значимими в графіках автокорелограму.
Зауважимо, що для нашого прикладу, в початкове рівняння AR-складової було введено 7-й та 32-й лаги як статистично значимі, а потім по черзі включались додатково 1-й, 2-й і т.д. лаги, що допомогло значно скоротити процес відбору. Крім того, використовувалась процедура, описана в примітці 1.
Для оцінки першого рівняння AR-складової (а також всіх наступних) необхідно послідовно обрати в головному меню Quick/Estimate equation. Після чого відкриється вікно, в якому потрібно записати специфікацію рівняння в форматі E.Views( див. рис.1. 17)
Рис. 1.17. Вікно для оцінки початкового рівняння для визначення оптимального порядку AR-складової моделі ARMA/ARIMA.
Результати оцінювання даного рівняння наведено в таблиці 1.2.
Таблиця 1.2. Результати оцінювання початкового рівняння для визначення оптимального порядку AR-складової моделі ARMA/ARIMA.
Як можна побачити з таблиці 1.2, значення AIC- критерію ( інформаційного Акайк-критерію) дорівнює 3.822983. Зауважимо, для оцінювання нового рівняння, не обов’язково його записувати заново, можна відредагувати старе, скориставшись підопцією меню даного вікна: Estimate. Натиснувши на кнопку Estimate, ми маємо можливість відредагувати рівняння, що оцінюється, додавши, замінивши або видаливши з нього будь-яку змінну.
Результати оцінювання послідовності моделей AR-складових з відповідними значеннями Акайк-критерію наведено в Додатку 1_A.
Проведена послідовна оцінка AR- складових показала, що мінімальне значення AIC- критерію, яке дорівнювало 3.777527948 було досягнуто для специфікації загального вигляду:
, (1.1)
або в більш стандартному вигляді:
, (1.2)
де
-
перші різниці ефективного реального
обмінного курсу в t-період
часу.
Результати оцінювання AR- складової з мінімальним значенням Акайк-критерію наведено в таблиці 1.3.
Таблиця 1.3. Результати оцінювання AR- складової моделі ARMA/ARIMA з мінімальним значенням Акайк-критерію.
Після визначення оптимальної AR- складової, необхідно утворити ряд залишків даної моделі для наступного використання при визначені оптимального порядку MA-складової моделі ARMA/ARIMA. Для цього, в вікні регресії необхідно послідовною серією команд: Proc>Make residual series створюємо ряд залишків з ім’ям RESIDS_TMP.
Отже, після того, як визначено оптимальний порядок (лаг) AR-складової, необхідно оптимізувати лаги МА-частини. У рівнянні з оптимальною комбінацією лагів авторегресії слід виділити ряд залишків (для нашого прикладу, RESIDS_TMP). Процедура пошуку оптимального порядку MA- складової моделі ARMA/ARIMA аналогічна процедурі визначення оптимального порядку AR-складової, лише за винятком того, що на даному етапі до визначеної AR-складової поступово додають MA(1), МА(2),...., MA(q) складові і розраховують значення Шварца (Schwarz) – критерію. Модель, яка має найменше значення Шварц-критерію вважається претендентом для подальшого аналізу.
Зауважимо, що фактично оцінюється послідовність моделей загального вигляду: оптимальна AR-складова + лагові значення залишків, попередньо отримані для даної складової, наприклад: D(REER) C D(REER(-6)) D(REER(-7)) D(REER(-32) RESIDS_TMP (-1) (специфікація надається в форматі E.Views).
Мінімальне значення критерію Шварца, яке дорівнює 3.312357838, досягається для такої загальної специфікації моделі в форматі E.Views:
d(reer) c d(reer(-7)) d(reer(-6)) d(reer(-32)) resids_tmp(-5) resids_tmp(-7) resids_tmp(-32).
Результати розрахунків за даною моделлю на реальній інформації наведено в таблиці 1.4. Специфікація інших послідовно оцінених моделей з відповідними значеннями Шварц-критерію наведено в Додатку 1_А ( таблиця А2).
Таблиця 1.4. Результати розрахунків ARIMA моделі з мінімальним значенням Шварц –критерію