Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ARIMA_instructions_2014.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
1.61 Mб
Скачать

1. 2. Організація даних для побудови arima-моделей

1. 2.1. Які дані можна використовувати для аналізу?

При використанні даних для ARIMA-моделювання існують два основних обмеження. Перше обмеження є теоретичним і стосується стаціонарності часового ряду, оскільки ARIMA моделі можуть будуватись тільки для стаціонарних часових рядів. Звичайно, не всі часові ряди на практиці є стаціонарними, але шляхом операції різниць різних порядків, або інших перетворень, наприклад шляхом логарифмування, вони можуть стати придатними для ARIMA-моделювання. Наприклад на наведеному нижче графіку (див. рис.1.1.) відтворено динаміку квартальних значень монетарного агрегату М3 для України з 1996 до 2006 року (дані НБУ, млн. грн.).

Рис.1.1. Динаміка монетарного агрегату М3 за 1996 - 2006 роки

Як можна побачити з рисунку дані зростають подібно до експоненційної функції. Перші та другі різниці такого ряду не є стаціонарним рядом. Втім, логарифмування ряду дозволяє експоненційний тренд в даних зробити лінійним, і перші різниці ряду стають стаціонарним рядом, відповідно, ARIMA-модель можна будувати на логарифмах перших різниць такого ряду.

Друге обмеження є технічним і скоріше стосується правильної організації даних. Так наприклад, для спрощення імпортування часових рядів даних в пакет E.VIEWS їх слід правильно підготувати. Бажано, щоб у значень змінних десятковим розділювачем була крапка, дані йшли суцільним стовпцем (або рядком) – без проміжних підсумків (типу: загалом за квартал, рік тощо). Бажано використовувати файл даних у форматі .xls, .csv, .txt, і перед імпортуванням переконатися що він не містить кириличних символів. Зауважимо, що пакет E.VIEWS також підтримує і деякі інші менш поширені формати баз даних, які в даному посібнику не розглядаються.

Нарешті, слід пам’ятати що ARIMA аналіз пов’язаний лише з аналізом часових рядів, для яких необхідно знати: хронологічні межі ряду; одиницю виміру; регулярність ( чи виміряні дані через однакові проміжки часу); частоту вимірів (періодичність).

1. 2. 2. Як створити робочий файл в e.Views та імпортувати або копіювати в нього дані?

Перед імпортом даних в пакет E.Views слід створити робочий файл, виділивши в головному меню послідовно: File>New>Workfile. Відкриється вікно робочого файлу (рис.1. 2)

Рис. 1.2. Вікно для створення робочого файлу в E.Views

У вікні, що відкривається, слід вказати тип даних (вхідної інформації) для побудови моделі. У випадку одного часового ряду можливі два варіанти: структуровані (регулярні) та неструктуровані (нерегулярні) дані.

Опцію: Unstructured/undated (неструктуровані/недатовані) – слід обрати, якщо дані для побудови моделі є, наприклад, щоденними (з великою кількістю вихідних протягом певного тижня, або періоду часу, що змінює їх періодичність), або щохвилинними (характерно для біржових показників), або неперіодичними. В такому разі ряд ефективно індексувати просто за номером спостереження. Звичайно, в разі необхідності, можна створити окремий ряд даних з датами у форматі РРРР/ММ/ДД, а потім процедурою Proc>Structure/Resize Current page головного меню програми (зауважимо, що у кожного вікна в програмі теж є меню, яке ми зватимемо меню вікна) можна задати необхідні дати для введених спостережень.

Опцію: Dated – regular frequency (регулярні дані), слід обрати у випадку, коли дані виміряні через однакові проміжки часу, наприклад, рік, квартал, місяць, тиждень, день тощо (див. рис.1.3). Зауважимо, що пакет E.Views надає дві можливості організації щоденних даних з 5-денним та 7–денним робочими тижнями.1

Рис. 1.3. Специфікація даних в пакеті E.Views.

В створеному робочому файлі має бути вказано кількість спостережень, яку необхідно імпортувати ( можна вказати і більшу кількість).

В умовах розглядаємого прикладу, для організації даних (нагадаємо, що вхідна інформація містить щомісячні дані по реальному ефективному курсу Євро з січня 2000 до червня 2008 року у відсотках та припускаємо, що вводити ми її будемо з таблиці Excel, файл REER.xls) обираємо опцію: Monthly, оскільки дані є щомісячними ( фактичні дані наведено в Додатку 1_A, таблиця 1_A, часовий ряд REER)). Поля стосовно початку і кінця інтервалу заповнюються таким чином:

Start date: 2000m1 або ( 2000:1)

End date: 2008m06 або (2008:6)

Примітка: В EViews використовуються різні розділювачі для виокремлення номеру кварталу, місяця чи півріччя. Наприклад: запис 2000m2 означає: лютий 2000 року, 1999q4 – четвертий квартал 1999 року, 2003s2 – друге півріччя 2003 року. Якщо тип періодичності вже заданий, можна використовувати універсальний розділювач двокрапку “ : ”, тобто 2000:2, 1999:4, 2003:2. Треба бути уважним, так наприклад, для квартальних даних введення 1999:5 видасть помилку, а для щомісячних інтерпретуватиметься як травень відповідного року.

Після задання типу даних, а також дат початку та кінця спостережень, можна здійснювати безпосереднє введення даних в робочий файл двома способами: шляхом імпортування або простого копіювання даних. Прокоментуємо кожний з них детальніше.

Введення даних в робочий файл (спосіб 1). Імпортування.

Якщо необхідні для розрахунків статистичні дані організовані в форматі .xls, .txt, .dat, .csv та подібних, їх можна безпосередньо імпортувати в робочий файл. Для цього почергово обираємо в головному меню: File>Import>Read Text-Lotus-Excel. У списку знизу можна обрати або ASCII – файли, які можуть бути з різними розширеннями ( в тому числі дану опцію використовують для файлів з розширенням: CSV, PRN, DAT тощо), або XLS –файли для імпорту таблиць Excel. Зауважимо, що вибір ASCII файлів не є поширеним для фінансових статистичних рядів, однак розглянемо і таку можливість (на випадок роботи з базами так званих «сирих (необроблених) даних», наприклад, з бухгалтерських програм чи опитувань). При виборі даної опції відкриється вікно, зображене на рис.1.4

Рис. 1.4. Вікно імпортування даних в форматі ASCII.

У даному вікні у відповідних елементах можна задати розділювач або кілька розділювачів (у даному випадку, задано кому), кількість колонок чи рядків для пропуску, кількість рядків заголовків. Якщо заголовки присутні у файлі, у лівому верхньому полі слід лише вказати кількість рядів даних для імпорту, і програма сама зчитає назви заголовків. Крім того, необхідно відмітити чи дані організовані як рядки, чи колонки. Якщо файл не містить назв часових рядів, їх можна вписати у те саме поле розділивши пробілами, по порядку. Також слід звернути увагу на вікно Import sample, в якому задається часовий інтервал для імпортованих даних. Наприклад, дана ілюстрація вікна містить варіант неправильного імпорту – імпортуються погодинні дані, а відрізок вказаний для квартальних даних іншого часового проміжку. Тому потрібно бути дуже уважними, особливо при роботі з кількома робочими файлами одночасно.

Імпорт даних з Excel – таблиць ( опція : XLS) є найбільш поширеним на практиці. Вибір даної опції здійснюється послідовністю команд: File>Import>Read Text-Lotus-Excel, після чого обирається безпосередньо файл(Excel) в якому знаходяться дані, які необхідно імпортувати, як показано на рис.1.5.

Рис. 1. 5. Вікно для вибору файлу, в якому знаходяться дані, підготовані для імпорту

Після виділення необхідного файлу та натискання клавіши „Open”, відкриється вікно, яке зображено на рис.1.6.

Рис. 1. 6. Вікно імпортування даних в форматі XLS.

У даному вікні задаються атрибути аналогічно розглянутому вище випадку імпорту даних в форматі ASCII. Слід звернути увагу на те, що програма автоматично не визначає верхню ліву клітинку даних у файлі, тому слід її задати. ЗАДАВАТИ ТРЕБА КЛІТИНКУ В ЯКІЙ ПОЧИНАЮТЬСЯ БЕЗПОСЕРЕДНЬО ДАНІ! Якщо задати клітинку в якій ще йдуть заголовки, програма їх не розпізнає.

Якщо заголовки присутні у файлі, в опції : Names for series or Numbers if named in file, слід лише вказати кількість колонок (рядів) даних для імпорту, і програма сама зчитає назви заголовків. Якщо файл не містить назв часових рядів, їх можна вписати у те саме поле розділивши пробілами, по порядку. Крім того, необхідно відмітити чи дані організовані як рядки, чи колонки в опції: Data orders.

Переваги імпортування даних є особливо відчутними, якщо обсяг файлу дуже великий. Крім того, це найкращий спосіб введення даних з екзотичних текстових форматів (які часто зустрічаються в базах даних бухгалтерських програм таких як Peachtree – широко поширеній на Заході бухгалтерській програмі).

Недоліком імпортування даних є те, що попри велику кількість налаштувань, користувач не отримує повного контролю над тим як читаються дані, і тому з першого разу дані можуть бути імпортовані неякісно, з великою кількістю «невизначених» (NA) спостережень. В таких випадках необхідно уважно проаналізувати причину неякісного імпорту, виявити проблему та повторити процедуру вводу даних ще раз.

ВАЖЛИВО запам’ятати: файл, який імпортується, слід перед імпортом закрити в усіх інших програмах.

Введення даних в робочий файл (спосіб 2). Копіювання.

Копіювання даних здійснюється безпосередньо у робочий файл. Для цього слід активувати вікно готового робочого файлу і послідовно обрати в головному меню опції: Quick>Empty Group (Edit Series). В таблицю, що відкриється вставити скопійовані дані з будь-якого табличного редактора, виконавши перед тим процедуру копіювання (Ctrl+C), наприклад з Excel-файлу та вставки (Ctrl+V) в відкриту робочу таблицю E.Views файлу. Звичайно, перед копіюванням слід переконатися, що ряди даних розміщені в колонках, вони не містять кириличних символів тощо. На рисунку 1.7 зображено вікно з вже вставленими даними, після копіювання.

ВАЖЛИВО запам’ятати: щоб одночасно перенести скопійовані дані і заголовки, слід виділити будь-яку верхню клітинку таблиці E.Views файла і натиснути на клавіатурі стрілочку «вгору». Тоді вставляються дані з заголовками, так як рядок заголовків теж стає придатним для редагування (див. Рис. 1.7):

Рис. 1.7. Вікно E.Views файла зі скопійованими даними та заголовками.

Зауважимо, що якщо у ряді даних присутній текст або інші нецифрові записи, такий ряд розпізнається програмою не як ряд даних, а як об’єкт “alpha” – набір текстових рядків. В такому випадку слід виправити дані, видалити такий окремий ряд (об’єкт) (не з таблиці об’єкту «group» як на рисунку, а з робочого файлу) і скопіювати дані наново.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]