- •Анализ динамики исходного временного ряда
- •Гипотеза о равенстве дисперсий.
- •Графический анализ.
- •Проверка ряда на случайность.
- •Расчет критерия по тесту Бокса-Пирса.
- •Метод экспоненциального сглаживания (модель Брауна).
- •Этап 4. Сглаживание временного ряда с использованием модели тренда. Выделение тренда в исходном ряде.
- •Проверка ряда на стационарность. Выявление Тренда.
- •Выявление сезонной составляющей.
- •Выявления сезонности
- •Этап 5. Моделирование временного ряда применяя методологию Бокса-Дженкинса.
- •Этап 6. Выбор лучшей модели прогноза.
- •Этап 7. Построение прогноза по полученной модели.
- •Этап 8. Спектральный анализ временного ряда. Оценка сезонных колебаний. Оценка точности прогнозирования уровня показателя.
- •1. Обнаружение и идентификация тренда Гипотеза о равенстве дисперсий.
- •Гипотеза о равенстве средних.
- •2. Идентификация систематической составляющей в ряду.
- •Прогноз с интервалами:
Этап 6. Выбор лучшей модели прогноза.
Составим таблицу сравнения наилучших моделей:
Модель |
RMSE для всей выборки |
RMSE для тестовой выборки |
Модель Брауна α=0,7245 |
17,6348 |
0,24451 |
ARIMA (2,0,2) с константой |
16,4457 |
0,213783 |
Таким образом, наилучшей моделью является ARIMA модель (2,0,2) c константой.Обе среднеквадратические ошибки данной модели меньше, чем для модели Брауна.
Этап 7. Построение прогноза по полученной модели.
Построим прогноз на следующий период по полученной модели:
|
|
Lower 95,0% |
Upper 95,0% |
Period |
Forecast |
Limit |
Limit |
61,0 |
136,859 |
86,3597 |
187,358 |
Этап 8. Спектральный анализ временного ряда. Оценка сезонных колебаний. Оценка точности прогнозирования уровня показателя.
Цель спектрального анализа – разложение дисперсии временного ряда по частотам для определения существенных гармонических составляющих стационарного процесса.
Спектр – это функция распределения амплитуд процесса по соответствующим частотам.
На данном этапе необходимо оценить временной ряд «Индекса промышленного производства
Исходя из графика, можно сказать, что тренда (зависимости показателя от времени) нет и есть сезонность. Проверим данное предположение с помощью гипотез.
1. Обнаружение и идентификация тренда Гипотеза о равенстве дисперсий.
Так же воспользуемся Statgraphics:
|
1/2 |
1/2 |
Standard deviation |
6,11699 |
5,9964 |
Sample sizes |
56 |
57 |
Null Hypothesis: ratio of variances = 1,0 Alternative: not equal Computed F statistic = 1,04063 P-Value = 0,880933 Do not reject the null hypothesis for alpha = 0,05.
|
||
На основе, данных полученных при использование Statgraphics можно сделать вывод, что нулевая гипотеза о равенстве дисперсий принимается.
Гипотеза о равенстве средних.
Делим исходные данные на 2 равные части и проверим о гипотезу, о равенстве их средних, воспользовавшись Statgraphics:
Sample means |
100,425 |
100,207 |
Sample standard deviations |
6,11699 |
5,9964 |
Sample sizes |
56 |
57 |
Null Hypothesis: difference between means = 0,0 Alternative: not equal Computed t statistic = 0,191307 P-Value = 0,848635 Do not reject the null hypothesis for alpha = 0,05.
|
||
Из результатов, полученных в Statgraphics можно сделать вывод о том, что нулевая гипотеза о равенстве средних двух реализаций подтверждается. Таким образом, можно сделать вывод об отсутствии тенденции.
2. Идентификация систематической составляющей в ряду.
Цель спектрального анализа – разложить дисперсию временного ряда по частотам для определения существенных гармоник.
Пара функций:
, называется гармоникой.
Общий вид оцениваемой регрессии на тригонометрические функции имеет вид:
Для начала определим m (предполагаемый период изменений):
Анализируя представленный выше рисунок, можно сделать предположение, что m=12. Данное предположение подтверждает изучение распределения значений спектра рады, представленное на Периодограмме и в таблице.
2013 год в выборке представлен не полностью, а только 5 месяцами. Чтобы не искажать этим картину, необходимо убрать последние 5 значений из выборки и перестроить периодограмму.
|
|
|
|
Cumulative |
Integrated |
i |
Frequency |
Period |
Ordinate |
Sum |
Periodogram |
0 |
0,0 |
|
4,36209E-26 |
4,36209E-26 |
1,14131E-29 |
1 |
0,00925926 |
108,0 |
1,0258 |
1,0258 |
0,000268393 |
2 |
0,0185185 |
54,0 |
10,3149 |
11,3407 |
0,00296722 |
… |
|||||
17 |
0,157407 |
6,35294 |
7,71775 |
151,867 |
0,0397348 |
18 |
0,166667 |
6,0 |
252,339 |
404,206 |
0,105757 |
19 |
0,175926 |
5,68421 |
11,8434 |
416,049 |
0,108856 |
… |
|||||
26 |
0,240741 |
4,15385 |
0,13799 |
535,622 |
0,140142 |
27 |
0,25 |
4,0 |
974,143 |
1509,76 |
0,395019 |
28 |
0,259259 |
3,85714 |
14,4301 |
1524,19 |
0,398794 |
… |
|||||
35 |
0,324074 |
3,08571 |
42,9348 |
1599,76 |
0,418565 |
36 |
0,333333 |
3,0 |
1147,42 |
2747,18 |
0,718781 |
37 |
0,342593 |
2,91892 |
2,04179 |
2749,23 |
0,719315 |
… |
|||||
45 |
0,416667 |
2,4 |
659,713 |
3502,84 |
0,916493 |
46 |
0,425926 |
2,34783 |
15,7478 |
3518,59 |
0,920613 |
… |
|||||
53 |
0,490741 |
2,03774 |
57,1675 |
3734,89 |
0,977206 |
54 |
0,5 |
2,0 |
87,1204 |
3822,01 |
1,0 |
Как
видно на периодограмме и соответствующей
таблице в приложение самому наибольшему
колебанию соответствует период в
,
т.е. период получается длиной ровно 3
месяца.
m = |
3 |
n = |
108 |
h = |
36 |
j = |
1,5 |
Воспользовавшись методом НМК, получаем следующие параметры модели и их значимость по t-статистике:
|
100,3778 |
|
|
210,1392 |
значим |
|
100,3778 |
a = |
4,080556 |
|
tрасч = |
6,040513 |
значим |
a (зн.) = |
4,080556 |
|
-2,14421 |
|
|
-3,17412 |
значим |
|
-2,14421 |
|
0,898148 |
|
|
1,880258 |
незначим |
|
0 |
|
|
|
tкрит = |
1,983 |
|
|
|
Проверка значимости коэффициентов по гармоникам:
Параметр |
j=0 |
j=1 |
j=1,5 |
|
a2j-1 |
100,38 |
4,08 |
0,9 |
cos |
a2j |
|
-2,14 |
|
sin |
tрасч a2j-1 |
|
|
|
|
tрасч a2j |
|
|
|
|
a2j-1 значимость |
|
|
|
|
a2j значимость |
|
|
|
|
Амплитуда ρ |
|
4,61 |
|
|
Период mj=12/j |
|
3 |
2 |
|
Fрасч |
|
23,28 |
0,00 |
|
Fкрит |
|
3,082852 |
3,082852016 |
|
|
|
значима |
|
|
P-value |
|
0,0000 |
1,0000 |
|
По
t-статистике вышло, что
коэффициент
вышел
незначимым, следовательно, его можно
убрать из модели:
Y(t)
=100,38 + 4,08cos(
)
– 2,14sin(
)
