2. Алгоритм
1) Построение графика исходного ряда
2) Для выделения тренда для исходного ряда по методу наименьших квадратов аппроксимируем ряд прямой, уравнение которой имеет вид:
y=a·x+b;
Для определения коэффициентов а и b воспользуемся формулами из метода наименьших квадратов:

Получим значения тренда для каждого t:
Ut=a·t+b,
t=
,
где N
– число точек исходного ряда.
Построение графика исходного ряда и графика линии тренда.
3) Удаление тренда из исходного ряда.
Удалим тренд из исходного ряда и получим значения ряда, в котором присутствует только сезонная и случайная компоненты:
Yt
- Ut
= Vt
+ εt.
, t=
.
Построение графика исходного ряда и ряда с удаленным трендом.
4) Подсчет коэффициентов автокорреляции.
Для определения периода колебаний воспользуемся корреляционной функцией. Найдем коэффициенты автокорреляции исходного ряда для различных лагов:
,
где
,
k=
,
K=
.
5) Построение коррелограммы
6) Оценка коррелограммы и установка периода колебаний.
Период колебаний находится как величина лага при максимальном неотрицательном коэффициенте автокорреляции:
T=k,
.
7) Вычисление сезонных компонент
Так как сезонные компоненты изменяются периодически с периодом T, усредним компоненты для каждого сезона.
Исходя из аддитивной модели, сумма сезонных компонент должна быть равна нулю. Если это условие не выполняется, вычисляют корректирующий коэффициент:
;
Вычтем из каждой сезонной компоненты корректирующий коэффициент:
,
t=
.
Теперь сумма сезонных компонент равна нулю:
.
Вывод таблицы с промежуточными данными и скорректированными значениями сезонных компонент.
8) Подсчет ошибки модели
Выразив из нашей модели ошибку, вычислим:
εt =Yt - Ut -Vt , где Yt – значения исходного ряда
Для оценки качества модели применим сумму квадратов полученных ошибок:

9) Прогнозирование
Для определения значений ряда в будущем воспользуемся построенной нами моделью и вычислим значение ряда для времени τ>N:
Y τ = U τ + V τ , где U τ – линия тренда, V τ – сезонная компонента.
Прогноз строится на число точек, определяемое пользователем, либо равное периоду колебаний.
Построение графика прогноза.
10) Вывод по построенной модели.
Если период колебаний T=1, то в исходном ряде отсутствуют сезонные компоненты, и математическое ожидание ряда всегда будет равно значению тренда.
Исходя из оценки качества модели, делается вывод о точности модели: если модель объясняет более 50% общей вариации уровней ряда, модель считается точной.
3. Контрольный пример
Исходный
ряд: 375
371 869 1015 357 471 992 1020 390 355 992 905 461 454 920
927
Выделение
линейной модели тренда
По
методу наименьших квадратов вычислены
коэффициенты уравнения линии
тренда:
y=14.3618*x+557.55
Исходный
ряд с удаленным трендом:
Подсчет
коэффициентов автокорреляции по ряду
с удаленным трендом:
|
Лаг |
Коэффициент автокорреляции |
|
0 |
1 |
|
1 |
-0.0682 |
|
2 |
-1.091 |
|
3 |
-0.123 |
|
4 |
0.8811 |
|
5 |
0.0088 |
|
6 |
-0.7484 |
|
7 |
0.0176 |
|
8 |
0.7098 |
Коррелограмма:
Анализ
коррелограммы
Так
как максимальный коэффициент автокорреляции
r=0.8811 получен при лаге 4, можно сделать
вывод, что исходный ряд колеблется
каждые 4 значения.
Вычисление
сезонных компонент
Наша
модель имеет вид: F=T+S+E (F – значения
модели, T – значения линии тренда, S –
значения сезонной компоненты, E –
величина ошибок)
Получим
оценку сезонной компоненты как
(предположив, что ошибка равна нулю)
S=F-T:
|
Сезон |
1 |
2 |
3 |
4 |
Среднее |
Скорректированная оценка |
|
Сезон 1 |
-768.8235 |
-901.7176 |
-983.6118 |
-1027.5059 |
-262.3324 |
-262.3324 |
|
Сезон 2 |
-801.5471 |
-816.4412 |
-1047.3353 |
-1063.2294 |
-259.6941 |
-259.6941 |
|
Сезон 3 |
-332.2706 |
-324.1647 |
-439.0588 |
-625.9529 |
256.4441 |
256.4441 |
|
Сезон 4 |
-214.9941 |
-324.8882 |
-554.7824 |
-647.6765 |
265.5824 |
265.5824 |
|
Сумма |
- |
- |
- |
- |
0 |
0 |
Оценка ошибки прогноза Из нашей модели выразим ошибку: Е=Z-T-S, где Z-реальные значения.
|
n |
Z |
S |
T |
E=Z-S-T |
E^2 |
|
1 |
-196.9118 |
-262.3324 |
571.9118 |
65.4206 |
4279.8534 |
|
2 |
-215.2735 |
-259.6941 |
586.2735 |
44.4206 |
1973.1887 |
|
3 |
268.3647 |
256.4441 |
600.6353 |
11.9206 |
142.1004 |
|
4 |
400.0029 |
265.5824 |
614.9971 |
134.4206 |
18068.8945 |
|
5 |
-272.3588 |
-262.3324 |
629.3588 |
-10.0265 |
100.5301 |
|
6 |
-172.7206 |
-259.6941 |
643.7206 |
86.9735 |
7564.3948 |
|
7 |
333.9176 |
256.4441 |
658.0824 |
77.4735 |
6002.1478 |
|
8 |
347.5559 |
265.5824 |
672.4441 |
81.9735 |
6719.6595 |
|
9 |
-296.8059 |
-262.3324 |
686.8059 |
-34.4735 |
1188.4242 |
|
10 |
-346.1676 |
-259.6941 |
701.1676 |
-86.4735 |
7477.6713 |
|
11 |
276.4706 |
256.4441 |
715.5294 |
20.0265 |
401.0595 |
|
12 |
175.1088 |
265.5824 |
729.8912 |
-90.4735 |
8185.4595 |
|
13 |
-283.2529 |
-262.3324 |
744.2529 |
-20.9206 |
437.671 |
|
14 |
-304.6147 |
-259.6941 |
758.6147 |
-44.9206 |
2017.8592 |
|
15 |
147.0235 |
256.4441 |
772.9765 |
-109.4206 |
11972.8651 |
|
16 |
139.6618 |
265.5824 |
787.3382 |
-125.9206 |
15855.9945 |
Для
оценки качества полученной модели
применим сумму квадратов полученных
абсолютных оценок.
R^2=
0.9263
Следовательно,
можно сказать, что аддитивная модель
объясняет 92.63% общей вариации уровней
временного ряда.
Прогнозирование. В соответствии с нашей моделью прогнозируем 10 точек для нашего ряда:
|
t |
Прогноз |
|
17 |
539.3676 |
|
18 |
556.3676 |
|
19 |
1086.8676 |
|
20 |
1110.3676 |
|
21 |
596.8147 |
|
22 |
613.8147 |
|
23 |
1144.3147 |
|
24 |
1167.8147 |
|
25 |
654.2618 |
|
26 |
671.2618 |
Вывод:
Модель
объясняет 92.63% общей вариации уровней
временного ряда, что достаточно высокий
показатель. Модель можно считать точной.
