
- •Работа № 13 анализ временных рядов
- •13.1. Определения и основные понятия
- •13.2. Выявление наличия (отсутствия) неслучайной составляющей. Речь идет о проверке гипотезы
- •13.3. Методы сглаживания временного ряда.
- •13.4. Стационарные временные ряды. Автокорреляционная функция и коррелограмма.
- •13.5 Временные ряды и прогнозирование. Автокорреляция возмущений. Авторегрессионные модели.
- •13.7. Варианты заданий
- •13.8. Пример выполнения и оформления задания
- •Выявление наличия (отсутствия) неслучайной составляющей.
- •Литература
13.8. Пример выполнения и оформления задания
Временной ряд дневных котировок индексов за три месяца будет содержать около семидесяти значений. Рассмотрим часть временного ряда, состоящую из 60 наблюдений. Оставшуюся часть будем использовать для сравнения построенной модели с реальными данными.
Выявление наличия (отсутствия) неслучайной составляющей.
Проверим критерий серий, основанных на медиане. Определим выборочную медиану. Например, пользуясь пакетом Анализ Данных (Описательная статистика) в Excel или статистической функцией МЕДИАНА.
Далее образуем серии из плюсов и минусов. Сначала из всех данных вычтем значение медианы. Если полученное значение больше нуля, ему в соответствие ставим плюс (можно единицу), а если полученная разность меньше нуля, то ставим минус (можно минус единицу). Затем считаем длину каждой серии.
Затем любым способом считаем количество серий и длину самой большой серии:
Подсчитаем значения в правой части неравенств (13.3)
(N=60),
.
Таким образом, оба неравенства нарушаются. Следовательно, принимается гипотеза о наличии зависящей от времени неслучайной составляющей.
Теперь
рассмотрим критерий восходящих и
нисходящих линий. Получим сначала
последовательность разностей
,
затем последовательность плюсов и
минусов согласно изложенному выше
правилу. В нашем случае
Найдем значения правых частей неравенств (13.4):
=6
Таким образом, первое неравенство не выполняется, и данный критерий также подтверждает гипотезу о наличии неслучайной составляющей временного ряда.
Ниже представлена таблица вычисления указанных выше значений в Excel.
Таблица 13.3.
Вычисление длин серий для проверки гипотезы
об отсутствии неслучайной составляющей.
Критерий серий, основанный на медиане |
Критерий восходящих и нисходящих серий |
||||||
|
|
серии |
длина |
|
|
серии |
длина |
1069.77 |
-52.755 |
-1 |
|
1069.77 |
-3.52 |
-1 |
|
1066.25 |
-56.275 |
-1 |
|
1066.25 |
-0.93 |
-1 |
-2 |
1065.32 |
-57.205 |
-1 |
|
1065.32 |
4.88 |
1 |
1 |
1070.2 |
-52.325 |
-1 |
|
1070.2 |
-8.37 |
-1 |
|
1061.83 |
-60.695 |
-1 |
|
1061.83 |
-0.33 |
-1 |
-2 |
1061.5 |
-61.025 |
-1 |
|
1061.5 |
7.4 |
1 |
1 |
1068.9 |
-53.625 |
-1 |
|
1068.9 |
-9.01 |
-1 |
|
1059.89 |
-62.635 |
-1 |
|
1059.89 |
-1.44 |
-1 |
-2 |
1058.45 |
-64.075 |
-1 |
|
1058.45 |
12.73 |
1 |
|
1071.18 |
-51.345 |
-1 |
|
1071.18 |
2.91 |
1 |
|
1074.09 |
-48.435 |
-1 |
|
1074.09 |
0.05 |
1 |
3 |
1074.14 |
-48.385 |
-1 |
|
1074.14 |
-5.63 |
-1 |
-1 |
1068.51 |
-54.015 |
-1 |
|
1068.51 |
6.39 |
1 |
|
1074.9 |
-47.625 |
-1 |
|
1074.9 |
1.21 |
1 |
|
1076.11 |
-46.415 |
-1 |
|
1076.11 |
12.66 |
1 |
3 |
1088.77 |
-33.755 |
-1 |
|
1088.77 |
-0.78 |
-1 |
-1 |
1087.99 |
-34.535 |
-1 |
|
1087.99 |
4.3 |
1 |
|
1092.29 |
-30.235 |
-1 |
|
1092.29 |
3.36 |
1 |
2 |
1095.65 |
-26.875 |
-1 |
|
1095.65 |
-1.61 |
-1 |
-1 |
1094.04 |
-28.485 |
-1 |
|
1094.04 |
1.85 |
1 |
|
1095.89 |
-26.635 |
-1 |
|
1095.89 |
12.95 |
1 |
|
1108.84 |
-13.685 |
-1 |
|
1108.84 |
0.12 |
1 |
|
1108.96 |
-13.565 |
-1 |
|
1108.96 |
1.35 |
1 |
|
1110.31 |
-12.215 |
-1 |
|
1110.31 |
1.6 |
1 |
1 |
1111.91 |
-10.615 |
-1 |
|
1111.91 |
-4.38 |
-1 |
-1 |
1107.53 |
-14.995 |
-1 |
|
1107.53 |
0.95 |
1 |
|
1108.48 |
-14.045 |
-1 |
|
1108.48 |
12.77 |
1 |
|
1121.25 |
-1.275 |
-1 |
-28 |
1121.25 |
2.22 |
1 |
|
1123.47 |
0.945 |
1 |
|
1123.47 |
2.19 |
1 |
|
1125.66 |
3.135 |
1 |
|
1125.66 |
4.99 |
1 |
5 |
1130.65 |
8.125 |
1 |
|
1130.65 |
-7.45 |
-1 |
|
1123.2 |
0.675 |
1 |
4 |
1123.2 |
-1.35 |
-1 |
-2 |
1121.85 |
-0.675 |
-1 |
-1 |
1121.85 |
5.27 |
1 |
1 |
1127.12 |
4.595 |
1 |
1 |
1127.12 |
-5.85 |
-1 |
-1 |
1121.27 |
-1.255 |
-1 |
-1 |
1121.27 |
8.81 |
1 |
|
1130.08 |
7.555 |
1 |
|
1130.08 |
0.99 |
1 |
|
1131.07 |
8.545 |
1 |
|
1131.07 |
4.66 |
1 |
|
1135.73 |
13.205 |
1 |
|
1135.73 |
2.55 |
1 |
|
1138.28 |
15.755 |
1 |
|
1138.28 |
8.08 |
1 |
|
1146.36 |
23.835 |
1 |
|
1146.36 |
1.26 |
1 |
6 |
1147.62 |
25.095 |
1 |
|
1147.62 |
-6.54 |
-1 |
-1 |
1141.08 |
18.555 |
1 |
|
1141.08 |
0.47 |
1 |
|
1141.55 |
19.025 |
1 |
|
1141.55 |
13.8 |
1 |
2 |
1155.35 |
32.825 |
1 |
|
1155.35 |
-10.31 |
-1 |
|
1145.04 |
22.515 |
1 |
|
1145.04 |
-17.89 |
-1 |
-2 |
1127.15 |
4.625 |
1 |
|
1127.15 |
6.34 |
1 |
1 |
1133.49 |
10.965 |
1 |
|
1133.49 |
-1.55 |
-1 |
|
1131.94 |
9.415 |
1 |
|
1131.94 |
-0.81 |
-1 |
2 |
1131.13 |
8.605 |
1 |
|
1131.13 |
2.87 |
1 |
|
1134 |
11.475 |
1 |
|
1134 |
0.86 |
1 |
1 |
1134.86 |
12.335 |
1 |
|
1134.86 |
-7.03 |
-1 |
-1 |
1127.83 |
5.305 |
1 |
|
1127.83 |
1.37 |
1 |
|
1129.2 |
6.675 |
1 |
|
1129.2 |
12.61 |
1 |
|
1141.81 |
19.285 |
1 |
|
1141.81 |
0.95 |
1 |
|
1142.76 |
20.235 |
1 |
|
1142.76 |
9.12 |
1 |
2 |
1151.88 |
29.355 |
1 |
|
1151.88 |
-5.27 |
-1 |
|
1146.61 |
24.085 |
1 |
|
1146.61 |
-0.8 |
-1 |
-2 |
1145.81 |
23.285 |
1 |
|
1145.81 |
10.87 |
1 |
1 |
1156.68 |
34.155 |
1 |
|
1156.68 |
-4.68 |
-1 |
-1 |
1152 |
29.475 |
1 |
25 |
1152 |
|
|
|
Построение линии тренда. Линия тренда строится методом регрессионного анализа, построение линии тренда является довольно простой процедурой в Excel. Воспользуемся Пакетом анализа, выбрав в его меню пункт Регрессия. Получаем следующие результаты
|
Регрессионная статистика |
|
|||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
Множественный R |
0.938689471 |
|
||||||||||
|
R-квадрат |
0.881137922 |
|
||||||||||
|
Нормированный R-квадрат |
0.879088576 |
|
||||||||||
|
Стандартная ошибка |
10.57352335 |
|
||||||||||
|
Наблюдения |
60 |
|
||||||||||
|
Дисперсионный анализ |
|
|
|
|
||||||||
|
|
df |
SS |
MS |
F |
Значимость F |
|
||||||
|
Регрессия |
1 |
48069.32532 |
48069.32532 |
429.96051 |
1.66386E-28 |
|
||||||
|
Остаток |
58 |
6484.364969 |
111.799396 |
|
|
|
||||||
|
Итого |
59 |
54553.69029 |
|
|
|
|
||||||
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
|||||||||
Y-пересечение |
1062.242164 |
2.764558476 |
384.2357371 |
1.763E-100 |
|||||||||
№ |
1.634399 |
0.078821338 |
20.73548914 |
1.6639E-28 |
Прогноз на основе линейной регрессии. Для построения графика следует в Excel сформировать следующую таблицу данных:
Таблица 13.4.
Сводная таблица результатов регрессионного анализа.
№ |
Yэксп |
Yрегр |
Yрегр -Дов.инт |
Yрегр +Дов.инт |
№ |
Yэксп |
Yрегр |
Yрегр -Дов.инт |
Yрегр +Дов.инт |
1 |
1069.77 |
1063.88 |
1042.71 |
1085.04 |
35 |
1121.27 |
1119.45 |
1098.28 |
1140.61 |
2 |
1066.25 |
1065.51 |
1044.35 |
1086.68 |
36 |
1130.08 |
1121.08 |
1099.92 |
1142.25 |
3 |
1065.32 |
1067.15 |
1045.98 |
1088.31 |
37 |
1131.07 |
1122.71 |
1101.55 |
1143.88 |
4 |
1070.2 |
1068.78 |
1047.61 |
1089.94 |
38 |
1135.73 |
1124.35 |
1103.18 |
1145.51 |
5 |
1061.83 |
1070.41 |
1049.25 |
1091.58 |
39 |
1138.28 |
1125.98 |
1104.82 |
1147.15 |
6 |
1061.5 |
1072.05 |
1050.88 |
1093.21 |
40 |
1146.36 |
1127.62 |
1106.45 |
1148.78 |
7 |
1068.9 |
1073.68 |
1052.52 |
1094.85 |
41 |
1147.62 |
1129.25 |
1108.09 |
1150.42 |
8 |
1059.89 |
1075.32 |
1054.15 |
1096.48 |
42 |
1141.08 |
1130.89 |
1109.72 |
1152.05 |
9 |
1058.45 |
1076.95 |
1055.79 |
1098.12 |
43 |
1141.55 |
1132.52 |
1111.36 |
1153.69 |
10 |
1071.18 |
1078.59 |
1057.42 |
1099.75 |
44 |
1155.35 |
1134.16 |
1112.99 |
1155.32 |
11 |
1074.09 |
1080.22 |
1059.06 |
1101.39 |
45 |
1145.04 |
1135.79 |
1114.62 |
1156.96 |
12 |
1074.14 |
1081.85 |
1060.69 |
1103.02 |
46 |
1127.15 |
1137.42 |
1116.26 |
1158.59 |
13 |
1068.51 |
1083.49 |
1062.32 |
1104.65 |
47 |
1133.49 |
1139.06 |
1117.89 |
1160.22 |
14 |
1074.9 |
1085.12 |
1063.96 |
1106.29 |
48 |
1131.94 |
1140.69 |
1119.53 |
1161.86 |
15 |
1076.11 |
1086.76 |
1065.59 |
1107.92 |
49 |
1131.13 |
1142.33 |
1121.16 |
1163.49 |
16 |
1088.77 |
1088.39 |
1067.23 |
1109.56 |
50 |
1134 |
1143.96 |
1122.80 |
1165.13 |
17 |
1087.99 |
1090.03 |
1068.86 |
1111.19 |
51 |
1134.86 |
1145.60 |
1124.43 |
1166.76 |
18 |
1092.29 |
1091.66 |
1070.50 |
1112.83 |
52 |
1127.83 |
1147.23 |
1126.07 |
1168.40 |
19 |
1095.65 |
1093.30 |
1072.13 |
1114.46 |
53 |
1129.2 |
1148.87 |
1127.70 |
1170.03 |
20 |
1094.04 |
1094.93 |
1073.76 |
1116.10 |
54 |
1141.81 |
1150.50 |
1129.33 |
1171.66 |
21 |
1095.89 |
1096.56 |
1075.40 |
1117.73 |
55 |
1142.76 |
1152.13 |
1130.97 |
1173.30 |
22 |
1108.84 |
1098.20 |
1077.03 |
1119.36 |
56 |
1151.88 |
1153.77 |
1132.60 |
1174.93 |
23 |
1108.96 |
1099.83 |
1078.67 |
1121.00 |
57 |
1146.61 |
1155.40 |
1134.24 |
1176.57 |
24 |
1110.31 |
1101.47 |
1080.30 |
1122.63 |
58 |
1145.81 |
1157.04 |
1135.87 |
1178.20 |
25 |
1111.91 |
1103.10 |
1081.94 |
1124.27 |
59 |
1156.68 |
1158.67 |
1137.51 |
1179.84 |
26 |
1107.53 |
1104.74 |
1083.57 |
1125.90 |
60 |
1152 |
1160.31 |
1139.14 |
1181.47 |
27 |
1108.48 |
1106.37 |
1085.21 |
1127.54 |
61 |
1148.89 |
1161.94 |
1140.78 |
1183.11 |
28 |
1121.25 |
1108.01 |
1086.84 |
1129.17 |
62 |
1144.03 |
1163.57 |
1142.41 |
1184.74 |
29 |
1123.47 |
1109.64 |
1088.47 |
1130.80 |
63 |
1144.11 |
1165.21 |
1144.04 |
1186.37 |
30 |
1125.66 |
1111.27 |
1090.11 |
1132.44 |
64 |
1139.26 |
1166.84 |
1145.68 |
1188.01 |
31 |
1130.65 |
1112.91 |
1091.74 |
1134.07 |
65 |
1144.58 |
1168.48 |
1147.31 |
1189.64 |
32 |
1123.2 |
1114.54 |
1093.38 |
1135.71 |
66 |
1145.82 |
1170.11 |
1148.95 |
1191.28 |
33 |
1121.85 |
1116.18 |
1095.01 |
1137.34 |
67 |
1146 |
1171.75 |
1150.58 |
1192.91 |
34 |
1127.12 |
1117.81 |
1096.65 |
1138.98 |
68 |
1144.94 |
1173.38 |
1152.22 |
1194.55 |
Затем с помощью Мастера Диаграмм получаем следующий график.
Рис. 13.1. Сравнение регрессионной модели с реальными данными.
Из графика видно, что полученная модель регрессии не подходит для явного прогноза цены. Но с помощью этой модели можно все же сделать некоторые выводы о поведении графика цен. После 45 шага цена опустилась ниже линии регрессии и достаточно долго там оставалась. Следовательно, можно сделать вывод, что тренд может перемениться в другую сторону, что и видно на графике.
4. Анализ остатков. Основное значение имеет анализ остатков для выяснения возможности прогнозирования временных рядов с помощью построенной регрессионной модели.
Для анализа остатков следует найти автокорреляционную функцию, построить ее график (коррелограмму), проверить остатки на нормальность, проверить отсутствие автокорреляции возмущений с помощью критерия Дарбина-Уотсона.
Рис. 13.2. Коррелограмма остатков – значения автокорреляционной функции в зависимости от сдвига.
Таблица 13.5.
Значения автокорреляционной функции для остатков.
-
остатки
сдвиг
корреляция
остатки
сдвиг
корреляция
5.8934
0
1.0000
2.1091
26
-0.6345
0.7390
1
0.8111
13.2447
27
-0.6284
-1.8254
2
0.6858
13.8303
28
-0.6244
1.4202
3
0.6596
14.3859
29
-0.6507
-8.5842
4
0.5507
17.7415
30
-0.6682
-10.5486
5
0.4684
8.6571
31
-0.6520
-4.7830
6
0.4175
5.6727
32
-0.5681
-15.4274
7
0.2857
9.3083
33
-0.4269
-18.5018
8
0.1494
1.8239
34
-0.3526
-7.4062
9
0.0631
8.9995
35
-0.3425
-6.1306
10
-0.0119
8.3551
36
-0.2105
-7.7150
11
-0.0650
11.3807
37
0.1242
-14.9794
12
-0.1153
12.2963
38
0.2490
-10.2237
13
-0.2377
18.7419
39
0.3814
-10.6481
14
-0.3054
18.3675
40
0.6105
0.3775
15
-0.3768
10.1931
41
0.4976
-2.0369
16
-0.4523
9.0287
42
0.4466
0.6287
17
-0.5054
21.1943
43
0.6601
2.3543
18
-0.5023
9.2499
44
0.6378
-0.8901
19
-0.5302
-10.2745
45
0.1288
-0.6745
20
-0.5466
-5.5689
46
-0.0324
10.6411
21
-0.5898
-8.7533
47
-0.1495
9.1267
22
-0.6207
-11.1977
48
-0.3868
8.8423
23
-0.6885
-9.9621
49
-0.2883
8.8079
24
-0.7043
-10.7365
50
-0.5573
2.7935
25
-0.6477
-19.4009
51
-0.7067
Проверив остатки на нормальность с помощью критериев Пирсона и Колмогорова, получаем, что они имеют нормальное распределение с нулевым средним значением. То есть остатки удовлетворяют требованиям регрессионного анализа.
Проверим независимость возмущений с помощью критерия Дарбина-Уотсона. Подсчитаем статистику критерия
.
Таким образом, критерий дает заключение о наличии положительной автокорреляции возмущений. Тогда следует попробовать подобрать другую модель регрессии, например, полиномиальную или экспоненциальную. Отметим, что и в этих случаях критерий Дарбина-Уотсона также дает положительную автокорреляцию возмущений.
5. Построение скользящих средних. Скользящие средние строятся в Excel c помощью АНАЛИЗ ДАННЫХ – СКОЛЬЗЯЩЕЕ СРЕДНЕЕ. Приведем полученные результаты в виде графика.
Рис. 13.3. Линейное сглаживание по 5, 10, 20 точкам.
Рис. 13.4. Экспоненциальное сглаживание.
Из первого рисунка замечаем, что все скользящие средние находятся ниже графика цен. Такая картина всегда наблюдается при росте цен. Дальше график цены и скользящие средние начинают сближаться и пересекаться. Отсюда можно сделать вывод о возможном развороте графика. Экспоненциальное сглаживание лучше отслеживает график цен, но с помощью его в данном случае нельзя сделать прогноз о тенденции временного ряда.