
Пример 2
x(t)=a0+a1*t - инвариантна
t |
|
(t) |
t |
x(t) |
(t) |
1 |
1 |
1,43 |
9 |
1 |
1,43 |
2 |
3 |
3,14 |
10 |
3 |
3,14 |
3 |
5 |
4, 86 |
11 |
5 |
4, 86 |
4 |
7 |
6,57 |
12 |
7 |
6,57 |
5 |
9 |
8,29 |
13 |
9 |
8,29 |
6 |
10 |
10,00 |
14 |
10 |
10,00 |
7 |
11 |
11,71 |
15 |
11 |
11,71 |
11 |
46 |
18,57 |
19 |
46 |
18,57 |
Решение:
Задача решается в отношении неизвестных a0 и a1 .
а) метод наименьших квадратов
min ∑7t=1 [a0 + a1t – x(t)]2
сумма квадратичных отклонений (мера близости временного ряда)
Обозначим ∑7t=1 [a0 + a1t – x(t)]2=f(a0, a1)
Тогда уравнения в нормальной форме будут иметь вид:
∂ F/∂a0 = 2 ∑7t=1[a0 + a1t – x(t)] 1 = 0
∂F/∂a1 = 2 ∑7t=1 [a0 + a1t – x(t)] t = 0
Уравнения в каноническом вида:
( ∑7t=11) a0 + (∑7t=1 t) a1 = ∑7t=1 x(t)
(∑7t=1t) a0 + (∑7t=1 t) a1 = ∑7t=1 x(t) t
Уравнения в каноническом виде:
7 a0 + 28 a1 = 46
28 a0 + 140 a1 = 232
Решая систему методом Крамера, получим:
7 28
∆ = = 196
28 140
46 28
∆0 = = -56
232 140
7 46
∆1 = = 336
28 232
a0 = ∆0 / ∆ = 0,286
a1 = ∆1 / ∆ = 1,714
Таким образом, = 0,286 + 1,714t , для t=1,2,3,4,5,6,7,11
б) Проводим аналогичные рассуждения для t=9,10,11,12,13,14,15,19
Уравнения в каноническом виде:
7 a0 + 84 a1 = 46
84 a0 + 1036 a1 = 600
Решая систему методом Крамера, получим:
7 84
∆ = = 196
84 1036
46 28
∆0 = = -2744
600 1036
7 46
∆1 = = 336
28 232
a0 = ∆0 / ∆ = -14
a1 = ∆1 / ∆ = 1,714
Таким образом, = -14 + 1,714t , t = 9,10,11,12,13,14,15,19
Вывод: только во втором примере результаты остались прежними при вычислении на другом интервале времени, то есть примеры наглядно демонстрируют, что неинвариантные по сдвигу аргумента функции приводят к разным результатам в зависимости от выбранного начала отчета.
Метод компромисса «точность-надежность» в анализе экономических временных рядов.
Имеется исходный временной ряд X(t), t=1…N
Необходимо построить наиболее точную и надежную функцию регрессии выбранного вида:
Xt=a0+a1t+….+altl+ δt
То есть нужно ai и l.
В качестве аппроксимирующих функций рассматриваются только функции определенного вида (степенные полиномы). Временной ряд разбивается на полином и невязки и невязки:
X(t)=Pl(t)+ δl(t)
Критерий компромисса «точность-надежность»:
В качестве наилучшей по компромиссу «точность-надежность» в экономической линейной полиномиальной модели мы выбираем наиболее точную из допустимых по надежности оценок старших коэффициентов полинома.
Пример
Пусть имеется временной ряд капитальных вложений: x(t)
Построить наилучшую регрессионную модель для ряда инвестиций.
t |
x(t) |
P1(t) |
δ1(t) |
P2(t) |
δ2(t) |
P3(t) |
δ3(t) |
1 |
10,8 |
6,91 |
3,89 |
10,324 |
0,476 |
9,829 |
0,971 |
2 |
12,1 |
9,56 |
2,54 |
11,897 |
0,203 |
11,714 |
0,386 |
3 |
12,7 |
12,21 |
0,49 |
13,589 |
-0,889 |
13,632 |
-0,932 |
4 |
15 |
14,86 |
0,14 |
15,401 |
-0,401 |
15,593 |
-0,593 |
5 |
16,5 |
17,51 |
-1,01 |
17,332 |
-0,832 |
17,607 |
-1,107 |
6 |
19,1 |
20,16 |
-1,06 |
19,383 |
-0,283 |
19,685 |
-0,585 |
7 |
21,6 |
22,81 |
-1,21 |
21,554 |
0,046 |
21,837 |
-0,237 |
8 |
24,5 |
25,46 |
-0,96 |
23,845 |
0,655 |
24,072 |
0,428 |
9 |
27,4 |
28,11 |
-0,71 |
26,255 |
1,145 |
26,402 |
0,998 |
10 |
30,8 |
30,76 |
0,04 |
28,785 |
2,015 |
28,836 |
1,964 |
11 |
31,9 |
33,41 |
-1,51 |
31,435 |
0,465 |
31,384 |
0,516 |
12 |
34 |
36,06 |
-2,06 |
34,204 |
-0,204 |
34,058 |
-0,058 |
13 |
36,1 |
38,71 |
-2,61 |
37,093 |
-0,993 |
36,866 |
-0,766 |
14 |
39,4 |
41,36 |
-1,96 |
40,102 |
-0,702 |
39,820 |
-0,420 |
15 |
42,7 |
44,01 |
-1,31 |
43,231 |
-0,531 |
42,929 |
-0,229 |
16 |
45,8 |
46,66 |
-0,86 |
46,479 |
-0,679 |
46,204 |
-0,404 |
17 |
49,4 |
49,31 |
0,09 |
49,847 |
-0,447 |
49,654 |
-0,254 |
18 |
53,6 |
51,96 |
1,64 |
53,334 |
0,266 |
53,291 |
0,309 |
19 |
55,8 |
54,61 |
1,19 |
56,942 |
-1,142 |
57,124 |
-1,324 |
20 |
62,5 |
57,26 |
5,24 |
60,669 |
1,831 |
61,163 |
1,337 |
1. min ∑ 20t=1[a0 + a1 t – x(t)]2
( ∑20t=11) a0 + (∑20 t=1t) a1 = ∑20 t=1x(t)
(∑20t=1t) a0 + (∑20 t=1t2) a1 = ∑20 t=1x(t) t
20 a0 + 210 a1 = 641,7
210 a0 + 2870 a1 = 8499,9
Решаем это уравнение методом Крамера,
20 210
∆ = = 13300
210 2870
641,7 210
∆0 = = 56700
8499,9 2870
20 641,7
∆1 = = 35241
210 8499,9
a0 = ∆0 / ∆ = 4,263
a1 = ∆1 / ∆ = 2,65
Таким образом:
P1(t) = 4,26 + 2,65 t , t = 1,20
δ1(t) = x(t) - P1(t) – невязка (разница между теоретическими и эксп. данными)
S2(1) = (∑ δ12(t)) / N = 78,083 / 20 = 3,90 – показатель точности приближения (средний квадрат ошибки модели)
Приводим исследование невязок на степень соответствия их свойств свойствам белого шума.
А) Динамика невязок
Число пересечений с осью времени мало. Таким образом, динамика невязок не дает оснований рассматривать невязки как практическую реализацию белого шума.
Б) Поле автокорреляции при l=1
В поле автокорреляции наблюдается тренд, что дает основания полагать, что автокорреляция есть. Следовательно, нельзя рассматривать ряд невязок как реализацию белого шума.
В) Численное значение автокорреляции:
∑δ1(t-1) δ1(t) 40,714
r1(l) = = = 0,72 – высокая автокорреляция
√∑ δ12(t-1)∑ δ12(t) √50,625 * 62,951
Ошибка не белый шум, теоремой Гаусса – Маркова воспользоваться нельзя.
2. при l=2
min ∑ [a0 + a1 t + a2t2– x(t)]2
∂
F/∂a0
= 2 ∑ [a0
+ a1 t
+ a2t2
– x(t)] * 1 = 0
∂F/∂a1 = 2 ∑ [a0 + a1 t + a2t2 – x(t)] * t = 0
∂F/∂a2 = 2 ∑ [a0 + a1 t + a2t2 – x(t)] * t2 = 0
( ∑1) a0 + (∑t) a1 + (∑t2) a2 = ∑x(t)
(∑t) a0 + (∑t2) a1 +(∑t3) a2 = ∑x(t) t
(∑t2) a0 + (∑t3) a1 +(∑t4) a2 = ∑x(t) t2
20 a0 +
210 a1 +
2870 a2 =
641,7
210 a0 + 2870 a1 + 44100 a2 = 8499,9
2870 a0 + 44100 a1 + 722666 a2 = 130137,7
Решаем систему методом Крамера
20 210 2870
∆ = 210 2870 44100 = 233494800
2870 44100 722666
641,7 210 2870
∆0 = 8499,9 2870 44100 = 2071447070
130137,7 44100 722666
20 641,7 2870
∆1 = 210 8499,9 44100 = 325230486
2870 130137,7 722666
20 210 641,7
∆2 = 210 2870 8499,9 = 13974310
2870 44100 130137,7
a0 = ∆0 / ∆ = 8,871
a1 = ∆1 / ∆ = 1,393
a2 = ∆2 / ∆ = 0,060
тогда полином будет иметь вид:
P2(t) = 8,871 + 1,393 t + 0,060 t2 , t = 1,20
Тогда точность:
S2(2) = (∑ δ22(t)) / N = 15,200 / 20 = 0,76 – точность повысилась
Исследование невязок (на наличие белого шума)
А) Динамика невязок
Число пересечений с осью времени возросло. Тренд уже не наблюдается.
Б) Поле автокорреляции
В поле автокорреляции тренд наблюдается слабо.
В) Численное значение автокорреляции:
∑δ2(t-1) δ2(t) 4,18
r2(l) = = = 0,31
√∑ δ22(t-1)∑ δ22(t) √ 11,85 * 14,97
очень близко к ограничению для белого шума
Проверим данную модель на надежность:
σ2 (a22) = a22(2) σ2 δ (2) – дисперсия оценки коэф-та
a22(2) = 0,5696 * 10-4 – табличное значение диаг элемента обратной матрицы, соответствующей системе норм уравнений. Это значение табличное, т.к aii(l) не зависит от временного ряда, а зависит от степени полинома l и N.
σ2 δ (2) = N * S2(l) / N-l-1 = 20 * 0,76 / 17 = 0,8941 – дисперсия невязок
σ (a22) = √0,5696 * 10-4 * 0,8941 = 0,7137 * 10-2
B2 (2) = σ (a22) / ׀a22 ׀= 0,119 < 0,3 – высокая надежность
Модель l=2 является первым претендентом на лучшую
3. При l=3
min ∑ [a0 + a1 t + a2t2 + a3t3– x(t)]2
∂
F/∂a0
= 2 ∑ [a0
+ a1 t
+ a2t2
+ a3t3–
x(t)] * 1 = 0
∂F/∂a1 = 2 ∑ [a0 + a1 t + a2t2 + a3t3– x(t)] * t = 0
∂F/∂a2 = 2 ∑ [a0 + a1 t + a2t2 + a3t3– x(t)] * t2 = 0
∂F/∂a3 = 2 ∑ [a0 + a1 t + a2t2 + a3t3– x(t)] * t3 = 0
(
∑1)
a0 +
(∑t) a1 +
(∑t2)
a2 +(∑t3)
a3 =
∑x(t)
(∑t) a0 + (∑t2) a1 +(∑t3) a2 +(∑t4) a3 = ∑x(t) t
(∑t2) a0 + (∑t3) a1 +(∑t4) a2 +(∑t5) a3 = ∑x(t) t2
(∑t3) a0 + (∑t4) a1 +(∑t5) a2 +(∑t6) a3 = ∑x(t) t3
20 a0 +
210 a1 +
2870 a2
+ 44100 a3 =
641,7
210 a0 + 2870 a1 + 44100 a2 + 722666 a3 = 8499,9
2870 a0 + 44100 a1 + 722666 a2 + 12333300 a3 = 130137,7
44100 a0 + 722666 a1 + 12333300 a2 + 216455810 a3 = 2136701,1
20 210 2870 44100
∆ = 210 2870 44100 722666 = 103037192430492
2870 44100 722666 12333300
44100 722666 12333300 216455810
∆0 = 820899119763620
∆1 = 191071744212885
∆2 = 641258443983,09
∆3 = 175408298603,93
a0 = ∆0 / ∆ = 7,967
a1 = ∆1 / ∆ = 1,854
a2 = ∆2 / ∆ = 0,006
a3 = ∆3 / ∆ = 0,002
Полином будет иметь вид:
P3(t) = 7,967 + 1,854 t + 0,006 t2 + 0,002 t3 , t = 1,20
Тогда надежность:
S2(3) = (∑ δ32(t)) / N = 13,921 / 20 = 0,696
Исследование невязок (на наличие белого шума)
А) Динамика невязок
Явного тренда не наблюдается, число пересечений осталось прежним.
Б) Поле автокорреляции
В) Численное значение автокорреляции:
∑δ3(t-1) δ3(t) 3,68
r3(l) = = = 0,29
√∑ δ32(t-1)∑ δ32(t) √ 12,13 * 12,98
График динамики невязок, поле автокорреляции и значение коэффициента автокорреляции дают основания рассматривать ряд невязок на реализацию белого шума.
Проверим на надежность:
σ2 (a33) = a33(3) σ2 δ (3)
a33(3) = 0,2266 * 10-5
σ2 δ (3) = N * S2(l) / N-l-1 = 20 * 0,7 / 16 = 0,875
σ (a33) = √0,2266 * 10-5 * 0,875 = 1,408 * 10-3
B3 (3) = σ (a33) / ׀a33׀= 0,704 > 0,3 – низкая надежность
В ходе исследования было получено, что два полинома (второй и третьей степени) могут претендовать на оптимальную модель.
|
L=1 |
L=2 |
L=3 |
Точность |
3,9 |
0,76 |
0,7 |
Надежность |
|
0,12 |
0,80 |
Таким образом, исходя из правила компромисса «точность-надежность» и полученных расчетных данных, наилучшей должна быть признана регрессионная модель второй степени