![](/user_photo/_userpic.png)
Ведение в социально - экономическую статистику. Учебник. Новосибирск, 2004. 739 с
.pdf11.10 Оптимальное в среднеквадратическом смысле прогнозирование 383
где
|
γ0 |
γ1 |
· · · |
γt−1 |
||
Γt = |
γ1 |
γ0 |
· · · |
γt−2 |
||
. |
. . |
. |
|
. |
||
|
. |
. |
|
|
. |
|
|
. |
. |
|
|
. . |
|
|
γt−1 |
γt−2 · · · |
γ0 |
— автоковариационная матрица ряда (x1, . . . , xt), а вектор γt,τ составлен из ковариаций xt+τ с (x1, . . . , xt), т.е.
γt,τ = (γt+τ −1, . . . , γτ ) .
Можно заметить, что автоковариации здесь нужно знать только с точностью до множителя. Например, их можно заменить автокорреляциями.
Рассмотрим теперь прогнозирование на один шаг вперед. Обозначим через γt вектор, составленный из ковариаций xt+1 с (x1, . . . , xt), т.е. γt = (γt, . . . , γ1) = = γt,1 . Прогноз задается формулой:
t
xt(1) = x Γ−t 1γt = x αt = αti xt−i.
i=1
Прогноз по этой формуле можно построить только если матрица Γt неособенная. Коэффициенты αti , минимизирующие средний квадрат ошибки прогноза, задаются нормальными уравнениями Γtα = γt или, в развернутом виде,
t
αti γ|k−i| = γk, k = 1, . . . , t.
i=1
Ошибка прогноза равна
η = xt+1 − xt(1).
Применив (11.20), получим, что средний квадрат этой ошибки равен
E η2 = γ0 − γt Γ−t 1γt.
Заметим, что γ0 − γt Γ−t 1γt = |Γt+1| / |Γt|, т.е предыдущую формулу можно переписать как
E η2 = |Γt+1| / |Γt| . |
(11.22) |
![](/html/611/244/html_qKdwZuTrJr.UoU7/htmlconvd-RhTpcp382x1.jpg)
![](/html/611/244/html_qKdwZuTrJr.UoU7/htmlconvd-RhTpcp383x1.jpg)
11.10 Оптимальное в среднеквадратическом смысле прогнозирование 385
2)Оценить параметры на основе имеющихся данных. Пусть b — соответствующие оценки.
3)Получить оценки автоковариаций, подставив b в формулы теоретических автоковариаций: γk ≈ γk(b).
4)Использовать для прогнозирования формулу (11.21), заменяя теоретические автоковариации полученными оценками автоковариаций.
11.10.4.Прогнозирование по полной предыстории. Разложение Вольда
Можно распространить представленную выше теорию на прогнозирование ряда в случае, когда в момент t известна полная предыстория Ωt = (xt, xt−1 , . . . ). Можно определить соответствующий прогноз как предел прогнозов, полученных на основе конечных рядов (xt, xt−1, . . . , xt−j ), j = t, t − 1, . . . , −∞. Без доказательства отметим, что этот прогноз будет оптимальным в среднеквадратическом смысле. Если рассматривается процесс, для которого |Γt| = 0 t, то по аналогии с (11.22) средний квадрат ошибки такого прогноза равен
E η2 |
= lim |
|Γt+1| |
. |
|
||
|
|
t→∞ |
|Γt| |
|
||
Заметим, что всегда выполнено |
0 < |
|Γt+1| |
≤ |
|Γt| |
, т.е. средний квадрат ошиб- |
|
|Γt| |
|Γt−1| |
ки не увеличивается с увеличением длины ряда, на основе которого делается прогноз, и ограничен снизу нулем, поэтому указанный предел существует всегда.
Существуют процессы, для которых |Γt| = 0 t, т.е. для них нельзя сделать безошибочный прогноз, имея только конечный отрезок ряда, однако
lim |Γt+1| = 0.
t→∞ |Γt|
Такой процесс по аналогии можно назвать линейно детерминированным. Его фактически можно безошибочно предсказать, если имеется полная предыстория процесса Ωt = (xt, xt−1, . . . ).
Если же данный предел положителен, то линейный прогноз связан с ошибкой: E η2 > 0. Такой процесс можно назвать регулярным.
Выполнены следующие свойства стационарных рядов.
A. Пусть xt — слабо стационарный временной ряд, и пусть ηt — ошибки одношагового оптимального линейного прогноза по полной предыстории процесса (xt−1, xt−2, . . .). Тогда ошибки ηt являются белым шумом, т.е. имеют нулевое ма-
![](/html/611/244/html_qKdwZuTrJr.UoU7/htmlconvd-RhTpcp384x1.jpg)
11.10 Оптимальное в среднеквадратическом смысле прогнозирование 387
Второе слагаемое, vt+τ , можно предсказать без ошибки, зная Ωt. Из первой суммы первые τ слагаемых не предсказуемы на основе Ωt. При прогнозировании их можно заменить ожидаемыми значениями — нулями. Из этих рассуждений следует следующая формула прогноза:
∞
xt(τ ) = ψiηt+τ −i + τt+τ . i=τ
Без доказательства отметим, что xt(τ ) является оптимальным линейным прогнозом. Ошибка прогноза при этом будет равна
τ −1
ψiηt+τ −i.
i=0
Поскольку ηt — белый шум с дисперсией ση2 , то средний квадрат ошибки прогноза равен
τ −1
ση2 ψi2.
i=0
Напоследок обсудим природу компоненты vt. Простейший пример линейно детерминированного ряда — это, говоря неформально, «случайная константа»:
vt = ξ,
где ξ — наперед заданная случайная величина, Eξ = 0.
Типичный случай линейно детерминированного ряда — это, говоря неформально, «случайная синусоида»:
vt = ξ cos(ωt + ϕ),
где ω — фиксированная частота, ξ и ϕ — независимые случайные величины, причем ϕ имеет равномерное распределение на отрезке [0; 2π].
Это два примера случайных слабо стационарных рядов, которые можно безошибочно предсказывать на основе предыстории. Первый процесс можно моделировать с помощью константы, а второй — с помощью линейной комбинации синуса и косинуса:
αcos(ωt) + β sin(ωt).
Сточки зрения практики неформальный вывод из теоремы Вольда состоит
втом, что любые стационарные временные ряды можно моделировать при помощи моделей линейного фильтра с добавлением констант и гармонических трендов.
388 |
Глава 11. Основные понятия в анализе временных рядов |
11.11. Упражнения и задачи
Упражнение 1
1.1.Дан временной ряд x = (5, 1, 1, −3, 2, 9, 6, 2, 5, 2) .
Вычислите среднее, дисперсию (смещенную), автоковариационную и автокорреляционную матрицы.
1.2.Для временного ряда y = (6, 6, 1, 6, 0, 6, 6, 4, 3, 2) повторите упражнение 1.1.
1.3.Вычислите кросс-ковариации и кросс-корреляции для рядов x и y из предыдущих упражнений для сдвигов −9, . . . , 0, . . . , 9.
1.4.Для временного ряда x = (7, −9, 10, −2, 21, 13, 40, 36, 67, 67) оцените параметры полиномиального тренда второго порядка. Постройте точечный и интервальный прогнозы по тренду на 2 шага вперед.
1.5.Сгенерируйте 20 рядов, задаваемых полиномиальным трендом третьего порядка τt = 5 + 4t −0.07t2 + 0.0005t3 длиной 100 наблюдений, с добавлением белого шума с нормальным распределением и дисперсией 20 .
Допустим, истинные значения параметров тренда неизвестны.
а) Для 5 рядов из 20 оцените полиномиальный тренд первого, второго и третьего порядков и выберите модель, которая наиболее точно аппроксимирует сгенерированные данные.
б) Для 20 рядов оцените полиномиальный тренд третьего порядка по первым 50 наблюдениям. Вычислите оценки параметров тренда и их ошибки. Сравните оценки с истинными значениями параметров.
в) Проведите те же вычисления, что и в пункте (б), для 20 рядов, используя 100 наблюдений. Результаты сравните.
г) Используя предшествующие расчеты, найдите точечные и интервальные прогнозы на три шага вперед с уровнем доверия 95%.
1.6.Найдите данные о динамике денежного агрегата M0 в России за 10 последовательных лет и оцените параметры экспоненциального тренда.
1.7.Ряд x = (0.02, 0.05, 0.06, 0.13, 0.15, 0.2, 0.31, 0.46, 0.58, 0.69, 0.78, 0.81,
0.95, 0.97, 0.98) характеризует долю семей, имеющих телевизор. Оцените параметры логиcтического тренда.
1.8.По ряду x из упражнения 3 рассчитайте ранговый коэффициент корреляции Спирмена и сделайте вывод о наличии тенденции.
11.11 Упражнения и задачи |
|
|
|
|
|
|
|
|
389 |
|||
|
|
|
|
Таблица 11.1 |
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Расходы на рекламу |
10 |
100 |
50 |
200 |
|
20 |
70 |
100 |
50 |
300 |
80 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Объем продаж |
1011 |
1030 |
1193 |
1149 |
|
1398 |
1148 |
1141 |
1223 |
1151 |
1576 |
|
|
|
|
|
|
|
|
|
|
|
|
|
1.9.Дан ряд:
x = (10, 9, 12, 11, 14, 12, 17, 14, 19, 16, 18, 21, 20, 23, 22, 26, 23, 28, 25, 30) .
а) Оцените модель линейного тренда. Остатки, полученные после исключения тренда, проверьте на стационарность с использованием рангового коэффициента корреляции Спирмена.
б) Рассчитайте для остатков статистику Бартлетта, разбив ряд на 4 интервала по 5 наблюдений. Проверьте однородность выборки по дисперсии.
в) Рассчитайте для остатков статистику Голдфельда—Квандта, исключив 6 наблюдений из середины ряда. Проверьте однородность выборки по дисперсии. Сравните с выводами, полученными на основе критерия Бартлетта.
1.10.По данным таблицы 11.1 оцените модель распределенного лага зависимости объема продаж от расходов на рекламу с лагом 2 .
Определите величину максимального лага в модели распределенного лага, используя различные критерии ( t-статистики, F -статистики, информационные критерии).
Задачи
1.Перечислить статистики, использующиеся в расчете коэффициента автокорреляции, и записать их формулы.
2.Чем различается расчет коэффициента автокорреляции для стационарных и нестационарных процессов? Записать формулы.
3.Вычислить значение коэффициента корреляции для двух рядов:
x = (1, 2, 3, 4, 5, 6, 7, . . . ) и y = (2, 4, 6, 8, 10, 12, 14, . . . ).
4.Посчитать коэффициент автокорреляции первого порядка для ряда x = (2, 4, 6, 8) .
5.Есть ли разница между автокорреляционной функцией и трендом автокорреляции?
![](/html/611/244/html_qKdwZuTrJr.UoU7/htmlconvd-RhTpcp388x1.jpg)
390 |
Глава 11. Основные понятия в анализе временных рядов |
6.Записать уравнения экспоненциального и полиномиального трендов и привести формулы для оценивания их параметров.
7.Записать формулу для оценки темпа прироста экспоненциального тренда.
8.Привести формулу логистической кривой и указать особенности оценивания ее параметров.
9.Оценить параметры линейного тренда для временного ряда x = (1, 2, 5, 6) и записать формулу доверительного интервала для прогноза на 1 шаг вперед.
10.Дан временной ряд: x = (1, 0.5, 2, 5, 1.5). Проверить его на наличие тренда среднего.
11.Пусть L — лаговый оператор. Представьте в виде степенного ряда следующие выражения:
а) |
|
2 |
; б) |
|
−1, 5 |
; в) |
2.8 |
; г) |
−3 |
. |
|
− 0.8L |
|
− 0.9L |
1 + 0.4L |
|
|||||
1 |
1 |
|
|
1 + 0.5L |
Рекомендуемая литература
1.Айвазян С.А. Основы эконометрики. Т.2. — М.: «Юнити», 2001.
2.Андерсон Т. Статистический анализ временных рядов. — М.: «Мир», 1976. (Гл. 1, 3, 7).
3.Бокс Дж., Дженкинс Г. Анализ временных рядов. Прогноз и управление. Вып. 1. — М.: «Мир», 1974. (Гл. 1).
4.Кендалл М. Дж., Стьюарт А. Многомерный статистический анализ и временные ряды. — М.: «Наука», 1976. (Гл. 45–47).
Маленво Э. Статистические методы эконометрии. Вып. 2. — М.: «Статистика», 1976. (Гл. 12).
5.Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика — начальный курс. — М.: «Дело», 2000. (Гл. 12).
6.Enders Walter. Applied Econometric Time Series. — Iowa State University, 1995. (Ch. 1).
7.Mills Terence C. Time Series Techniques for Economists, Cambridge University Press, 1990 (Ch. 5).
8.Wooldridge Jeffrey M. Introductory Econometrics: A Modern Approach, 2nd ed., Thomson, 2003 (Ch. 10).
![](/html/611/244/html_qKdwZuTrJr.UoU7/htmlconvd-RhTpcp389x1.jpg)
Глава 12
Сглаживание временного ряда
12.1. Метод скользящих средних
Одним из альтернативных по отношению к функциональному описанию тренда вариантов сглаживания временного ряда является метод скользящих или, как еще говорят, подвижных средних.
Суть метода заключается в замене исходного временного ряда последовательностью средних, вычисляемых на отрезке, который перемещается вдоль временного ряда, как бы скользит по нему. Задается длина отрезка скольжения (2m + 1) по временной оси, т.е. берется нечетное число наблюдений. Подбирается полином
|
p |
|
τt = |
ak tk |
(12.1) |
k=0
к группе первых (2m + 1) членов ряда, и этот полином используется для определения значения тренда в средней (m + 1)-й точке группы. Затем производится сдвиг на один уровень ряда вперед и подбирается полином того же порядка к группе точек, состоящей из 2-го, 3-го , . . . , (2m + 2)-го наблюдения. Находится значение тренда в (m + 2)-й точке и т.д. тем же способом вдоль всего ряда до последней группы из (2m + 1) наблюдения. В действительности нет необходимости строить полином для каждого отрезка. Как будет показано, эта процедура эквивалентна нахождению линейной комбинации уровней временного ряда с коэффициентами,
392 |
Глава 12. Сглаживание временного ряда |
которые могут быть определены раз и навсегда и зависят только от длины отрезка скольжения и степени полинома.
Для определения коэффициентов a0, a1, . . . , ap полинома (12.1) с помощью МНК по первым (2m + 1) точкам минимизируется функционал:
|
m |
|
ε = |
(xt − a0 − a1t − . . . − aptp)2. |
(12.2) |
t=−m
Заметим, что t принимает условные значения от −m до m. Это весьма удобный прием, существенно упрощающий расчеты. Дифференцирование функционала
по a0, a1, . . . , ap |
дает систему из p + 1 уравнения типа: |
|
|
|||
|
m |
m |
m |
m |
|
m |
a0 |
tj + a1 |
t=−m |
tj+1 + a2 |
tj+2 + · · · + ap |
tj+p = |
xttj , |
|
t=−m |
t=−m |
t=−m |
|
t=−m |
j = 0, 1, . . . , p. (12.3)
Решение этой системы уравнений относительно неизвестных параметров
a0, a1, . . . , ap (i = 0, 1, . . . , 2p) облегчается тем, что все суммы m − ti при
t= m
нечетных i равны нулю. Кроме того, т. к. полином, подобранный по 2m + 1 точкам, используется для определения значения тренда в средней точке, а в этой точке t = 0, то, положив в уравнении (12.1) t = 0, получаем значение тренда, равное a0. Стало быть, задача сглаживания временного ряда сводится к поиску a0.
Система нормальных уравнений (12.3), которую нужно разрешить относительно a0, разбивается на две подсистемы: одну — содержащую коэффициенты с четными индексами a0, a2, a4, . . ., другую — включающую коэффициенты с нечетными индексами a1, a3, a5, . . .. Решение системы относительно a0 зависит от численных значений ti и линейных функций от x типа
В итоге, значением тренда в центральной точке отрезка будет средняя арифметическая, взвешенная из значений временного ряда от x−m до xm c весовыми коэффициентами βt, которые зависят от значений m и p:
|
m |
a0 = |
βtxt. |
|
t=−m |
Указанная формула применяется для всех последующих отрезков скольжения, с вычислением значений тренда в их средних точках.
Продемонстрируем рассматриваемый метод на примере полинома второй степени и длины отрезка скольжения, равной пяти точкам. Здесь надо свести к минимуму сумму:
2
ε = (xt − a0 − a1t − a2t2)2.
t=−2