Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Ведение в социально - экономическую статистику. Учебник. Новосибирск, 2004. 739 с

.pdf
Скачиваний:
43
Добавлен:
22.08.2013
Размер:
4.02 Mб
Скачать

11.10 Оптимальное в среднеквадратическом смысле прогнозирование 383

где

 

γ0

γ1

· · ·

γt−1

Γt =

γ1

γ0

· · ·

γt−2

.

. .

.

 

.

 

.

.

 

 

.

 

.

.

 

 

. .

 

γt−1

γt−2 · · ·

γ0

— автоковариационная матрица ряда (x1, . . . , xt), а вектор γt,τ составлен из ковариаций xt+τ с (x1, . . . , xt), т.е.

γt,τ = (γt+τ −1, . . . , γτ ) .

Можно заметить, что автоковариации здесь нужно знать только с точностью до множителя. Например, их можно заменить автокорреляциями.

Рассмотрим теперь прогнозирование на один шаг вперед. Обозначим через γt вектор, составленный из ковариаций xt+1 с (x1, . . . , xt), т.е. γt = (γt, . . . , γ1) = = γt,1 . Прогноз задается формулой:

t

xt(1) = x Γt 1γt = x αt = αti xt−i.

i=1

Прогноз по этой формуле можно построить только если матрица Γt неособенная. Коэффициенты αti , минимизирующие средний квадрат ошибки прогноза, задаются нормальными уравнениями Γtα = γt или, в развернутом виде,

t

αti γ|k−i| = γk, k = 1, . . . , t.

i=1

Ошибка прогноза равна

η = xt+1 − xt(1).

Применив (11.20), получим, что средний квадрат этой ошибки равен

E η2 = γ0 − γt Γt 1γt.

Заметим, что γ0 − γt Γt 1γt = |Γt+1| / |Γt|, т.е предыдущую формулу можно переписать как

E η2 = |Γt+1| / |Γt| .

(11.22)

384

Глава 11. Основные понятия в анализе временных рядов

Действительно, матрицу Γt+1 можно представить в следующей блочной форме:

Γt

γt

Γt+1 =

.

γt

γ0

По правилу вычисления определителя блочной матрицы имеем:

|

Γ

= γ

γt Γ1

γt

|

Γ

.

t+1|

0

t

 

t|

 

Если |Γt+1| = 0, т.е. если матрица Γt+1 вырождена, то средний квадрат ошибки прогноза окажется равным нулю, т.е. оптимальный линейный прогноз будет безошибочным. Процесс, для которого существует такой безошибочный линейный прогноз, называют линейно детерминированным.

Укажем без доказательства следующее свойство автоковариационных матриц: если матрица Γt является вырожденной, то матрица Γt+1 также будет вырожденной.

Отсюда

следует, что на основе конечного отрезка стационарного ряда

(x1, . . . , xt)

можно сделать безошибочный линейный прогноз на один шаг впе-

ред в том и только в том случае, если автоковариационная матрица Γt+1 является вырожденной ( |Γt+1| = 0).

Действительно, пусть существует безошибочный линейный прогноз. Возможны два случая: |Γt| = 0 и |Γt| = 0. Если |Γt| = 0, то средний квадрат ошибки прогноза равен |Γt+1| / |Γt|, откуда |Γt+1| = 0, если же |Γt| = 0, то из этого также следует

|Γt+1| = 0.

Наоборот, если |Γt+1| = 0, то найдется s ( s t) такое, что |Γs+1| = 0, но |Γs| = 0. Тогда можно сделать безошибочный прогноз для xt+1 на основе (x1+t−s, . . . , xt), а, значит, и на основе (x1, . . . , xt).

При использовании приведенных формул на практике возникает трудность, связанная с тем, что обычно теоретические автоковариации γk неизвестны. Требуется каким-то образом получить оценки автоковариаций. Обычные выборочные автоковариации ck здесь не подойдут, поскольку при больших k (сопоставимых с длиной ряда) они являются очень неточными оценками γk . Можно предложить следующий подход11:

1)Взять за основу некоторую параметрическую модель временного ряда. Пусть

β— соответствующий вектор параметров. Рассчитать теоретические автоковариации для данной модели в зависимости от параметров: γk = γk (β).

11Этот подход, в частности, годится для стационарных процессов ARMA. В пункте 14.8 дается альтернативный способ прогнозирования в рамках модели ARMA.

11.10 Оптимальное в среднеквадратическом смысле прогнозирование 385

2)Оценить параметры на основе имеющихся данных. Пусть b — соответствующие оценки.

3)Получить оценки автоковариаций, подставив b в формулы теоретических автоковариаций: γk ≈ γk(b).

4)Использовать для прогнозирования формулу (11.21), заменяя теоретические автоковариации полученными оценками автоковариаций.

11.10.4.Прогнозирование по полной предыстории. Разложение Вольда

Можно распространить представленную выше теорию на прогнозирование ряда в случае, когда в момент t известна полная предыстория Ωt = (xt, xt−1 , . . . ). Можно определить соответствующий прогноз как предел прогнозов, полученных на основе конечных рядов (xt, xt−1, . . . , xt−j ), j = t, t − 1, . . . , −∞. Без доказательства отметим, что этот прогноз будет оптимальным в среднеквадратическом смысле. Если рассматривается процесс, для которого |Γt| = 0 t, то по аналогии с (11.22) средний квадрат ошибки такого прогноза равен

E η2

= lim

|Γt+1|

.

 

 

 

t→∞

|Γt|

 

Заметим, что всегда выполнено

0 <

|Γt+1|

|Γt|

, т.е. средний квадрат ошиб-

|Γt|

|Γt1|

ки не увеличивается с увеличением длины ряда, на основе которого делается прогноз, и ограничен снизу нулем, поэтому указанный предел существует всегда.

Существуют процессы, для которых |Γt| = 0 t, т.е. для них нельзя сделать безошибочный прогноз, имея только конечный отрезок ряда, однако

lim |Γt+1| = 0.

t→∞ |Γt|

Такой процесс по аналогии можно назвать линейно детерминированным. Его фактически можно безошибочно предсказать, если имеется полная предыстория процесса Ωt = (xt, xt−1, . . . ).

Если же данный предел положителен, то линейный прогноз связан с ошибкой: E η2 > 0. Такой процесс можно назвать регулярным.

Выполнены следующие свойства стационарных рядов.

A. Пусть xt — слабо стационарный временной ряд, и пусть ηt — ошибки одношагового оптимального линейного прогноза по полной предыстории процесса (xt−1, xt−2, . . .). Тогда ошибки ηt являются белым шумом, т.е. имеют нулевое ма-

386

Глава 11. Основные понятия в анализе временных рядов

тематическое ожидание, не автокоррелированы и имеют одинаковую дисперсию:

E (ηt) = 0, t,

E (ηsηt) = 0, при s = t,

E η2 = ση2, t.

B. Пусть, кроме того, xt является регулярным, т.е. E η2

= ση2 > 0. Тогда он

представим в следующем виде:

 

 

 

 

 

 

 

ψiηt−i + vt,

 

 

 

 

 

 

xt =

(11.23)

 

 

 

 

 

i=0

 

 

где ψ

= 1,

ψ2 <

; процесс

v здесь является слабо стационарным,

 

0

i=0

i

 

t

 

линейно детерминированным и не коррелирован с ошибками ηt: E (ηsvt) = 0 приs, t. Такое представление единственно.

Утверждения A и B составляют теорему Вольда. Эта теорема является одним из самых фундаментальных результатов в теории временных рядов. Утверждение B говорит о том, что любой стационарный процесс можно представить в виде так называемого линейного фильтра от белого шума12 плюс линейно детерминированная компонента. Это так называемое разложение Вольда.

Доказательство теоремы Вольда достаточно громоздко. Мы не делаем попытки его излагать и даже обсуждать; отсылаем заинтересованных читателей к гл. 7 книги Т. Андерсона [2].

Заметим, что коэффициенты разложения ψi удовлетворяют соотношению

ψi =

E (ηt−ixt)

=

E (ηt−ixt)

.

 

E η2

ση2

 

t−i

 

 

Для того чтобы это показать, достаточно умножить (11.23) на ηt−i и взять математическое ожидание от обеих частей.

Разложение Вольда имеет в своей основе прогнозирование на один шаг вперед. С другой стороны, если мы знаем разложение Вольда для процесса, то с помощью него можно делать прогнозы. Предположим, что в момент t делается прогноз на τ шагов вперед, т.е. прогноз величины xt+τ на основе предыстории Ωt = (xt, xt−1 , . . . ). Сдвинем формулу разложения Вольда (11.23) на τ периодов вперед:

xt+τ = ψiηt+τ −i + τt+τ . i=0

12Можно назвать первое слагаемое в 11.23 также процессом скользящего среднего бесконечного порядка MA(). Процессы скользящего среднего обсуждаются в пункте 14.4.

11.10 Оптимальное в среднеквадратическом смысле прогнозирование 387

Второе слагаемое, vt+τ , можно предсказать без ошибки, зная Ωt. Из первой суммы первые τ слагаемых не предсказуемы на основе Ωt. При прогнозировании их можно заменить ожидаемыми значениями — нулями. Из этих рассуждений следует следующая формула прогноза:

xt(τ ) = ψiηt+τ −i + τt+τ . i=τ

Без доказательства отметим, что xt(τ ) является оптимальным линейным прогнозом. Ошибка прогноза при этом будет равна

τ −1

ψiηt+τ −i.

i=0

Поскольку ηt — белый шум с дисперсией ση2 , то средний квадрат ошибки прогноза равен

τ −1

ση2 ψi2.

i=0

Напоследок обсудим природу компоненты vt. Простейший пример линейно детерминированного ряда — это, говоря неформально, «случайная константа»:

vt = ξ,

где ξ — наперед заданная случайная величина, Eξ = 0.

Типичный случай линейно детерминированного ряда — это, говоря неформально, «случайная синусоида»:

vt = ξ cos(ωt + ϕ),

где ω — фиксированная частота, ξ и ϕ — независимые случайные величины, причем ϕ имеет равномерное распределение на отрезке [0; 2π].

Это два примера случайных слабо стационарных рядов, которые можно безошибочно предсказывать на основе предыстории. Первый процесс можно моделировать с помощью константы, а второй — с помощью линейной комбинации синуса и косинуса:

αcos(ωt) + β sin(ωt).

Сточки зрения практики неформальный вывод из теоремы Вольда состоит

втом, что любые стационарные временные ряды можно моделировать при помощи моделей линейного фильтра с добавлением констант и гармонических трендов.

388

Глава 11. Основные понятия в анализе временных рядов

11.11. Упражнения и задачи

Упражнение 1

1.1.Дан временной ряд x = (5, 1, 1, −3, 2, 9, 6, 2, 5, 2) .

Вычислите среднее, дисперсию (смещенную), автоковариационную и автокорреляционную матрицы.

1.2.Для временного ряда y = (6, 6, 1, 6, 0, 6, 6, 4, 3, 2) повторите упражнение 1.1.

1.3.Вычислите кросс-ковариации и кросс-корреляции для рядов x и y из предыдущих упражнений для сдвигов 9, . . . , 0, . . . , 9.

1.4.Для временного ряда x = (7, −9, 10, −2, 21, 13, 40, 36, 67, 67) оцените параметры полиномиального тренда второго порядка. Постройте точечный и интервальный прогнозы по тренду на 2 шага вперед.

1.5.Сгенерируйте 20 рядов, задаваемых полиномиальным трендом третьего порядка τt = 5 + 4t −0.07t2 + 0.0005t3 длиной 100 наблюдений, с добавлением белого шума с нормальным распределением и дисперсией 20 .

Допустим, истинные значения параметров тренда неизвестны.

а) Для 5 рядов из 20 оцените полиномиальный тренд первого, второго и третьего порядков и выберите модель, которая наиболее точно аппроксимирует сгенерированные данные.

б) Для 20 рядов оцените полиномиальный тренд третьего порядка по первым 50 наблюдениям. Вычислите оценки параметров тренда и их ошибки. Сравните оценки с истинными значениями параметров.

в) Проведите те же вычисления, что и в пункте (б), для 20 рядов, используя 100 наблюдений. Результаты сравните.

г) Используя предшествующие расчеты, найдите точечные и интервальные прогнозы на три шага вперед с уровнем доверия 95%.

1.6.Найдите данные о динамике денежного агрегата M0 в России за 10 последовательных лет и оцените параметры экспоненциального тренда.

1.7.Ряд x = (0.02, 0.05, 0.06, 0.13, 0.15, 0.2, 0.31, 0.46, 0.58, 0.69, 0.78, 0.81,

0.95, 0.97, 0.98) характеризует долю семей, имеющих телевизор. Оцените параметры логиcтического тренда.

1.8.По ряду x из упражнения 3 рассчитайте ранговый коэффициент корреляции Спирмена и сделайте вывод о наличии тенденции.

11.11 Упражнения и задачи

 

 

 

 

 

 

 

 

389

 

 

 

 

Таблица 11.1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Расходы на рекламу

10

100

50

200

 

20

70

100

50

300

80

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Объем продаж

1011

1030

1193

1149

 

1398

1148

1141

1223

1151

1576

 

 

 

 

 

 

 

 

 

 

 

 

 

1.9.Дан ряд:

x = (10, 9, 12, 11, 14, 12, 17, 14, 19, 16, 18, 21, 20, 23, 22, 26, 23, 28, 25, 30) .

а) Оцените модель линейного тренда. Остатки, полученные после исключения тренда, проверьте на стационарность с использованием рангового коэффициента корреляции Спирмена.

б) Рассчитайте для остатков статистику Бартлетта, разбив ряд на 4 интервала по 5 наблюдений. Проверьте однородность выборки по дисперсии.

в) Рассчитайте для остатков статистику Голдфельда—Квандта, исключив 6 наблюдений из середины ряда. Проверьте однородность выборки по дисперсии. Сравните с выводами, полученными на основе критерия Бартлетта.

1.10.По данным таблицы 11.1 оцените модель распределенного лага зависимости объема продаж от расходов на рекламу с лагом 2 .

Определите величину максимального лага в модели распределенного лага, используя различные критерии ( t-статистики, F -статистики, информационные критерии).

Задачи

1.Перечислить статистики, использующиеся в расчете коэффициента автокорреляции, и записать их формулы.

2.Чем различается расчет коэффициента автокорреляции для стационарных и нестационарных процессов? Записать формулы.

3.Вычислить значение коэффициента корреляции для двух рядов:

x = (1, 2, 3, 4, 5, 6, 7, . . . ) и y = (2, 4, 6, 8, 10, 12, 14, . . . ).

4.Посчитать коэффициент автокорреляции первого порядка для ряда x = (2, 4, 6, 8) .

5.Есть ли разница между автокорреляционной функцией и трендом автокорреляции?

390

Глава 11. Основные понятия в анализе временных рядов

6.Записать уравнения экспоненциального и полиномиального трендов и привести формулы для оценивания их параметров.

7.Записать формулу для оценки темпа прироста экспоненциального тренда.

8.Привести формулу логистической кривой и указать особенности оценивания ее параметров.

9.Оценить параметры линейного тренда для временного ряда x = (1, 2, 5, 6) и записать формулу доверительного интервала для прогноза на 1 шаг вперед.

10.Дан временной ряд: x = (1, 0.5, 2, 5, 1.5). Проверить его на наличие тренда среднего.

11.Пусть L — лаговый оператор. Представьте в виде степенного ряда следующие выражения:

а)

 

2

; б)

 

1, 5

; в)

2.8

; г)

3

.

 

0.8L

 

0.9L

1 + 0.4L

 

1

1

 

 

1 + 0.5L

Рекомендуемая литература

1.Айвазян С.А. Основы эконометрики. Т.2. — М.: «Юнити», 2001.

2.Андерсон Т. Статистический анализ временных рядов. — М.: «Мир», 1976. (Гл. 1, 3, 7).

3.Бокс Дж., Дженкинс Г. Анализ временных рядов. Прогноз и управление. Вып. 1. — М.: «Мир», 1974. (Гл. 1).

4.Кендалл М. Дж., Стьюарт А. Многомерный статистический анализ и временные ряды. — М.: «Наука», 1976. (Гл. 45–47).

Маленво Э. Статистические методы эконометрии. Вып. 2. — М.: «Статистика», 1976. (Гл. 12).

5.Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика — начальный курс. — М.: «Дело», 2000. (Гл. 12).

6.Enders Walter. Applied Econometric Time Series. — Iowa State University, 1995. (Ch. 1).

7.Mills Terence C. Time Series Techniques for Economists, Cambridge University Press, 1990 (Ch. 5).

8.Wooldridge Jeffrey M. Introductory Econometrics: A Modern Approach, 2nd ed., Thomson, 2003 (Ch. 10).

Глава 12

Сглаживание временного ряда

12.1. Метод скользящих средних

Одним из альтернативных по отношению к функциональному описанию тренда вариантов сглаживания временного ряда является метод скользящих или, как еще говорят, подвижных средних.

Суть метода заключается в замене исходного временного ряда последовательностью средних, вычисляемых на отрезке, который перемещается вдоль временного ряда, как бы скользит по нему. Задается длина отрезка скольжения (2m + 1) по временной оси, т.е. берется нечетное число наблюдений. Подбирается полином

 

p

 

τt =

ak tk

(12.1)

k=0

к группе первых (2m + 1) членов ряда, и этот полином используется для определения значения тренда в средней (m + 1)-й точке группы. Затем производится сдвиг на один уровень ряда вперед и подбирается полином того же порядка к группе точек, состоящей из 2-го, 3-го , . . . , (2m + 2)-го наблюдения. Находится значение тренда в (m + 2)-й точке и т.д. тем же способом вдоль всего ряда до последней группы из (2m + 1) наблюдения. В действительности нет необходимости строить полином для каждого отрезка. Как будет показано, эта процедура эквивалентна нахождению линейной комбинации уровней временного ряда с коэффициентами,

m t=−m
m t=−m
xttj .

392

Глава 12. Сглаживание временного ряда

которые могут быть определены раз и навсегда и зависят только от длины отрезка скольжения и степени полинома.

Для определения коэффициентов a0, a1, . . . , ap полинома (12.1) с помощью МНК по первым (2m + 1) точкам минимизируется функционал:

 

m

 

ε =

(xt − a0 − a1t − . . . − aptp)2.

(12.2)

t=−m

Заметим, что t принимает условные значения от −m до m. Это весьма удобный прием, существенно упрощающий расчеты. Дифференцирование функционала

по a0, a1, . . . , ap

дает систему из p + 1 уравнения типа:

 

 

 

m

m

m

m

 

m

a0

tj + a1

t=−m

tj+1 + a2

tj+2 + · · · + ap

tj+p =

xttj ,

 

t=−m

t=−m

t=−m

 

t=−m

j = 0, 1, . . . , p. (12.3)

Решение этой системы уравнений относительно неизвестных параметров

a0, a1, . . . , ap (i = 0, 1, . . . , 2p) облегчается тем, что все суммы m − ti при

t= m

нечетных i равны нулю. Кроме того, т. к. полином, подобранный по 2m + 1 точкам, используется для определения значения тренда в средней точке, а в этой точке t = 0, то, положив в уравнении (12.1) t = 0, получаем значение тренда, равное a0. Стало быть, задача сглаживания временного ряда сводится к поиску a0.

Система нормальных уравнений (12.3), которую нужно разрешить относительно a0, разбивается на две подсистемы: одну — содержащую коэффициенты с четными индексами a0, a2, a4, . . ., другую — включающую коэффициенты с нечетными индексами a1, a3, a5, . . .. Решение системы относительно a0 зависит от численных значений ti и линейных функций от x типа

В итоге, значением тренда в центральной точке отрезка будет средняя арифметическая, взвешенная из значений временного ряда от x−m до xm c весовыми коэффициентами βt, которые зависят от значений m и p:

 

m

a0 =

βtxt.

 

t=−m

Указанная формула применяется для всех последующих отрезков скольжения, с вычислением значений тренда в их средних точках.

Продемонстрируем рассматриваемый метод на примере полинома второй степени и длины отрезка скольжения, равной пяти точкам. Здесь надо свести к минимуму сумму:

2

ε = (xt − a0 − a1t − a2t2)2.

t=2

Соседние файлы в предмете Политология