Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Назаметдинов Анализ данных 2012

.pdf
Скачиваний:
10
Добавлен:
12.11.2022
Размер:
5.66 Mб
Скачать

Определенные сложности представляет проблема выбора постоянной сглаживания. В значительной мере этот выбор определяется целями исследования и конкретными свойствами ряда. Если сглаживание проводится с целью прогнозирования, то наилучшее значение α будет зависеть от горизонта, иначе срока, прогнозирования τ. Для краткосрочных (конъюнктурных) прогнозов более актуальной является свежая информация, тогда как при больших τ желательно ослабить влияние конъюнктурных колебаний и в большей мере учитывать прошлые данные, увеличивая тем самым период ретроспекции. Введем понятие возраста данных, считая, что текущее наблюдение имеет возраст, равный нулю, возраст предыдущего наблюдения равен единице и так далее. В качестве среднего значения tср возраста данных примем сумму возрастов с весами, использованными для подсчета сглаженной величины:

 

 

 

 

 

tср (1 β) jβ j

β

 

β

.

1- β

 

j 0

 

α

 

 

 

 

Чем меньше α, тем больше средний возраст данных. Подбор конкретного значения α обычно осуществляют экспериментально среди возможных значений перебором на сетке от 0,1 до 0,9 с шагом 0,1. Используемый критерий здесь – минимум суммы квадратов отклонений между наблюденными и прогнозными значениями ряда. Напомним, что в соответствии с моделью ряда (7.2) ожидаемое прогнозное значение ряда на момент t+τ есть сглаженное значение ряда на момент t, т.е. Myt aˆt .

Экспоненциальное сглаживание высоких порядков

Обобщим метод экспоненциального сглаживания на случай, когда модель процесса определяется линейной функцией a+bt [13]. Как и прежде, при заданном минимизируется

SR ( yt j a bj)2 β j . j 0

(Здесь для удобства представления знаки и опущены.)

151

 

 

 

SR

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 ( yt j a bjj 0 ,

 

 

 

a

 

 

 

 

 

 

 

 

 

 

j

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

SR

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 ( yt j a bj) jβ j 0 .

 

 

 

 

 

 

 

b

 

 

 

 

 

j 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j

a (1 β)b jβ

j

0;

(1 β) yt jβ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

yt

 

 

 

j jβ

j

a

 

 

 

j

b

 

 

 

 

2

 

j

0.

 

 

 

 

 

 

 

 

 

 

jβ

 

 

 

 

j β

 

С учетом того что

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

jβ j

 

 

 

β

 

 

,

 

j2β j

 

β(1+ β)

,

 

(1- β)

2

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(1- β)

получаем

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(1 β) yt jβ

j

a b

 

β

 

 

0;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(1- β)

 

 

 

 

 

 

 

 

 

 

 

 

yt j jβ

j

 

 

 

 

β(1+ β)

 

 

 

 

 

 

 

2

 

 

 

 

 

 

(1 β)

 

 

 

a b

 

 

 

 

 

0.

 

 

 

 

1- β

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Процедуру вычисления

St

(1 β) yt jβ j

можно рассматри-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j

0

 

 

 

 

 

 

 

 

 

 

 

вать как сглаживание 1-го порядка. По аналогии строят сглаживание 2-го порядка:

StII (1 β)(St βSt 1 β2St 2 ...)

(1 β)2 ( yt βyt 1 β2 yt 2 ...

βyt 1 β2 yt 2 ...

β2 yt 2 ...)

(1 β)2 yt j ( j 1)β j (1 β)2 ( yt j jβ j yt jβ j )

(1 β)2 yt j jβ j (1 β)St .

Система уравнений примет вид:

152

 

 

St at

β

bt 0;

 

 

 

 

 

1- β

 

 

 

 

 

 

 

 

 

 

 

 

 

 

β(1+ β)

 

S II (1 β)S

 

a β

b 0.

 

 

 

t

 

t

 

t

1- β t

 

 

 

 

 

 

 

 

 

Решая последнюю систему относительно аt

и bt, получим:

 

 

a 2S S II

;

b

1- β

(S II

S

) .

 

 

 

 

 

 

 

t

t

t

 

 

 

t

 

 

 

β

 

t

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Далее

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

St (1 β) yt St 1β ;

 

 

 

 

S II

(1 β)S S II

β (1 β)2 y S

t 1

(1 β)β S II

β

;

t

t

t 1

 

 

 

 

 

 

 

t

 

 

t 1

 

 

 

a

 

2S

t

 

1

S II

;

 

 

 

 

 

 

t 1

 

 

 

 

 

t 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a a

 

b

 

 

(1 β2 )u ;

 

 

 

 

 

t

t 1

 

t 1

 

 

 

 

 

t

 

 

 

 

 

 

b b

(1 β)2 u

 

,

 

 

 

 

 

 

t

 

 

t 1

 

 

 

 

 

 

t

 

 

 

 

 

где ut yt (at 1 bt 1 1) – ошибка прогноза по линейной модели

на один такт вперед.

Рассмотренную выше процедуру можно обобщить на случай

полиномиальных трендов более высокого порядка (на практике не выше второго: y t = a 0 + a 1 t + a 2 t 2 ).

В описанных выше моделях содержался единственный параметр экспоненциального сглаживания β = 1 – α . Однопараметрические модели предложены Брауном. Кроме модели Брауна известно несколько вариантов многопараметрических адаптивных моделей. Так, для линейно изменяющегося процесса часто используется двухпараметрическая модель Хольта, в которой оценка коэффициентов производится следующим образом:

at α1 yt (1 α1)(at 1 bt 1); bt α2 (at at 1) (1 α2 )bt 1 ,

где α1 и α2 − параметры экспоненциального сглаживания, лежащие в диапазоне от 0 д о 1 . Адаптивность модели к новым данным наглядно видна, если ее переписать в виде:

153

at at 1 bt 1 α1ut ; bt bt 1 α1α2ut ,

где ut yt (at 1 bt 1 1) – ошибка прогноза на один такт вперед.

7.5. Анализ сезонной компоненты

Рассмотрим сначала процедуру оценивания сезонных эффектов. Пусть исходный ряд является полностью аддитивным, т.е.

y t = g t + s t + u t .

Необходимо оценить st по наблюденным yt. Иными словами, необходимо получить оценки cˆi коэффициентов cˆi , i 1,2,..., ин-

дикаторной модели.

Как уже отмечалось, сезонный эффект проявляется на фоне тренда, поэтому вначале необходимо оценить трендовую состав-

ляющую одним из рассмотренных методов. Затем для каждого сезона i, i=1,2,..,τ вычисляют все относящиеся к нему разности

~

ˆ

 

~

ˆ

~

ˆ

~

 

ˆ

yi gi ,

yi gi ,

yi 2 gi 2 , ,

yi k

gi k ,

где, как обычно,

~

 

 

 

 

 

 

– оцененное

yi – наблюденное значение ряда, gˆi

значение тренда.

Каждая из этих разностей дает совместную оценку сезонного эффекта и случайной компоненты.

Производя усреднение полученных разностей, получают оценки эффектов. Полагая, что исходный ряд содержит целое число k периодов сезонности и ограничиваясь простым средним, имеем

ˆ

1

k

~

ˆ

 

 

 

 

ci

k

( yi gi ).

 

i 1

 

 

С учетом условия репараметризации, требующим, чтобы сумма сезонных эффектов равнялась нулю, получаем скорректированные

оценки c i cˆi 1 cˆi .i 1

154

В случае мультипликативного сезонного эффекта, когда модель

ряда имеет вид yt gt

st ut , вычисляют уже не разности, а отно-

 

~

 

 

 

 

 

 

 

шения

yi l

, i=1,2,…,τ, l=1,2,…,k.

 

 

 

 

gˆi l

 

 

 

 

 

 

В качестве оценки сезонного индекса ci выступает среднее

 

 

ˆ

1

k

~

 

 

 

 

l 1

yi l

i 1,2,...,τ .

 

 

ci

 

 

,

 

 

k

gˆi l

На практике считается, что для оценки сезонных эффектов временной ряд должен содержать не менее пяти-шести периодов сезонности.

Перейдем теперь к способам удаления сезонного эффекта из ряда. Таких способов два. Первый из них назовем «послетрендовый». Он является логическим следствием рассмотренной выше процедуры оценивания. Для аддитивной модели удаление сезонной компоненты сводится к вычитанию оцененной сезонной компоненты из исходного ряда. Для мультипликативной модели значения ряда делят на соответствующие сезонные индексы.

Второй способ не требует предварительной оценки ни трендовой, ни сезонной компонент, а основывается на использовании разностных операторов.

Разностные операторы

При исследовании временных рядов часто имеется возможность представить детерминированные функции времени простыми рекуррентными уравнениями. Рассмотрим, к примеру, линейный тренд

g t = a 0 + a 1 t .

(7.4)

Для предыдущего момента t-1 можно записать:

 

gt-1 = a0 + a1(t–1) = a0 + a1 t – a1 = gt – a1.

 

Отсюда

 

gt gt 1 a1 .

(7.5)

Учитывая, что соотношение (7.5) справедливо и для моментов

t-2 и t-1, так что a 1 = g t - 1 – g t - 2 , (7.5) можно записать и в виде

 

g t = g t - 1 + g t - 1 g t - 2 =2 g t - 1 g t - 2 .

(7.6)

155

Модель (7.6) не содержит явно параметров, описывающих тренд. Более компактно введенные преобразования можно описать, используя операторы взятия разности назад:

gt gt gt 1 ,

2 gt ( gt ) (gt gt 1) (gt 1 gt 2 ) a1 a1 gt 2gt 1 gt 2 0.

Из последнего соотношения получаем (7.6). Легко видеть, что раз-

ность порядка d исключает из ряда полиномиальный тренд порядка d-1 (см.п.7.4.2).

Пусть теперь ряд содержит сезонный эффект с периодом , так

что

 

 

st st .

(7.7)

Процедура перехода от

ряда yt

(t = 1,2,...,T) к ряду

τ yt yt yt (t τ 1, τ 2, ,T ) называется взятием первой се-

зонной разности, а оператор

сезонным разностным опера-

 

 

 

тором с периодом . Из (7.7) следует, что

 

 

τ st 0 .

 

Выходит, взятие сезонной разности τ yt

исключает из времен-

ного ряда yt детерминированную сезонную компоненту.

Иногда оказываются полезными сезонные операторы более высоких порядков. Так, сезонный оператор второго порядка с периодом есть

τ 2 yt τ ( τ yt ) τ ( yt yt τ ) yt 2yt τ yt .

Если ряд содержит и тренд, и сезонную составляющую, их можно исключить, последовательно применяя операторы и τ .

Легко показать, что порядок применения этих операторов не существенен:

τ yt ( yt yt τ ) ( yt yt 1) ( yt yt τ 1) τ yt .

Отметим также, что детерминированная часть ряда, состоящая из тренда и сезонной компоненты, после применения операторов

и τ полностью вырождается, т.е. τ yt 0 . Однако записав последнее уравнение в рекуррентной форме, получаем:

156

y t = y t - τ + (y t - 1 y t - τ - 1 ).

Из этого соотношения видно, каким образом ряд можно неограниченно продолжать, имея вначале по крайней мере +1 последовательных значения.

Заметим, исключение тренда и сезонного эффектов как послетрендовым методом, так и взятием разностей искажает случайную составляющую ряда (см. эффект Слуцкого−Юла и п. 7.4.2).

Для рядов с сезонным эффектом предложен ряд адаптивных моделей. Приведем две из них [18]. Модель Тейла−Вейджа предполагает аддитивный сезонный эффект на фоне линейного тренда. Модель ряда имеет вид:

yt gt st ut ; gt gt 1 bt ,

где bt – коэффициент изменения трендовой составляющей. Обозначим ради единообразия gt через at.

Обновление параметров происходит по схеме экспоненциального сглаживания путем взвешенного суммирования текущих значений ряда и прошлых оценок:

ˆ

 

~

ˆ

(1

 

ˆ

ˆ

1) ;

at α( yt

st )

α)(at 1

bt

 

ˆ

 

ˆ ˆ

 

(1

ˆ

 

 

bt β(at at 1)

β)bt 1 ;

 

ˆ

~

ˆ

 

ˆ

0 α, β, γ 1.

st

γ( yt at ) (1 γ)st ,

Модель Уинтерса предназначена для рядов с линейным трендом и мультипликативным сезонным эффектом. Прогноз ожидае-

мого значения ряда

yˆk (t) , сделанный в момент t на k тактов впе-

ред, вычисляется как

 

 

 

 

 

 

 

ˆ

ˆ

ˆ ˆ

 

 

 

 

 

yk (t) (at

kbt )st τ k ,

где

ˆ

~

ˆ

(1

ˆ

ˆ

 

at

α yt

st τ

α)(at 1 bt 1) ;

 

ˆ

~

ˆ

 

ˆ

 

 

 

s(t) β yt / a0

(t) (1 β)st τ ;

 

 

ˆ

ˆ

ˆ

 

ˆ

0 α, β, γ 1 .

 

bt γ(at at 1)

(1 γ)bt 1,

Оценки параметров α, β, γ подбирают эмпирически по минимуму суммы квадратов отклонений наблюденных и предсказанных значений.

157

7.6. Линейные модели случайной составляющей временного ряда

Для удобства изложения условимся обозначать здесь случайные величины так, как это принято в математической статистике – строчными буквами.

Случайным процессом X(t) на множестве Т называют функцию, значения которой случайны при каждом t T. Если элементы Т счетные (дискретное время), то случайный процесс часто называют

случайной последовательностью.

Полное математическое описание случайного процесса предпо-

лагает задание системы функций распределения:

 

 

для каждого t T

 

 

Ft (x) = P ( X ( t ) ≤ x ),

 

(7.8)

для каждой пары элементов t1 ,t2 T

 

 

Ft1 ,t2 (x1, x2 ) P(X (t1) x1, X (t2 ) x2 ) ,

(7.9)

и вообще для любого конечного числа элементов t1,t2,…,tN T

n

 

 

Ft1 ,t2 ,...tn (x1, x2 ,...xn ) P ( X (ti ) xi ) .

(7.10)

i 1

 

 

Функции (7.8), (7.9), (7.10) называют конечномерными распределениями случайного процесса.

Построить такую систему функции для произвольного случайного процесса практически невозможно. Обычно случайные процессы задают с помощью априорных предположений о его свойствах, таких как независимость приращений, марковский характер траекторий и т.п.

Процесс, у которого все конечномерные распределения нормальны, называется нормальным (гауссовским). Оказывается, что для полного описания такого процесса достаточно знания одно- и двумерного распределений (7.8), (7.9), что важно с практической точки зрения, поскольку позволяет ограничиться исследованием математического ожидания и корреляционной функцией процесса.

В теории временных рядов используется ряд моделей случайной составляющей, начиная от простейшей – «белого шума», до весьма

158

сложных типа авторегрессии-скользящего среднего и других, которые строятся на базе белого шума.

Прежде чем определять процесс белого шума, рассмотрим последовательность независимых случайных величин, для которой функция распределения есть

Ft1,t2 ,...tn (x1, x2 ,...xn ) Ft1 (x1) Ft2 (x2 ) ... Ftn (xn ) .

Из последнего соотношения следует, что все конечномерные распределения последовательности определяются с помощью одномерных распределений.

Если к тому же в такой последовательности составляющие ее случайные величины X(t) имеют нулевое математическое ожидание и распределены одинаково при всех t T, то это – «белый шум». В случая нормальности распределения X(t) говорят о гауссовском белом шуме. Итак, гауссовский (нормальный) белый шум – после-

довательность независимых нормально распределенных случайных величин с нулевым математическим ожиданием и одинаковой (общей) дисперсией.

Более сложными моделями, широко используемыми в теории и практике анализа временных рядов, являются линейные модели: процессы скользящего среднего, авторегрессии и смешанные.

Процесс скользящего среднего порядка q X q (t) представляет собой конечную взвешенную сумму случайных возмущений:

X (t) εt b1εt 1 ... bqεt q ,

(7.11)

где εt, εt-1 εt-q – белый шум; b1,b2 ,...,bq – числовые коэффициенты.

Легко видеть из определения, что у процесса скользящего сред-

него порядка q (сокращенно CC(q)) статистически зависимыми являются (q+1) подряд идущих величин X(t), X(t-1),..., X(t-q).

Процессом авторегрессии порядка p (сокращенно АР(р))

называют взвешенную возмущенную сумму p прошлых значений

временного ряда

 

X(t)=a1 X(t-1)+a2 X(t-2)+…+ap X(t-p)+εt ,

(7.12)

где εt – белый шум, действующий в текущий момент t; a1,a2,…,ap

– числовые коэффициенты.

159

Выражая последовательно в соответствии с соотношением

(7.12) X(t-1) через X(t-2), . . . , X(t-p-1), затем X(t-2) через X(t-3), . .

. , X(t-p-2) и т.д. получим, что X(t) есть бесконечная сумма прошлых возмущений εt-1, εt-2, … . Из этого следует, члены процесса авторегрессии X(t) и X(t-k) статистически зависимы при любом k.

Процесс АР(1) часто называют процессом Маркова, АР(2) – процессом Юла. В общем случае марковским называют такой процесс, будущее которого определяется только его состоянием в настоящем и воздействиями на процесс, которые будут оказываться в будущем, тогда как его состояние до настоящего момента при этом несущественно. Формально сказанное можно выразить через условные вероятности следующим образом. Рассматривается произвольный момент времени t, t T. Пусть А – произвольное событие, связанное со значениями ряда X ( s ) , s < t , а В – произвольное событие, выраженное через случайные величины X ( s ) , s > t . Случайная последовательность X ( t ) , t T называется марковской, если для любых t,A,B

P(B X (t), A) P(B X (t)) .

Процесс АР(1)

X(t)=aX(t-1)+ ε t

является марковским, поскольку его состояние в любой момент t>t0 определяется через значения процесса εt, если известна величина X ( t 0 ) в момент t0. Формально процесс авторегрессии произвольного порядка Xp(t) также можно считать марковским, если его состо-

янием в момент t считать набор

(X(t), X(t-1), . . . , X(t-p-1)).

Более полно модели СС, АР, а также их композиция: модели авторегрессии-скользящего среднего (АРСС) рассматриваются далее (п.7.9). Заметим только, что все они представляются частными случаями общей линейной модели

X (t) εt c1εt 1 c2εt 2 ...,

(7.13)

где ci – весовые коэффициенты.

Среди моделей случайной составляющей выделим важный класс – стационарные процессы, такие, свойства которых не ме-

160