Добавил:

ivanov666 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Национальный исследовательский ядерный университет (МИФИ)

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Назаметдинов Анализ данных 2012

.pdf

Скачиваний:

Добавлен:

12.11.2022

Размер:

5.66 Mб

Скачать

☆

<<< < Предыдущая 5 6 7 8 9 10 11 12 13 14 15 16 17 1819 / 2919 20 21 22 23 24 25 26 27 28 29 > Следующая >>>

вида yt gt ut , содержащие детерминированный тренд gt и ста-

ционарный процесс ut. Говорят, что ряд yt является стационарным

относительно детерминированного тренда gt, иначе TS-рядом

(trend stationary), если ряд y t – g t является стационарным. Рассмотренные выше модели АРСС применялись, по сути дела, к TSпроцессам.

Ко второму типу относят ряды, содержащие стохастический

тренд. Ярким примером такого процесса являются «случайные блуждания» (random walk):

y t = y t - 1 + εt . (7.41)

С использованием оператора сдвига модель (7.41) принимает вид

				εt
			yt	εt	εt εt 1 ... εt j .	(7.41’)
			yt	1 B	εt εt 1 ... εt j .	(7.41’)
				1 B	j 0
					j 0
Из (7.41’)			видно,	что процесс (7.41) расходящийся,		посколь-

ку σ y	2 σε	2	. Характеристическое уравнение этого процесса
	j 1

имеет корень, равный единице, т.е. имеет место пограничный случай, когда корень характеристического уравнения оказался на границе единичной окружности. В то же время, если перейти к первым разностям ut yt yt yt 1 , то процесс ut окажется стацио-

нарным – ut εt . Существуют процессы, для которых стационар-

ными оказываются разности более высокого порядка.

Временной ряд yt называется интегрированным порядка d (обозначается I(d)), если ни сам ряд, ни его разности yt, 2 yt,…,

d 1 yt не являются TS-рядом, тогда как разность d yt порядка d обладает свойством стационарности. Заметим, что I(0) соответствует исходному стационарному ряду.

Интегрированные ряды образуют класс разностно-стацио-

нарных, иначе DS-рядов (differencе stationary).

Пусть нестационарный авторегрессионный оператор aH (B) в модели АРСС имеет один или несколько корней, равных единице,

181

т.е. речь идет о DS-ряде, интегрированном порядка d. Иными словами, aH (B) является нестационарным оператором авторегрессии

порядка p+d; d корней уравнения a H (B )=0 равны единице, а остальные р корней лежат вне единичного круга. Тогда можно записать, что

aH (B) a(B)(1 B)d ,

где a(B) – стационарный оператор авторегрессии порядка р (с корнями λ вне единичного круга).

Используя оператор разности

yt yt yt 1 = (1-B)yt,

нестационарный процесс АРСС порядка d можно записать как

a(B) d yt b(B)εt .

(7.42)

Для разности xt порядка d , т.е. xt d yt , модель

a(B)xt b(B) t

описывает уже стационарный обратимый процесс АРСС(р, q).

Для того чтобы от ряда разностей вернуться к исходному ряду,

требуется оператор S, обратный : S 1 (1 B) 1 B j .

j 0

Этот оператор называют оператором суммирования, поскольку S y t = y t + y t - 1 + y t - 2 + … . Если же исходной является разность порядка d, то для восстановления исходного ряда понадобится d- кратная итерация оператора S, иначе d-кратное суммирование (интегрирование). Поэтому процесс (7.42) принято называть процессом АРИСС либо АРПСС (ARIMA – в англоязычной литературе),

добавляя к АРСС термин интегрированный либо проинтегрированный. Кратко модель (7.42) записывают как АРИСС(р,d,q), где р –

порядок авторегрессии, d – порядок разности, q – порядок скользящего среднего. Ясно, что при d = 0 модель АРИСС переходит в модель АРСС.

На практике d обычно не превышает двух, т.е. d 2.

Модель АРИСС допускает представление, аналогичное общей линейной модели, а также в виде «чистого» процесса авторегрес-

182

сии (бесконечного порядка). Рассмотрим, к примеру, процесс АРИСС (1, 1, 1):

(1 aB)(1 B) yt (1 bB)εt .

(7.43)

Из (7.43) следует, что

t (1 aB)(1 B) [1 (1 a)B aB2 ] (1 bB b2 B2 ...) yt

1bB

[1 (1 a b)B (b a)(1 b)B2 (b a)(1 b)B3 ...] yt .

Отсюда

yt [a (1 b)] yt 1 (b a)(1 b) yt 2 (b a)(1 b)byt 3 ... εt .(7.44)

Проверка гипотезы о наличии единичного корня

Для проверки гипотезы о наличии единичного корня может быть использован тест Дики−Фуллера (Dickey-Fuller), далее DF-

тест [19]. Рассматриваются простейшее авторегрессионное уравне-

ние и две его модификации:
yt ayt 1		εt ,	(7.45a)
yt	ayt 1	b εt ,	(7.45б)
yt	ayt 1	b ct εt .	(7.45в)

Заметим, что модель (7.45б) при а =1 принято называть моделью случайных блужданий с дрейфом. Расписывая рекуррентное выражение (7.45б) от начального значения у0, получаем выражение

yt y0 bt i

i 1

для процесса с линейным трендом и растущей дисперсией.

В DF-тесте проверяются нулевая Н0: а=1 (уравнение содержит

единичный корень – процесс случайных блужданий) и альтернативные гипотезы Н1. Для уравнения (7.45а) Н1: |a|< 1 (ряд стационарный); для уравнения (7.45б) – Н1: |a |<1 и b 0 (процесс АР(1) с

ненулевым постоянным членом); для уравнения (7.45в) Н1 означает авторегрессионный процесс первого порядка АР(1) с ненулевым постоянным членом и детерминированным линейным трендом.

Процедура проверки следующая [19]. По результатам наблюдений методом наименьших квадратов оценивается то или иное урав-

183

нение из (7.45а)–(7.45в) и вычисляется статистика tDF = (aˆ 1) / saˆ ,

которая сравнивается затем с критическими значениями теста Ди- ки–Фуллера (табл. 7.2). Н0 отвергается, если расчетное значение t- статистики меньше критического значения. Заметим, что использование t-статистики здесь некорректно, поскольку при а =1 она не подчиняется распределению Стьюдента.

На практике часто предпочитают работать с рядом разностей, так что гипотезу Н0 формулируют в виде yt εt . Альтернативные гипотезы принимают вид

yt kyt 1 b ct εt ,

где k=а-1, b=c=0 для уравнения (7.45а); с=0 – для (7.45б).
ˆ	/ s ˆ .
Статистика Дики–Фуллера запишется теперь как tDF= k	/ s ˆ .
	k

Данная статистика оказывается применимой для тестирования гипотезы о неединственности единичного корня. Если Н0-гипотеза не отвергается для первых разностей, то переходят к разностям

второго порядка 2 yt yt yt 1 .

В качестве объясняющей переменной выступает yt 1 . Если по

результатам нового теста Н0 отвергается, то принимается гипотеза о единственности единичного корня. Иначе можно говорить о наличии как минимум двух единичных корней. В этом случае переходят к разностям третьего порядка и так далее.

				Таблица 7.2
Уровень		Размер выборки
значимости	25	50	100
		Уравнение (а)
0,01	-2,66	-2,62	-2,60	-2,58
0,05	-1,95	-1,95	-1,95	-1,95
		Уравнение (б)
0,01	-3,75	-3,58	-3,51	-3,43
0,05	-3,00	-2,93	-2,89	-2.86
		Уравнение (в)
0,01	-4,38	-4,15	-4,04	-3,96
0,05	-3,60	-3,50	--3,45	-3,41

184

7.11. Прогнозирование по модели АРИСС

Как уже отмечалось, процессы АРИСС допускают представление в виде обобщенной линейной модели (7.16).

Пусть в текущий момент времени t мы хотим найти будущее (прогнозное) значение ряда в момент t+τ (τ>0). Естественно искать его в виде

	1
yt c j εt j c j εt j c j εt j .
j 0	j 0	j

Ожидаемое значение yt+τ, обозначаемое как yt (τ) , есть

1
yt ( ) = M[ yt ] c j M[εt j ] c j M[εt j ] .
j 0	j

Первая сумма в правой части последнего соотношения содержит лишь будущие возмущения, и для них математическое ожидание равно нулю по определению. Что же касается второго слагаемого, то возмущения здесь уже состоялись, так что

M[εt j ] εt j ,	j τ .
Таким образом,

yt (τ) = c j εt j .	(7.46)
j

Ошибка прогноза, представляющая расхождение между прогнозным значением и его ожиданием есть

		1
ut (τ) yt	yt (τ) c jεt j .
		j 0
Дисперсия ошибки отсюда есть
σ2ut ( ) M[(u (τ))2	] 1 c2	c2	... c2	σ2 .	(7.47)
t	1	2	1	ε

Заметим, что формула (7.47) получена в предположении, что коэффициенты модели (7.16) не содержат ошибок и механизм, порождающий ряд, не изменится к моменту t+τ.

Прогнозирование по соотношению (7.46) затруднительно, поскольку требует знания всех прошлых возмущений. К тому же ско-

185

рость затухания c j часто оказывается недостаточной, не говоря уже о нестационарных процессах, для которых ряды c j расходятся.

Поскольку модель АРИСС допускает и другие представления, рассмотрим возможности их использования для прогнозирования.

Пусть модель задана непосредственно разностным уравнением

yt =a1 yt - 1 +a2 yt - 2 +…+a p + d yt - ( p + d ) –b1 εt 1 –…– bq εt q + εt . (7.48)

По	известным значениям ряда (результатам наблюдений)
~ ~	~	и оцененным значениям возмущений	εˆt ,εˆt 1,...,
yt , yt 1	,..., yt ( p d )

εˆ t q , опираясь на рекуррентную формулу (7.48), можно оценить

ожидаемое значение ряда в момент t+1:
ˆ	~	~	~	ˆ	ˆ
yt (1)	a1 yt a2 yt 1		... ap d yt ( p d ) b1εt ... bqεt 1 q . (7.49)

При прогнозировании на два такта вновь используем рекуррентное соотношение (7.48), где в качестве наблюденного значения ряда в момент t+1 следует взять предсказанную по (7.49) величину

ˆ	, т.е.	ˆ	~	, и так далее.
yt (1)	, т.е.	yt (1)	yt 1	, и так далее.

Оценка (7.47) является лишь нижней границей «прогностической силы» модели. На практике стараются набрать некоторую статистику прогнозов. Для этого исходную выборку объема N разбивают на две: рабочую (начальную t = 1,2,…, N1) и контрольную (начальную t = N1+1,. N1+2,…, N). Оценки параметров модели получают по рабочей выборке, оценку точности прогнозов получают по контрольной выборке. Пусть прогноз осуществляется на τ тактов (τ <N – N 1 ). Модель пересчитывается N – N 1 – τ раз. При каждом пересчете объем рабочей выборки прирастает на один такт, либо остается неизменным (выборка при этом сдвигается вправо на такт):

t = 2,3,…, N1+1; t=3,4,…, N1+2;…; t = τ , τ +1,…,N–τ+1.

Для оценки точности прогнозов используется в основном среднее значение суммы квадратов отклонений прогнозных значений ряда от фактических.

186

7.12.Технология построения моделей АРИСС

Описанные выше теоретические схемы строились в предположении, что временной ряд имеет бесконечную предысторию, тогда как реально исследователю доступен ограниченный объем наблюдений. Поэтому с позиций практического применения теории анализа временных рядов определяющее значение имеют вопросы корректной спецификации модели АРИСС( p , d , q ) (ее идентификации) и последующего оценивания ее параметров.

Идентификация модели

Цель идентификации – получить некоторое представление о величинах p, d, q и о параметрах модели. Идентификация модели распадается на две стадии:

1.Определение порядка разности d исходного ряда yt .

2.Идентификация модели АРСС для ряда разностей d yt .

Основной инструмент, используемый на обеих стадиях – автокорреляционная и частная автокорреляционная функции. Если автокорреляционная функция затухает медленно и почти линейно, то это свидетельствует о нестационарности процесса. В этом случае от исходного ряда переходят к разностям. Считается, что порядок разности d, обеспечивающий стационарность, достигнут тогда, ко-

гда автокорреляционная функция процесса ut d yt падает до-

вольно быстро. На практике обычно d <3 .

После того как будет получен стационарный ряд разностей порядка d, изучают общий вид автокорреляционной и частной автокорреляционной функций этих разностей. Опираясь на теоретические свойства этих функций можно выбрать значения p и q для АР и СС операторов.

Далее при выбранных p и q строятся начальные оценки параметров авторегрессии a =( a 1 , a 2 , … , a p ) и скользящего среднего b =(b 1 ,b 2 ,… , b q ). Для авторегрессионных процессов используются уравнения Юла−Уокера, где теоретические автокорреляции заменены на их выборочные оценки. Для процессов скользящего среднего порядка q только первые q автокорреляций отличны от нуля (см.7.37). Заменяя ri их выборочными оценками rˆ и решая

187

получающиеся уравнения относительно b1,b2 ,...,bq , получим оцен-

ку b . Эти предварительные оценки можно использовать как начальные значения для получения на следующих шагах более эффективных оценок.

Для смешанных процессов АРСС процедура оценивания услож-

няется. Так, для рассмотренного процесса АРСС(1,1) параметры a1 и b1, точнее их оценки, получаются из (7.40) с заменой r1 и r2 их

выборочными оценками.

В общем случае вычисление начальных оценок процесса АРСС(p,q) представляет многостадийную процедуру. Отметим только, что для практики особый интерес имеют АР и СС процессы 1-го и 2-го порядков и простейший смешанный процесс АРСС(1,1).

Об адекватности оцененной модели судят по остаткам, которые согласно предпосылкам при больших N являются белым шумом.

Заметим, что оценки автокорреляций, на основе которых строятся процедуры идентификации, могут иметь большие дисперсии (особенно в условиях недостаточного объема выборки – несколько десятков наблюдений) и быть сильно коррелированны. Поэтому говорить о строгом соответствии теоретической и эмпирической автокорреляционных функций не приходится. Это приводит к затруднениям при выборе p, d, q, поэтому для дальнейшего исследования могут быть выбраны несколько моделей.

Для сравнения моделей между собой предложен ряд критериев. Наибольшее распространение получили два из них: информацион-

ный критерий Акаике (AIC) и байесовский информационный критерий Шварца (SBIC). Оба критерия представляют сумму двух сла-

гаемых, первое из которых зависит от остаточной суммы квадратов

sˆ 2 , второе – моделирует штраф за уменьшение числа степеней свободы из-за включения в модель дополнительных параметров:

AIC ln sˆ2 2 p q ; SBIC ln sˆ2 ln N p q .

N N

Критерий Шварца в отличие от критерия Акаике обеспечивает состоятельность оценок, но проигрывает последнему с точки зрения их эффективности.

188

Предпочтение отдается модели с меньшим значением критерия.

7.13. Нелинейные по возмущениям модели

Рассмотренные выше линейные модели оказываются нередко неприемлемыми при описании реальных процессов. Так, в финансовых рядах случайные отклонения от трендовой составляющей часто идут сериями то с большим размахом («возмущенный рынок»), то с малым («спокойный рынок»), образуя тем самым «сгу-с- тки», кластеры, на графике ряда. Для описания подобного рода процессов используются модели авторегрессионной условной гетероскедастичности (ARCH-модели). Эти модели существенно опираются на понятие условной дисперсии.

Пусть 2	D[u	u	,...,u	] M[u2	u	,...,u	] – условная дис-
Пусть 2	D[u	u	,...,u	] M[u2	u	,...,u	] – условная дис-
t	t	t 1	t p	t	t 1	t p

персия случайного компонента u ряда (остатков после исключения детерминированной составляющей). Полагают, что условная дисперсия текущего момента зависит от предыстории следующим образом:

σ2

a u2

... a

(7.50)

1 t 1

t p

Значения ut описываются при этом моделью

u ε

a u2

... a

) 2

(7.51)

1 t 1

t p t p

где εt – гауссовский белый шум, т.е. εt

N 0, 1 .

Модель (7.50)-(7.51) называют авторегрессионной условно гетероскедастичной моделью порядка р и обозначают ARCH(p).

Заметим, что безусловная дисперсия процесса (7.51) является

неизменной для любого момента времени. Проиллюстрируем это утверждение на примере модели ARCH(1):

	ut εt (a0 a1ut2 1)1 2 .					(7.52)
Возведя (7.52) в квадрат, выражая ut2 1 через					ut2 2	, ut2 2 – через
u 2	и так далее, получаем: u2	a (ε2	a ε2	a2ε2		...) . Учиты-
t 3	t	0 t	1 t 1		1 t 2

вая центрированность и некоррелированность элементов бе-лого шума, получаем:

189

D[ut ] M[ut2 ] a0	(1 a1) при условии		a1		1.

Проверка ut на гетероскедастичность производится следующим образом: оценивается регрессия

ut2 b0 b1 ut2 1 ... bput2 p vt ,

с последующим тестированием гипотезы H0: b0=b1=…bp=0. Дальнейшим обобщением является обобщенная авторегресси-

онная условно гетероскедастичная модель порядка (p,q) – обозна-

чается GARCH(p,q), в которой ряд				ut2		и его условная дисперсия
описываются с помощью процесса АРСС(p,q):
σ2	a	a u2	... a u2		b σ2		... b σ2	.
t	0	1 t 1	p t p			1 t 1	q t q

Для оценки ARCH/GARCH-моделей используется метод максимального правдоподобия.

Вопросы и упражнения.

1.Какое свойство является определяющим в дефиниции временного ряда?

2.В чем состоит различие между моментными и интервальными временными рядами?

3.Какие типы рядов рассматриваются в данном пособии?

4.Какие научные дисциплины занимаются изучением процессов, протекающих во времени?

5.Какую модель тренда следует использовать, если постоянным сохраняется: а) абсолютный прирост исследуемой переменной; б) относительный прирост?

6.Какая гипотеза относительно поведения ряда лежит в основе логистической кривой?

7.Чем чревато использование высоких степеней в полиномиальных моделях тренда?

8.Гауссовский случайный процесс сгладили методом скользящего среднего с шириной окна, равной 7. Тот же процесс сгладили

190

<<< < Предыдущая 5 6 7 8 9 10 11 12 13 14 15 16 17 1819 / 2919 20 21 22 23 24 25 26 27 28 29 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
12.11.20221.82 Mб30Морозов Введение в теорию горячей плазмы Ч.1 2011.pdf
#
12.11.20221.9 Mб13Морозов Введение в теорию горячей плазмы Част2 2013.pdf
#
12.11.20223.45 Mб6Морозов Скхемные решения и принтсипы работы пассивныкх систем 2015 (1).pdf
#
12.11.20223.45 Mб8Морозов Скхемные решения и принтсипы работы пассивныкх систем 2015.pdf
#
12.11.202212.8 Mб2Муравев Инженерная олимпиада школников 2016.pdf
#
12.11.20225.66 Mб10Назаметдинов Анализ данных 2012.pdf
#
12.11.2022982.63 Кб6Наумов Современные проблемы философии науки 2011.pdf
#
12.11.20221.98 Mб76Наумов Физические основы безопасности ядерных реакторов 2013.pdf
#
12.11.20224.79 Mб30Никитенко Нестационарные процессы переноса и 2011.pdf
#
12.11.2022820.93 Кб9Никифоров Лабораторныы практикум по курсу Взаимосвяз открытыкх систем 2015.pdf
#
12.11.20221.04 Mб0Никова Тхе Басиц Иссуес оф Манагемент ин Усе 2016.pdf