Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Эконометрика Введение в регрессионный анализ временных рядо - Носко В.П..pdf
Скачиваний:
261
Добавлен:
24.05.2014
Размер:
3.23 Mб
Скачать

Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru

12

 

для параметров

aj

, т.е. aˆk j , j = 1, …, p, а по вторым – оценки

ˆ

для bj , j = 1, …, q.

b j

Соответственно, оценками полиномов a(z), b(z) служат

 

 

 

p

j

,

q ˆ

j

,

 

 

a(z) = aˆ j z

 

b(z) = bj z

 

 

 

 

j = 0

 

 

j = 0

 

 

 

 

и с помощью оцененных полиномов получаем оценку для инноваций

ˆ1

(L) aˆ(L) xt ,

 

 

 

 

εˆt = b

 

 

 

 

на основании которой строим уточненную оценку для дисперсии инноваций

~1 T ~

σp2, q = T t =1εt2 .

При этом предполагается, что сами инновации, зная точно коэффициенты ARMA

модели, можно найти по формуле

ε

t

= b1(L) a(L) x

что соответствует обратимости

этой модели.

 

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

В качестве

оценок для

p0 ,

q0

 

берется пара

значений

~ ~

которой

 

(p, q ), при

минимизируется величина

 

 

 

 

 

 

 

 

~2

~2

lnT

.

 

 

 

 

 

 

SIC(σ p, q )= lnσ p, q + ( p + q)

T

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~2

 

 

 

 

 

и q , когда

p p0 , q

Существенно, что SIC(σ p, q ) возрастающая функция от p

q0 , что ведет к состоятельности оценок (~p, q~).

3.2. Оценивание коэффициентов модели

После того как произведена идентификация (стационарной) модели ARMA, т.е. на основании имеющихся наблюдений принято решение о значениях p, q в модели ARMA(p, q), порождающей данные, переходят к этапу оценивания коэффициентов модели. На этом этапе обычно используется метод максимального правдоподобия, который в конечном счете сводится к методу наименьших квадратов. За исключением некоторых наиболее простых случаев (например, модели AR(1)), эта задача решается итерационными методами, требующими задания некоторых “начальных” (“стартовых”) значений параметров, которые затем последовательно уточняются.

В качестве таких начальных значений можно использовать предварительные оценки, полученные на первом этапе. Такие начальные значения можно найти, приравнивая неизвестные “истинные” значения автокорреляций ρ(k) значениям r(k) выборочной автокорреляционной функции и используя функциональную связь между значениями ρ(k) и значениями коэффициентов модели. Например, если оценивается модель AR(p), то коэффициенты a1, …, ap определяются из системы первых p уравнений Юла – Уокера

ρ(k) = p

a j ρ(k j), k = 1,K, p ,

j =1

 

www.iet.ru/mipt/2/text/curs_econometrics.htm

Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru

13

 

в которые вместо неизвестных значений ρ(1), …, ρ(p) автокорреляций подставляются наблюдаемые (вычисляемые по реализации ряда) значения r(1), …, r(p) выборочных автокорреляций.

При оценивании моделей с MA(q) составляющей (q > 0) существенным оказывается условие обратимости, сформулированное в разд. 2.5. Покажем это на примере MA(1) модели

Xt µ = εt + t–1 , t = 1, … , T .

Имея наблюдаемые значения x1, x2, … , xT , мы последовательно выражаем ε1, ε2, … , εT через эти значения и (ненаблюдаемое) значение ε0 :

ε1 = X1 µ – bε0 ,

ε2 = X2 µ – bε1 = X2 µ – b(X1 µ – bε0) = (X2 µ) – b(X1 µ) + b2 ε0,

εT = XT µ – bεT – 1 = (XT µ) – b(XT – 1µ) + b2(XT – 2µ)

+(1)T1 b T – 1 (X1 µ) + (1)T b T ε0 .

Максимизация (по b) условной функции правдоподобия, соответствующей наблюдаемым значениям x1, x2, … , xT при фиксированном значении ε0 , равносильна минимизации суммы квадратов

Q(b) = ε12 + ε22 + … + εT2 ,

которая является нелинейной функцией от b . Для поиска минимума этой суммы квадратов приходится использовать численные итерационные методы оптимизации, которые, в свою очередь, требуют задания начального (“стартового”) значения параметра b . Как мы уже говорили, такое стартовое значение может быть получено на этапе идентификации модели. Однако полученное в итоге итераций “оптимальное” значение b зависит от неизвестного нам значения ε0 , что затрудняет интерпретацию результатов. Задача интерпретации облегчается, если выполнено условие обратимости ‌ b ‌< 1, и при этом значение ‌b ‌существенно меньше 1.

Действительно, при выполнении этого условия можно просто положить ε0 = 0 . Эффект от такой замены истинного значения ε0 на нулевое быстро убывает, так что сумма квадратов, получаемая в предположении ε0 = 0, может служить хорошей аппроксимацией для суммы, получаемой при истинном значении ε0 , при достаточно большом количестве наблюдений. Те же аргументы пригодны и для модели MA(q) с q > 1 : в этом случае можно положить ε0 = ε1 = … = ε q +1 = 0 . Для получения более

точной аппроксимации, в пакетах статистических программ (в том числе и в EVIEWS) предусмотрена процедура (backcasting) , в которой процесс итераций включает в себя также и оценивание значений ε0 , ε1 , … , ε q +1 путем построения для них “обратного

прогноза”.

Если в результате оценивания получена модель, в которой условие обратимости не выполняется, рекомендуется повторить процедуру оценивания с использованием другого набора начальных значений.

Более подробное изложение процедур оценивания стационарных ARMA моделей методом максимального правдоподобия можно найти, например, в книге [Hamilton (1994)]. Там же можно прочитать о том, каким образом вычисляются приближения для стандартных ошибок оценок коэффициентов этих моделей, которые можно использовать при большом количестве наблюдений обычным образом.

В заключение необходимо только сделать одно важное замечание. Пусть мы имеем стационарную AR(p) модель

a(L) Xt = δ + εt .

www.iet.ru/mipt/2/text/curs_econometrics.htm

Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru

14

 

Мы уже говорили о том, что в этом случае математическое ожидание µ процесса Xt связано с константой δ соотношением

µ =

δ

 

 

 

.

(1a a

2

−K− a

p

)

 

1

 

 

 

При этом можно сначала оценить коэффициенты a1, … , ap и δ , применяя обычный метод наименьших квадратов к модели

Xt = δ + a1 Xt–1 + a2 Xt–2 + … + ap Xt–p + εt ,

а затем, используя полученные оценки aˆ1, ..., aˆ p и δˆ , получить оценку для µ в

виде

µˆ =

 

 

δˆ

 

 

 

.

(1

aˆ

aˆ

2

−K− aˆ

p

)

 

 

1

 

 

 

 

Однако можно поступить и иначе, как это предусмотрено, например, в пакете EVIEWS (Econometric Views), используемом нами в последующих примерах. Именно, мы можем записать ту же модель в виде

Xt = µ (1 – a1 – a2 – ap) + a1 Xt–1 + a2 Xt–2 + … + ap Xt–p + εt

и одновременно оценивать и a1, … , ap и µ . Такая процедура теоретически более эффективна. Однако в такой форме модель оказывается нелинейной по параметрам, и это обстоятельство, как и при оценивании MA моделей, требует применения нелинейного метода наименьших квадратов (NLLS – nonlinear least squares) и численных итерационных методов оптимизации.

Пример

Рассмотрим данные о годовом потреблении рыбных продуктов в США (на душу населения, в фунтах).

946

0.8

 

956

0.4

947

0.3

 

957

0.2

948

1.1

 

958

0.6

949

0.9

 

959

0.9

950

1.8

 

960

0.3

951

1.2

 

961

0.7

952

1.2

 

962

0.6

 

11.4

 

 

 

953

 

 

963

0.7

954

1.2

 

964

0.5

www.iet.ru/mipt/2/text/curs_econometrics.htm

Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru

15

 

955

0.5

 

965

 

0.9

 

 

 

 

 

 

График этого ряда:

 

 

 

 

 

 

12.0

 

 

 

 

 

 

 

 

 

 

11.5

 

 

 

 

 

 

 

 

 

 

11.0

 

 

 

 

 

 

 

 

 

 

10.5

 

 

 

 

 

 

 

 

 

 

10.0

 

 

 

 

 

 

 

 

 

 

46

48

50

52

54

56

58

60

62

64

 

 

 

 

 

 

X

 

 

 

 

Коррелограмма, построенная по этим данным, имеет вид

Autocorrelati

 

Partial

 

 

 

 

 

 

 

 

 

on

 

Correlation

 

 

 

 

C

 

 

PAC

Q-Stat

Prob

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.

|***

.

|***

 

 

 

 

 

 

 

 

 

4

 

 

 

 

 

 

.429

 

 

.429

.2694

.039

.

|***

.

|**

 

 

 

 

 

 

 

 

 

7

 

 

 

 

 

 

.366

 

 

.222

.5350

.023

.

| .

**| .

 

 

 

 

 

 

 

-

7

 

 

 

 

 

 

.059

 

 

0.204

.6255

.054

.

| .

.

| .

 

 

 

 

 

 

 

-

7

 

 

 

 

 

 

.016

 

 

0.034

.6324

.106

 

*| .

*| .

 

 

 

 

 

-

-

8

 

 

 

 

 

 

0.156

 

 

0.129

.3498

.138

**| .

**| .

 

 

 

 

 

-

-

1

 

 

 

 

 

 

0.255

 

 

0.195

0.393

.109

***| .

*| .

 

 

 

 

 

-

-

1

 

 

 

 

 

 

0.321

 

 

0.123

3.879

.053

. *| .

.

|*

 

 

 

 

 

-

 

 

1

 

 

 

 

 

 

0.133

 

 

.175

4.523

.069

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ориентируясь на указанные ранее приближенные критерии, прежде всего найдем значение 2/√T = 2/√20 = 0.447. Из полосы ± 0.447 не выходит ни одна из выборочных автокорреляций и частных автокорреляций. Поэтому с точки зрения этих критериев, мы не должны отвергать гипотезу о том, что наблюдаемый ряд порождается моделью

MA(0)

X0 = µ + εt .

С другой стороны, если ориентироваться на критерий Люнга – Бокса, то пик ACF на лаге 1 является статистически значимым. Это означает, что в качестве потенциальных моделей порождения данных можно предварительно рассматривать модели AR(1) и MA(1). Таким образом, мы сталкиваемся здесь с конфликтной ситуацией: статистические выводы, получаемые при использовании разных критериев, не соответствуют друг другу. Подобная ситуация не является чем-то исключительным и достаточно часто встречается при идентификации модели, порождающей наблюдаемый ряд, тем более, что используемые критерии – асимптотические, тогда как обычно в распоряжении исследователя имеется не слишком большое количество наблюдений.

www.iet.ru/mipt/2/text/curs_econometrics.htm

Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru

16

 

Последнее обстоятельство связано в значительной степени с тем, что для многих экономических рядов периоды, на которых порождающая ряд модель может считаться стационарной, обычно непродолжительны из-за изменения общей экономической обстановки, в которой эволюционирует рассматриваемый ряд. Это соображение можно легко проиллюстрировать на примере того же самого ряда данных о потреблении рыбных продуктов в США, если привлечь дополнительно статистические данные за период с 1940 по 1945 годы (годы Второй мировой войны). Эволюция ряда на расширенном периоде с 1940 по 1965 годы представлена следующим графиком:

12

 

 

 

 

 

 

 

 

 

 

 

 

11

 

 

 

 

 

 

 

 

 

 

 

 

10

 

 

 

 

 

 

 

 

 

 

 

 

9

 

 

 

 

 

 

 

 

 

 

 

 

8

 

 

 

 

 

 

 

 

 

 

 

 

7

 

 

 

 

 

 

 

 

 

 

 

 

40

42

44

46

48

50

52

54

56

58

60

62

64

 

 

 

 

 

 

 

X

 

 

 

 

 

Провал траектории ряда в 1942 – 1944 г.г. не позволяет трактовать этот ряд как стационарный на всем периоде с 1940 по 1965 годы. Поэтому мы продолжаем далее рассматривать значения ряда только на послевоенном периоде – с 1946 по 1965 г.г.

Если остановиться на модели AR(1), то для нее, как мы знаем, ρ(1) = a1. Поэтому приравнивая неизвестное значение ρ(1) значению r(1) = 0.429, мы получаем предварительную оценку для неизвестного значения a1. В то же время, производя непосредственное оценивание модели AR(1) с ненулевым математическим ожиданием нелинейным методом наименьших квадратов, получаем следующие результаты.

Dependent Variable: X

Method: Least Squares Sample(adjusted): 1947 1965

Included observations: 19 after adjusting endpoints Convergence achieved after 3 iterations

Variable

 

Coef

Std.

t-

Pro

 

.

Error

Statistic

b.

 

 

 

 

 

 

C

 

10.8

0.159

67.90

0.0

 

1451

261

445

000

AR(1)

 

0.43

0.219

1.963

0.0

 

0515

257

522

662

 

 

 

 

 

R-squared

 

0.18

Mean dependent

10.

 

4864

var

 

 

81053

Adjusted

R-

0.13

S.D.

dependent

0.4

squared

6915

var

 

 

25434

S.E.

of

0.39

Akaike

info

1.0

regression

5238

criterion

 

80645

Sum squared

2.65

Schwarz criterion

1.1

resid

5627

 

 

 

80060

В данной ситуации уточненная оценка практически совпадает с предварительной

оценкой для a1 .

ρ(1) = b1/(1 + b12).

Если же остановиться на модели MA(1), то в такой модели

Приравнивание неизвестного значения ρ(1) значению r(1) =

0.429 приводит к

уравнению b1/(1 + b12) = 0.429. Корни последнего уравнения равны 0.567 и 1.704.

www.iet.ru/mipt/2/text/curs_econometrics.htm

Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru

17

 

Первый корень соответствует обратимой MA(1) модели; второй корень соответствует необратимой MA(1) модели. Уточненное оценивание MA(1) модели с использованием обратного прогноза (backcasting) дает следующие результаты.

Dependent Variable: X

Method: Least Squares Sample: 1946 1965 Included observations: 20

Convergence achieved after 13 iterations Backcast: 1945

Variable

 

Coef

Std.

 

t-

Pro

 

 

.

Error

Statistic

b.

 

 

 

 

 

 

 

C

 

10.8

0.113

 

95.39

0.0

 

 

1379

355

726

 

000

MA(1)

 

0.28

0.228

 

1.230

0.2

 

 

0610

102

195

 

345

 

 

 

 

 

R-squared

 

0.11

Mean dependent

10.

 

 

7961

var

 

 

81000

Adjusted

R-

0.06

S.D.

dependent

0.4

squared

 

8959

var

 

 

14094

S.E.

of

0.39

Akaike

info

1.0

regression

 

9561

criterion

 

 

97739

Sum squared

2.87

Schwarz criterion

1.1

resid

 

3684

 

 

 

97313

Log likelihood

-

F-statistic

 

2.4

 

 

8.977395

 

 

 

07257

Durbin-Watson

1.78

Prob(F-statistic)

0.1

stat

 

9895

 

 

 

38178

В этом случае уточненное значение коэффицента b1 существенно отличается от предварительной оценки этого коэффициента. Отметим также большое отличие P- значений для t- и F-статистик в отношении значимости коэффициента b1 . Это можно объяснить тем, что величина стандартной ошибки вычисляется согласно асимптотической процедуре, тогда как в нашем распоряжении имеется всего лишь 20 наблюдений.

Если не производить обратного прогнозирования значения инновации для 1945 года, то результаты получаются близкими:

Dependent Variable: X

Method: Least Squares Sample: 1946 1965 Included observations: 20

Convergence achieved after 24 iterations Backcast: OFF

Variable

 

Coef

Std.

t-

Pro

 

ficient

Error

 

Statistic

b.

 

 

 

 

 

 

C

 

10.8

0.112

96.06

0.0

 

1515

582

 

431

000

MA(1)

 

0.27

0.229

1.195

0.2

 

4024

231

 

405

474

 

 

 

 

 

R-squared

 

0.11

Mean dependent

10.

 

6800

var

 

 

81000

Adjusted

R-

0.06

S.D.

dependent

0.4

www.iet.ru/mipt/2/text/curs_econometrics.htm