
Эконометрика / ЭТема4_лек1
.docВременные ряды в эконометрических исследованиях.
Большинство эконометрических моделей строится как динамические эконометрические модели. Это означает, что моделирование причинно-следственных связей между переменными осуществляется во времени, а исходные данные представлены в форме временных рядов.
Временной ряд Хt (t=1;n) – ряд значений какого-либо показателя за несколько последовательных промежутков времени.
Изучение взаимосвязей по временным рядам данных имеет ряд особенностей и требует специальных методов. Дело в том, что каждый временной ряд Хt складывается из следующих основных компонентов:
-
Тенденции, характеризующей общее направление динамики изучаемого явления. Аналитически тенденция выражается некоторой функцией времени, называемой трендом (Т).
-
Циклической или периодической компоненты, характеризующей циклические или периодические колебания изучаемого явления. Например: значения макроэкономических показателей зависят от того, в какой фазе бизнес-цикла находится экономика. Объем продаж некоторых товаров подвержен сезонным колебаниям (S).
-
Случайной компоненты, которая является результатом воздействия множества случайных факторов (Е).
Тогда уровень ряда можно представить как функцию от этих компонент: Х=f(T, K, S, E).
В зависимости от взаимосвязи между этими компонентами может быть построена либо аддитивная модель: Х=T+K+S+E, либо мультипликативная модель: Х=T*K*S*E ряда динамики.
Автокорреляция и ее последствия.
Автокорреляция – корреляционная связь между последовательными уровнями одного и того же ряда динамики (сдвинутыми на определенный промежуток времени L - лаг). Т.е. связь между рядом: X1, X2, ... Xn-L и рядом X1+L, X2+L,...,Xn, где L- положительное целое число. Автокорреляция может быть измерена коэффициентом автокорреляции:
rt,t-L =t=1+Ln((Xt-X’cp)*(Xt-L-X’’cp))/(t=1+Ln(Xt-X’cp)2*t=1+Ln( Xt-L-X’’cp)2), где X’cp, X’’cp – средние уровни ряда (X1+L, X2+L,..., Xn и ряда ) (X1, X2, ... Xn-L).
Лаг (сдвиг во времени) определяет порядок коэффициента автокорреляции. Если L=1, то имеем коэффициент автокорреляции 1-ого порядка rt,t-1, если L=2, то коэффициент автокорреляции 2-ого порядка rt,t-2 и т.д. Следует учитывать, что с увеличением лага на единицу, число пар значений, по которым рассчитывается коэффицеинт автокорреляции уменьшается на 1. (Для обеспечения достоверности полученных коэффициентов автокорреляции на практике следуют правилу: максимальный лаг должен быть не больше, чем n/4, где n – число уровней временного ряда.)
Рассчитав несколько коэффициентов автокорреляции, можно определить лаг (L), при котором автокорреляция (rt,t-L) наиболее высокая, выявив тем самым структуру временного ряда. Если наиболее высоким оказывается значение rt,t-1, то исследуемый ряд содержит только тенденцию. Если наиболее высоким оказался rt,t-L, то ряд содержит (помимо тенденции) колебания периодом L. Если ни один из rt,t-L не является значимым, можно сделать одно из двух предположений:
-
либо ряд не содержит тенденции и циклических колебаний, а его уровень определяется только случайной компонентой;
-
либо ряд содержит сильную нелинейную тенденцию, для выявления которой нужно провести дополнительный анализ.
Последовательность коэффициентов автокорреляции 1, 2 и т.д. порядков называют автокорреляционной функцией временного ряда. График зависимости значений коэффициентов автокорреляции от величины лага (порядка коэффициента автокорреляции) называют коррелограммой.
Пример: Пусть имеются данные предприятия об объемах выпуска некоторого товара по кварталам за 3 года в тыс.шт.:
Год |
1 |
2 |
3 |
|||||||||
Квартал |
1 |
2 |
3 |
4 |
1 |
2 |
3 |
4 |
1 |
2 |
3 |
4 |
Объем выпуска (Yt) |
410 |
400 |
715 |
600 |
585 |
560 |
975 |
800 |
765 |
720 |
1235 |
1100 |
Yt-1 |
410 |
400 |
715 |
600 |
585 |
560 |
975 |
800 |
765 |
720 |
1235 |
- |
Yt-2 |
410 |
400 |
715 |
600 |
585 |
560 |
975 |
800 |
765 |
720 |
- |
- |
Yt-3 |
410 |
400 |
715 |
600 |
585 |
560 |
975 |
800 |
765 |
- |
- |
- |
Yt-4 |
400 |
715 |
600 |
585 |
560 |
975 |
800 |
765 |
- |
- |
- |
- |
Yt-5 |
715 |
600 |
585 |
560 |
975 |
800 |
765 |
- |
- |
- |
- |
- |
Определим структуру данного временного ряда. Для этого рассчитаем коэффициенты автокорреляции 1, 2, 3, 4, 5 порядков.
Чтобы найти коэффициент корреляции 1-ого порядка нужно найти корреляцию между рядами (расчет производится не по 12, а по 11 парам наблюдений):
Yt=400 |
715 |
600 |
585 |
560 |
975 |
800 |
765 |
720 |
1235 |
1100 |
Yt-1=410 |
400 |
715 |
600 |
585 |
560 |
975 |
800 |
765 |
720 |
1235 |
Тогда коэффициент автокорреляции 1-ого порядка будет равен
rt,t-1=0,538.
Коэффициент корреляции 2-ого порядка между рядами:
Yt=715 |
600 |
585 |
560 |
975 |
800 |
765 |
720 |
1235 |
1100 |
Yt-2=410 |
400 |
715 |
600 |
585 |
560 |
975 |
800 |
765 |
720 |
будет равен rt,t-1=0,286 (расчет в данном случае производится не по 12, а по 10 парам наблюдений).
И т.д. Результаты расчета представим в виде таблицы коррелограммы:
Лаг (порядок) |
rt,t-L |
Коррелограмма |
1 |
0,538 |
**** |
2 |
0,286 |
* |
3 |
0,432 |
*** |
4 |
0,992 |
***** |
5 |
0,373 |
** |
Вывод: в данном ряду динамики имеется тенденция и периодические колебания с периодом равным 4.
Авторегрессия – зависимость среднего значения уровня -Y’cp ряда динамики (X1, X2, ... Xn-L) от величины уровня этого же ряда динамики, сдвинутого на L единиц времени, т.е. ряда (X1+L, X2+L,..., Xn). Наличие лага в зависимости между уровнями одного и того же ряда приводит к появлению моделей вида:
-
Yt=a+b1Xt+b2Xt-1+...+ut - модель с распределенным лагом.
-
Yt=a+b1Xt+b2Yt-1+...+ut – модель авторегрессии.
Чем плохо наличие автокорреляции и авторегрессии?
Становится невозможно применять метод наименьших квадратов (МНК) для оценки параметров тренда, т.к. одной из основных предпосылкой МНК является независимость уровней ряда (Xi).
Моделирование тенденции временного ряда (построение тренда).
Наиболее распространенный способ – аналитическое выравнивание, т.е. построение уравнения регрессии, характеризующего зависимсоть уровней ряда от временной переменной: T’=f(t).
При выборе кривой для выравнивания динамического ряда можно также воспользоваться методом конечных разностей, который основан на свойствах различных кривых, применяемых при выравнивании (обязательным условием является равенство интервалов между уровнями ряда).
Разностями первого порядка являются: ’i=Хi-Хi-1= Хiц.
Разностями второго порядка являются: ’’i= Хiц - Хi-1ц=Хi-Хi-1-Хi-1+Хi-2=Хi-2Хi-1+Хi-2.
Если общая тенденция выражается линейным уравнением Т’=а+b*t, тогда разности первого порядка постоянны (равны среднему абсолютному приросту), а разности второго порядка равны нулю.
Если тенденция выражается параболой второго порядка: T’=a+bt+ct2, то получим постоянными – вторые разности, нулевыми - третьи.
Порядок разностей (n), остающихся примерно равными друг другу, принимается за степень выравнивающего многочлена (T’=1n bi*ti).
Можно указать и ряд других признаков, которые могут помочь в выборе формы кривой: если примерно постоянными оказываются темпы роста, то для выравнивания применяется показательная функция: T’=a*bt; если первые разности имеют тенденцию уменьшаться с постоянным темпом (’i/’i-1=const<1), то следует остановиться на модифицированной экспоненте: T’= a+b*сt; если разности первого порядка имеют тенденцию к уменьшению с возрастающим темпом (’i+1<’i<’i-1 ’i/’i-1<’i+1/’i), следует использовать логарифмическую функцию: T’= a+b*lg t.
При выборе формы уравнения следует исходить из объема имеющейся информации. Чем больше параметров содержит уравнение, тем больше должно быть наблюдений при одной и той же степени надежности оценивания.
Выбор формы кривой может осуществляться и на основе принятого критерия, в качестве которого может служить сумма квадратов отклонений фактических значений, рассчитанных по уравнеию тренда. Из совокупности кривых выбирается та, которой соответствует минимальное значение критерия. Другим статистическим критерием является коэффициент множественной детерминации R2.
Расчет параметров уравнения тренда.
Расчет параметров при аналитическом выравнивании чаще всего производится с помощью метода наименьших квадратов (МНК). При этом поиск параметров для линейного уравнения тренда можно упростить, если отсчет времени производить так, чтобы сумма показателей времени изучаемого ряда динамики была равна нулю. То есть вводится новая условная переменная времени tiy, такая, что tiy =0.
При нечетном числе уровней ряда динамики для получения tiy=0 уровень, находящийся в середине ряда, принимается за условное начало отсчета времени (периоду или моменту времени, соответствующему данному уровню присваивается нулевое значение). Даты времени, расположенные левее этого уровня, обозначаются натуральными числами со знаком минус (-1 –2 –3 ...), а даты времени, расположенные правее этого уровня – натуральными числами со знаком плюс (1 2 3 ...). Например:
t |
1989 |
1990 |
1991 |
1992 |
1993 |
1994 |
1995 |
ty |
-3 |
-2 |
-1 |
0 |
1 |
2 |
3 |
Х |
20 |
25 |
26 |
34 |
30 |
35 |
37 |
Если число уровней ряда четное, периоды времени правой половины ряда (до середины) нумеруются –1, -3, -5 и т.д. А периоды нижней половины - +1, +3, +5 и.т.д. При этом Тi будет равна 0. Например:
t |
1990 |
1991 |
1992 |
1993 |
1994 |
1995 |
tiy |
-5 |
-3 |
-1 |
1 |
3 |
5 |
X |
25 |
26 |
34 |
30 |
35 |
37 |
Система нормальных уравнений (соответствующих МНК) преобразуется к виду:
Xi=aN
Xi* tiy =b* tiy 2
Отсюда параметры уравнения рассчитываются по формулам: b=Xi* tiy / tiy 2 a=Xi/N.
Правильность расчета уровней выравненного ряда может быть проверена следующим образом: Xi=T’i.
! Данный подход можно использовать, если уровни ряда - равноотстоящие.
Интерпретация параметров уравнения тренда.
T’=a+b*t – линейная форма уравнения тренда
a- уровень ряда за период (в момент) времени t=0;
b- средний абсолютный прирост уровня ряда за единичный промежуток времени.
T’=a*bt - показательная функция
a- уровень ряда за период (в момент) времени t=0;
b- средний коэффициент роста за единичный промежуток времени.
Построение модели временного ряда с сезонными колебаниями.
Процесс построения модели временного ряда (Хt), содержащего n уровней некоторого показателя за Z лет, включает следующие шаги:
-
выравнивание исходного ряда методом скользящей средней: среднее из последовательных m уровней ряда. Число усредняемых периодов обычно берут равным периоду колебаний L. Скользящая средняя относится к середине периода усреднения.
Если число усредняемых
уровней –m нечетное, то
,
где t=1+(m-1)/2;n-(m-1)/2.
Если число усредняемых
уровней –m четное, то
,
t=1+m/2;n+1-m/2. В этом случае скользящее
среднее необходимо центрировать,
т.е. рассчитать среднее из 2-ух
соседних скользящих средних: Xc’t=
(Xct+
Xct+1)/2.
2) расчет значений сезонной компоненты Si, i=1;m, где m– число сезонных компонент в году.
-
Устранение сезонной компоненты из исходных уровней ряда;
-
Аналитическое выравнивание уровней (построение тренда): Тt’=f(t);
-
Учет сезонной составляющей в выровненных уровнях ряда (Хt’).
-
Расчет абсолютной или относительной ошибки временного ряда (Еt).
Если полученные значения ошибок не содержат автокорреляции, ими можно заменить исходные уровни и в дальнейшем использовать временной ряд ошибок для анализа взаимосвязи исходного ряда и других временных рядов.
Рассмотрим построение аддитивной и мультипликативной моделей временных рядов на нашем примере с объемам продаж.
Построение аддитивной модели.
1 этап. Рассчитаем скользящую среднюю по 4-ем последовательным уровням (Xct) (Табл.2, столбец 3). Так как период усреднения четный, то вычислим центрированную скользящую среднюю (Xc’t) (Табл.2, столбец 5).
2 этап. Рассчитаем значение 4 –ех сезонных компонент (Si, i=1;4) (в общем случае, число сезонных компонент равно m=L). Для этого построим таблицу 3. Строки данной таблицы соответствуют сезонным компонентам, столбцы годам. А в теле таблицы находятся разности фактических значений уровней и выровненных методом скользящей средней: Xt- Xct (столбец 6 из табл.2). По этим данным рассчитываются средние оценки сезонных компонент по каждой строке (табл.3, столбец 5). Если сумма всех средних оценок равна нулю, то данные средние и будут окончательными значениями сезонных компонент. Если, как в нашем случае, их сумма не равна нулю (-46), то рассчитываюися скоректированные значения сезонных компонент вычитанием из средней оценки величины равной отношению суммы средних оценок сезонных компонент к их общему числу. В нашем примере эта величина равна –46/4=-11,64.
Таблица 2
t |
tу |
Xt |
Xct |
Xc’t |
Xt- Xct |
Xt-Si |
Tt |
Xt’ |
Et |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
1 |
-11 |
410 |
|
|
|
470,8594 |
445,727 |
384,8676 |
25,13238 |
2 |
-9 |
400 |
|
|
|
559,6094 |
499,004 |
339,3946 |
60,60538 |
3 |
-7 |
715 |
531,25 |
553,125 |
161,875 |
511,1719 |
552,281 |
756,1091 |
-41,1091 |
4 |
-5 |
600 |
575 |
595 |
5 |
583,3594 |
605,558 |
622,1986 |
-22,1986 |
5 |
-3 |
585 |
615 |
647,5 |
-62,5 |
645,8594 |
658,835 |
597,9756 |
-12,9756 |
6 |
-1 |
560 |
680 |
705 |
-145 |
719,6094 |
712,112 |
552,5026 |
7,497375 |
7 |
1 |
975 |
730 |
752,5 |
222,5 |
771,1719 |
765,389 |
969,2171 |
5,782875 |
8 |
3 |
800 |
775 |
795 |
5 |
783,3594 |
818,666 |
835,3066 |
-35,3066 |
9 |
5 |
765 |
815 |
847,5 |
-82,5 |
825,8594 |
871,943 |
811,0836 |
-46,0836 |
10 |
7 |
720 |
880 |
917,5 |
-197,5 |
879,6094 |
925,22 |
765,6106 |
-45,6106 |
11 |
9 |
1235 |
955 |
|
|
1031,172 |
978,497 |
1182,325 |
52,67487 |
12 |
11 |
1100 |
|
|
|
1083,359 |
1031,774 |
1048,415 |
51,58537 |
Таблица 3
|
год 1 |
год 2 |
год 3 |
Средняя оценка сезонной компоненты |
Скорректированная сезонная компонента Si |
1 |
2 |
3 |
4 |
5 |
6 |
Квартал 1 |
- |
-62,5 |
-82,5 |
-72,5 |
-60,8594 |
Квартал 2 |
- |
-145 |
-197,5 |
-171,25 |
-159,609 |
Квартал 3 |
161,875 |
222,5 |
- |
192,1875 |
203,8281 |
Квартал 4 |
5 |
5 |
- |
5 |
16,64063 |
Итого |
|
|
|
-46,5625 |
0 |
3 этап. Устраним сезонную компоненту из исходных уровней ряда путем вычитания из соответствующего Xt значения сезонной компоненты Si.
4 этап. Построим линейное уравнение тренда: Тt’=а+b·t.
Параметр
=392,45.
Параметр
=53,28.
И рассчитаем выровненные по уравнению тренда значения T’ (столбец 8 в таблю.2).
5 этап. Учтем сезонные отклонения прибавив к выровненным по аналитической модели значениям величину соответствующей сезонной компоненты (Xt’=Тt+Si) (толбец 9 в табл.2).
6 этап. Рассчитаем величину абсолютной ошибки для каждого наблюдения: Et = Xt- Xt’. Сумма квадратов абсолютных ошибок может использоваться как критерий качества (выбора) моделей, описывающих временной ряд.
Системы взаимосвязанных временных рядов.
При моделировании взаимосвязи двух или более временных рядов могут возникнуть следующие проблемы:
-
Если 2 ряда имеют тренды одинаковой направленности, то между уровнями этих рядов всегда будет наблюдаться положительная корреляция, независимо от того существует ли причинная связь между этими рядами или нет;
-
При разной направленности трендов корреляция рядов окажется отрицательной.