![](/user_photo/2706_HbeT2.jpg)
УП Основы эконометрики
.pdf![](/html/2706/41/html_Psp_UzTbHd.qDIy/htmlconvd-wFu_Au81x1.jpg)
Действительно, маловероятно, чтобы совокупное влияние погодных условий в одном году коррелировало с аналогичным влиянием в следующем году.
В случае отрицательной корреляции, которая в экономике встречается относительно редко, за положительным значением y в одном наблю-
дении идет отрицательное значение в следующем, и наоборот; диаграмма рассеяния при этом выглядит так, как показано на рис. 5.2.
y
x
Рис. 5.2. Отрицательная корреляция
При рассмотрении автокорреляции мы будем предполагать, что имеем дело с данными временного ряда, т. е. когда исходные наблюдения регистрируются во времени. Тогда, очевидно, номер наблюдения «i » несет смысловую нагрузку времени регистрации наблюдения t , а объем
выборки n - времени T . |
|
Рассмотрим модель |
|
Y = XB + ε , |
(5.7) |
где t -я компонента вектора |
Y ,представляет значение зависимой пере- |
|
менной в момент времени t , |
t =1,K,T . Для удобства запишем подробнее |
|
уравнение для наблюдения в момент времени t : |
|
|
Yt =b1 + b2 Xt2 +K+ bk Xtk + εt . |
(5.8) |
Один из наиболее простых способов учета коррелированности ошибок (в разные моменты времени) состоит в предположении, что случайная последовательность {εt ,t =1,K,T} образует авторегрессионный про-
цесс первого порядка. Это означает, что ошибки удовлетворяют рекуррентному соотношению
+ |
εt = ρεt −1 +ηt , |
(5.9) |
|
{ηt ,t =1,K,T} - последовательность независимых, |
нормально рас- |
||
где |
пределенных случайных величин с нулевым средним и постоянной дис-
81
![](/html/2706/41/html_Psp_UzTbHd.qDIy/htmlconvd-wFu_Au82x1.jpg)
персией ση2 , т. е. ηt N(0,ση2 ), t =1,K,T ; а ρ - некоторый параметр, называемый коэффициентом авторегрессии ( ρ <1). Вероятностный смысл ρ состоит в том, что он является коэффициентом корреляции между двумя соседними ошибками. С использованием коэффициента авторегрессии ρ и дисперсии ση2 ковариационная матрица случайного вектора
ε запишется следующим образом |
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
1 |
|
ρ |
ρ2 |
K ρT −1 |
|||||
|
|
σ 2 |
|
|
|
ρ |
|
1 |
|
ρ |
K ρT −2 |
|
|||
|
|
|
|
|
|
|
|
||||||||
Ω = |
|
η |
|
|
|
|
2 |
|
|
|
|
|
|
T −3 |
|
|
|
|
|
ρ |
|
|
ρ |
|
1 |
K ρ |
|
. |
|||
|
− ρ |
2 |
|
|
|
|
|
||||||||
1 |
|
|
K |
K |
K |
K |
K |
||||||||
|
|
|
|
|
ρ |
T −1 |
ρ |
T −2 |
ρ |
T −3 |
K |
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
Условие (5.9) означает, что величина случайной ошибки в любом наблюдении равна ее значению в предшествующем наблюдении, умноженному на ρ , плюс новая случайная составляющая ηt . Данный процесс
оказывается авторегрессионным, поскольку ε определяется значениями этой же самой величины с запаздыванием, и процессом первого порядка, потому что в этом случае максимальное запаздывание равно единице. Предполагается, что значение ε в каждом наблюдении не зависит от его значений во всех других наблюдениях. Если ρ > 0 , то автокорреляция
положительная, если ρ < 0 , автокорреляция отрицательная. Если ρ = 0 ,
то автокорреляции нет и условие 3.b классической схемы удовлетворяется.
Обсудим проблему оценивания в модели с авторегрессией. Рассмотрим отдельно случай, когда коэффициент ρ известен, и отдельно – когда
ρнеизвестен.
1.Значение ρ известно. Предположим, что истинная модель задает-
ся в виде (5.7), так что наблюдения в момент времени t формируются как (5.8), а в момент времени t −1 как
Yt −1 = b1 + b2 Xt −12 +K+ bk Xt −1k + εt −1 . |
(5.10) |
Умножим обе части этого соотношения на ρ и вычтем из (5.8). Тогда |
|
с учетом (5.9) получим |
|
Yt − ρYt −1 = b1(1 − ρ)+ b2 (Xt2 − ρXt −12 )+K+ |
(5.11) |
. |
|
+ bk (Xtk − ρXt −1k )+ηt |
|
При t =1 достаточно обе части уравнения (5.8) умножить на |
1 − ρ2 : |
82
![](/html/2706/41/html_Psp_UzTbHd.qDIy/htmlconvd-wFu_Au83x1.jpg)
1 − ρ2Y = 1 − ρ2 b + b 1 − ρ2 |
X |
12 |
+K+ |
|
||
1 |
1 |
2 |
|
. |
(5.12) |
+bk 1 − ρ2 X1k +
1 − ρ2 ε1
Всистеме (5.11), (5.12) ошибки удовлетворяют условиям уже классической регрессионной модели. Действительно, в (5.11) случайные вели-
чины {ηt ,t =1,K,T} независимы и имеют постоянную дисперсию ση2 , а в
(5.12) ошибка 1 − ρ2 ε1 не зависит от {ηt ,t =1,K,T} и также имеет дисперсию ση2 . По методу наименьших квадратов можно получить оценки
неизвестных параметров модели, используя преобразованные значения переменных.
На практике часто опускают преобразование (5.12), игнорируя тем самым первое наблюдение. В этом случае, если в выборке нет данных, предшествующих первому наблюдению, то по формуле (5.11) мы не сможем преобразовать наблюдения, и, таким образом, потеряем первое наблюдение вообще. Число степеней свободы уменьшится на единицу, и это вызовет потерю эффективности, которая может в небольших выборках перевесить повышение эффективности от устранения автокорреляции.
Эта проблема устраняется введением поправки Прайса-Уинстена. Так как случайная ошибка η, согласно определению, не зависит от зна-
чения ε в |
любом предшествующем наблюдении, то все величины |
η2 ,η3 ,K,ηT |
не зависят от ε1 . Следовательно, если при устранении авто- |
корреляции все другие наблюдения преобразуются, то не требуется преобразовывать первое наблюдение. Его можно сохранить, включив в новую схему.
Мы можем таким способом спасти первое наблюдение, однако, если ρ велико, то первое наблюдение будет оказывать непропорционально
большое воздействие на МНК-оценки. Для нейтрализации этого эффекта вес данного наблюдения уменьшается умножением его на величину
1 − ρ2 . Отсюда становится понятным преобразование (5.12).
2. Значение ρ неизвестно. На практике параметр авторегрессии ρ
часто неизвестен. Поэтому необходимо получить его оценку одновременно с оценками коэффициентов регрессии. Как правило, процедуры оцененивания при неизвестном ρ имеют итеративный характер и явля-
ются достаточно эффективными. Опишем три наиболее употребительные.
Процедура Кохрейна-Оркатта состоит из следующих этапов:
1.Оценивается регрессия (5.7) с исходными непреобразованными данными по обычному методу наименьших квадратов.
2.Вычисляются остатки e = (e1 ,K, eT )T .
83
3. Оценивается регрессионная зависимость et от et −1, соответствующая формуле (5.9), и в качестве приближенного значения ρ берется МНК-оценка коэффициента при et −1 ρˆ .
4. С этой оценкой ρˆ модель (5.7) преобразуется в (5.11) (или (5.11),
(5.12)) и находятся МНК-оценки ˆ вектора параметров (т. е. получают- b b
ся пересмотренные оценки коэффициентов исходной модели).
5. Повторно вычисляются остатки (строится новый вектор остатков
= − ˆ e Y XB ).
6. Процедура повторяется, начиная с п.3.
Процесс обычно заканчивается, когда очередное приближение ρ ма-
ло отличается от предыдущего. Иногда просто фиксируется количество итераций. Либо чередование этапов пересмотра оценок коэффициентов регрессии и оценки ρ продолжается до тех пор, пока не будет получена
требуемая точность сходимости, т. е. до тех пор, пока оценки на последнем и предпоследнем этапах не совпадут с заданной степенью точности. Процедура Кохрейна-Оркатта реализована в большинстве эконометрических компьютерных программ.
Метод Хилдрета-Лу достаточно прост. Из интервала (-1,1) возможного изменения коэффициента ρ берутся последовательно некоторые значе-
ния (например, числа с постоянным шагом 0,1 или 0,05) и для каждого из них проводится оценивание преобразованной системы (5.11). Значение, которое дает минимальную стандартную ошибку для преобразованного уравнения (сумма квадратов отклонений в (5.11) минимальная), принимается в качестве оценки ρ , а коэффициенты регрессии определяются
при оценивании уравнения (5.11) с использованием этого значения. Можно в целях улучшения качества оценок и достижения желаемой точности повторить процесс, устраивая более мелкую сетку в окрестности найденного значения ρ . Время работы процедуры, очевидно, сокращается, если
есть априорная информация об области изменения параметра ρ . Процедура Дарбина заключается в том, что значение Yt −1 включается
в число регрессоров, а ρ - в число оцениваемых параметров.
Преобразованная система (5.11) переписывается в виде: |
|||
Yt = b1(1 − ρ)+ ρYt −1 + b2 Xt2 − ρb2 Xt −12 +K+ bk Xtk − ρbk Xt −1k +ηt . |
|||
|
|
|
|
Для этой системы строятся обычные МНК-оценки ρˆ и ρb j =θˆ j , тогда |
|||
ˆ |
θˆ j |
|
ˆ |
bj = |
ρˆ |
. Можно улучшить качество оценок |
B , если в систему (5.11) под- |
|
|
|
ставить полученное значение ρˆ , и найти новые МНК-оценки параметров
B .
84
В заключение этого параграфа рассмотрим вопрос о том, каким образом можно обнаружить автокорреляцию первого порядка.
Большинство тестов на наличие корреляции по времени в ошибках системы (5.7) используют следующую идею: если корреляция есть у ошибок ε , то она присутствует и в остатках e , получаемых после применения к (5.7) обычного метода наименьших квадратов. Одна из реализаций этого подхода состоит в следующем.
Пусть нулевая гипотеза состоит в отсутствии корреляции, т. е. H0 : ρ = 0 . В качестве альтернативной можно взять либо просто H1 : «не
H0 », либо H1 : ρ > 0 .
Наиболее широко используется критерий Дарбина-Уотсона, статистика которого
|
∑T (et − et −1 )2 |
|
|
|
DW = |
t =2 |
. |
(5.13) |
|
T |
||||
|
|
|
||
|
∑et2 |
|
|
|
|
t =1 |
|
|
Будем считать, что постоянный член включен в число регрессоров. Тогда нетрудно проверить, что эта статистика тесно связана с величиной
r - выборочным коэффициентом корреляции между et |
и et −1 и получает- |
ся приближенно равной |
|
DW ≈ 2(1 − r). |
(5.14) |
Понятен и содержательный смысл статистики DW : если между et и et −1 имеется достаточно высокая положительная корреляция, то в определенном смысле et и et −1 близки друг к другу и значение DW по фор-
муле (5.13) мало. Это также согласуется с (5.14): если r ≈1, то DW ≈ 0 . Отсутствие корреляции означает, что DW ≈ 2 . При наличии положительной корреляции величина DW , вообще говоря, будет меньше двух; при отрицательной – будет превышать 2. Так как r должно находиться между значениями 1 и -1, то DW должно лежать между 0 и 4.
Если бы распределение статистики DW было известно, то для H0 : ρ = 0 и H1 : ρ > 0 можно было бы для заданного уровня значимости
α (например, α = 0,05 ) найти такое критическое значение dкр , что если DW > dкр, то гипотеза H0 принимается, в противном случае она отвергается в пользу H1 . Проблема, однако, состоит в том, что распределение
DW зависит не только от числа наблюдений в выборке T и количества регрессоров k или объясняющих переменных в уравнении регрессии, но и от конкретных значений, принимаемых объясняющими переменными, т. е. от всей матрицы X . Поэтому невозможно составить таблицу с указанием точных критических значений для всех возможных выборок, как это можно сделать для t - и F -статистик. Тем не менее, Дарбин и Уотсон до-
85
![](/html/2706/41/html_Psp_UzTbHd.qDIy/htmlconvd-wFu_Au86x1.jpg)
казали, что для критического значения существует верхняя du и нижняя de границы, которые зависят лишь от T , k и уровня значимости α (а,
следовательно, могут быть затабулированы) и обладают следующим свойством: если DW > du , то DW > dкр и, значит, гипотеза H0 принима-
ется, а если DW < de , то DW < dкр, и гипотеза H0 отвергается в пользу H1 . В случае de < DW < du ситуация неопределенна, т. е. нельзя выска-
заться в пользу той или иной гипотезы.
Если альтернативной является гипотеза об отрицательной корреляции H1 : ρ < 0 , то соответствующими верхними и нижними границами бу-
дут 4 − de и 4 − du . Представим результаты тестирования в виде следующей таблицы
Значение статистики |
Вывод |
|
DW |
|
|
4 − de < DW < 4 |
H0 отвергается, есть отрицательная кор- |
|
4 − du < DW < 4 − de |
реляция |
|
Неопределенность |
||
2 < DW < 4 − du |
Принимается H0 |
|
du < DW < 2 |
Принимается H0 |
|
de < DW < du |
Неопределенность |
|
0 < DW < de |
H0 отвергается, есть положительная кор- |
|
реляция |
||
|
На рисунках 5.3 и 5.4 данная ситуация представлена в виде схемы; стрелка указывает критическую точку dкр .
|
|
|
|
|
|
d |
0 |
de |
dкр. |
2 |
4 |
||
|
du 86 |
|
|
![](/html/2706/41/html_Psp_UzTbHd.qDIy/htmlconvd-wFu_Au87x1.jpg)
Рис. 5.3. Тест Дарбина-Уотсона на автокорреляцию (зона неопределенности в случае предполагаемой положительной автокорреляции)
0 |
2 4 − du dкр. 4 − de 4 |
d |
Рис. 5.4. Тест Дарбина-Уотсона на автокорреляцию (зона неопределенности в случае предполагаемой отрицательной автокорреляции)
Вопросы для самопроверки и упражнения
5.1.Проверьте несмещенность оценки (5.4).
5.2.Покажите, что для матрицы вариаций ОМНК-оценок справедлива формула (5.5).
5.3.Какими свойствами будут характеризоваться оценки параметров обобщенной линейной модели множественной регрессии, если для их нахождения используется обыкновенный метод наименьших квадратов.
5.4.Докажите, что если в модели (5.1) ошибки нормально распределены, то ОМНК–оценки будут совпадать с оценками, найденными по методу максимального правдоподобия.
5.5.Приведите примеры данных с гетероскедастичными ошибками.
5.6. Проверьте непосредственно, что для модели yi = a + bxi + εi ,
= K , с гетероскедастичностью дисперсия оценки ˆ , полученной с
i
1,
,
n
b
помощью метода взвешенных наименьших квадратов, будет меньше дисперсии МНК-оценки.
5.7.Предположим, что модель подвержена автокорреляции первого порядка. Почему при построении уравнения регрессии не следует использовать МНК?
5.8.Рассмотрим модель yt = a + bxt + εt , где ошибки εt порождаются
авторегрессионным процессом второго порядка:
εt = ρ1εt −1 + ρ2εt −2 +ηt .
Предложите, каким образом можно обобщить итерационную процедуру Кохрейна-Оркатта для оценивания параметров этой модели.
87
Глава 6. Системы эконометрических уравнений
При моделировании достаточно сложных экономических объектов часто приходится использовать не одно, а несколько уравнений, чаще всего связанных между собой. В таких случаях модель объекта описывается системой эконометрических уравнений, которую необходимо оценить при проведении регрессионного анализа. Проблема оценивания систем уравнений требует введения новых понятий и разработки новых методов. Эти вопросы и будут обсуждаться в данной главе. Вначале мы рассмотрим простую задачу оценивания системы, в которой уравнения связаны потому, что ошибки в разных уравнениях коррелированы между собой, - это так называемая система внешне не связанных уравнений. Затем мы исследуем общие системы, которые в эконометрике называются системами одновременных уравнений, и частный случай таких систем
– рекурсивные системы.
6.1. Внешне не связанные уравнения
Для того, чтобы понять постановку задачи и суть проблемы, рассмотрим следующий пример. Предположим, что исследуется зависимость инвестиций y , осуществляемых некоторым предприятием (например, Ир-
кутским алюминиевым заводом), от его дохода x1 и размера основного
фонда x2 : |
|
yi = a0 + a1x1i + a2 x2i + εi , i =1,K,n . |
(6.1) |
Представим теперь, что имеется ряд наблюдений другого аналогич- |
|
ного предприятия (например, Братского алюминиевого завода): |
|
zi =b0 + b1t1i + b2t2i +ηi , i =1,K,n . |
(6.2) |
Уравнения (6.1) и (6.2) можно оценивать по отдельности. Внешне они выглядят как не связанные друг с другом. Но ясно, что в данной ситуации ошибки εi и ηi коррелированы, так как для каждого i =1,K, n (или
t =1,K,T ) предприятия действуют в «одной экономической среде». По-
этому целесообразно объединить уравнения (6.1) и (6.2) и оценивать их совместно, используя доступный обобщенный метод наименьших квадратов.
Общую задачу можно сформулировать следующим образом. Даны M регрессионных уравнений (в матричном виде)
Y1 = X1B1 + ε1 |
|
Y2 = X 2 B2 + ε2 |
(6.3) |
KKKKKK |
|
YM = X M BM + εM , |
|
где Yi - (n ×1) вектор зависимых переменных, Xi - (n × ki ) матрица неза- |
|
висимых переменных, Bi - (ki ×1) вектор неизвестных параметров, |
εi - |
88
(n ×1) вектор ошибок, |
i =1,K, M . Будем предполагать, что |
Mεi = 0 и |
M (εisε jt )=σij при s = t |
и M (εisεit )= 0 при s ≠ t . Последнее условие мож- |
|
но представить так: |
M (εiεTj )=σij In , i, j =1,K, M . |
|
|
(6.4) |
Иными словами, заданы M регрессионных уравнений, по каждому из которых имеется n наблюдений. (Или T наблюдений в случае временных рядов). Если данные имеют структуру временных рядов, то считается, что ошибки во всех уравнениях коррелированы в один и тот же момент времени и некоррелированы для других моментов.
Каждое отдельное уравнение в системе (6.3) удовлетворяет условиям классической регрессионной модели и может быть оценено обычным МНК.Однако, если объединить эти уравнения и применить ОМНК, то можно повысить эффективность оценивания.
Обозначим
|
Y |
|
|
|
X |
1 |
0 |
K 0 |
|
|
|
B |
|
|
|
ε |
1 |
|
|
|||
|
1 |
|
|
|
|
X 2 |
K 0 |
|
|
|
|
1 |
|
|
|
|
|
|
|
|||
|
Y2 |
|
|
|
0 |
|
|
|
B2 |
|
|
|
ε2 |
|
|
|||||||
Y = |
M |
|
, |
X = |
K |
K |
K K |
|
, |
B = |
M |
|
, |
ε = |
|
M |
|
, |
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
0 |
0 |
K X |
|
|
|
|
|
ε |
|
|
|
|||||||||
Y |
|
|
|
|
|
|
B |
|
|
|
|
|
|
|
|
|||||||
|
M |
|
|
|
|
|
|
M |
|
|
|
M |
|
|
|
M |
|
|||||
∑= (σij ), |
|
i, j =1,K, M . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Тогда система (6.3) перепишется в виде
Y = XB + ε .
Используя понятие произведение Кронекера двух матриц, ковариационную матрицу вектора ошибок можно представить так:
M (εεT )= Ω = Σ In .
В качестве справки приведем пример произведения Кронекера двух матриц:
|
|
|
|
|
2 |
0 |
|
|
2 |
|
0 |
|
2 |
|
0 |
4 0 |
|
||||||||||
1 |
2 |
2 |
0 |
1 |
|
|
2 |
|
|
|
|
|
|
1 |
4 2 8 |
|
|
||||||||||
= |
1 |
4 |
|
|
1 |
|
4 |
= |
. |
|
|||||||||||||||||
|
|
|
|
2 |
0 |
|
|
2 |
|
0 |
|
|
0 |
6 0 |
|
||||||||||||
0 |
3 |
1 |
4 |
|
|
|
|
|
0 |
|
|
|
|||||||||||||||
|
|
|
|
0 |
|
|
3 |
|
|
|
|
|
|
|
|
0 |
|
|
|
|
|
||||||
|
|
|
|
|
1 |
4 |
|
|
1 |
|
4 |
|
0 |
|
3 12 |
|
|||||||||||
Предположим,что матрица Σ не вырождена. |
|
|
|
|
|
|
|||||||||||||||||||||
|
|
|
|
|
|
ˆ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Для построения оценки B применим ОМНК: |
|
|
|
|
|
|
|||||||||||||||||||||
|
|
|
|
|
ˆ |
|
T |
Ω |
−1 |
|
−1 |
X |
T |
Ω |
−1 |
|
|
|
|
|
|
||||||
|
|
|
|
|
B = (X |
|
|
|
X ) |
|
|
|
|
Y или |
|
|
|
||||||||||
|
|
|
|
|
|
ˆ |
[X |
T |
(Σ |
−1 |
|
|
|
|
|
|
−1 |
X |
T |
(Σ |
−1 |
I n )Y . |
(6.5) |
||||
|
|
|
|
|
|
B = |
|
|
|
In )X ] |
|
|
|
(здесь мы воспользовались известным свойством произведения Кронекера: для двух квадратных невырожденных матриц A и B справедливо
(A B)−1 = A−1 B−1).
89
Нетрудно понять, что в общем случае оценка (6.5) отличается от оценки, полученной в результате применения обычного МНК к каждому уравнению в системе (6.3). Есть, однако, две ситуации, когда эти оценки совпадают.
1)Уравнения в (6.3) действительно не связаны друг с другом, т. е.
σij = 0 при i ≠ j .
2)Все уравнения в (6.3) имеют один и тот же набор независимых пе-
ременных, т. е. X1 = X 2 =K= X M .
Для использования доступного ОМНК нужно оценить матрицу Σ. Это
можно сделать, применяя к каждому уравнению системы (6.3) обычный МНК, получая векторы остатков ei , i =1,K, M , и беря в качестве оценок
ковариаций σij величины (eiT e j )n , т. е. σˆij = (eiT e j )
n . Можно проверить, что эти оценки являются состоятельными.
Отметим в заключение, что эффективность ˆ , полученной таким спо-
B
собом, тем выше, чем сильнее корреляция между ошибками.
6.2.Системы одновременных уравнений
Втеории экономико-статистического моделирования систему взаимосвязанных регрессионных уравнений и тождеств, в которой одни и те же переменные в различных регрессионных уравнениях могут одновременно выступать и в роли результирующих показателей (эндогенных переменных) и в роли объясняющих (экзогенных) переменных, принято называть системой одновременных (эконометрических) уравнений.
Как мы уже сказали, эконометрическая модель содержит так называемые эндогенные и экзогенные переменные. Эндогенными являются те переменные, которые в силу принятых концепций определяются внутренней структурой изучаемого явления, иначе говоря, их значения выясняются на основе модели. В свою очередь, экзогенные переменные по определению независимы от структуры явления и их значения (в том числе прогностические) устанавливаются вне модели. Модель содержит также различного рода параметры (коэффициенты), которые определяются в ходе статистического оценивания путем обработки имеющейся информации.
То, как классифицированы переменные (эндогенные или экзогенные) зависит от теоретической схемы или принятой модели. Внеэкономические переменные, например, климатические условия, постоянно бывают экзогенными. В то же время экономические переменные, такие как экспорт и правительственные расходы, могут в одной модели рассматриваться как эндогенные, а в другой – как экзогенные. При этом в соотношения могут входить переменные, относящиеся не только к периоду t , но
ик предшествующим периодам, называемые лаговыми («запаздывающими») переменными.
90