Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Казахский национальный университет им. аль-Фараби

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Диплом / Algebra_lineynoy_regressii.docx

Скачиваний:

Добавлен:

24.03.2015

Размер:

2.49 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 1213 / 1413 14 > Следующая >>>

8.5. Метод инструментальных переменных

Предполагаем, что в регрессии x = zα + ε переменные-факторы z являются случайными, и нарушена гипотеза g2 в обобщенной формулировке: ошибка ε зави- сит от факторов z, так что корреляция между z и ошибкой ε не равна нулю. Такую

274 Глава 8. Нарушение гипотез основной линейной модели

регрессию можно оценить, имея набор вспомогательных переменных y, называ- емых инструментальными переменными. Часто инструментальные переменные называют просто инструментами.

Для того, чтобы переменные y можно было использовать в качестве инстру- ментальных, нужно, чтобы они удовлетворяли следующим требованиям:

Инструменты y некоррелированы с ошибкой ε. (В противном случае метод даст несостоятельные оценки, как и МНК.) Если это условие не выполнено, то такие переменные называют негодными инструментами⁴.
Инструменты y достаточно сильно коррелированы с факторами z. Если данное условие не выполнено, то это так называемые «слабые» инструменты. Если инструменты слабые, то оценки по методу будут неточными и при малом количестве наблюдений сильно смещенными.

Обычно z и y содержат общие переменные, т.е. часть факторов используется в качестве инструментов. Например, типична ситуация, когда z содержит константу; тогда в y тоже следует включить константу.

Пусть имеются N наблюдений, и X , Z и Y — соответствующие данные в матричном виде. Оценки по методу инструментальных переменных (сокращенно IV от англ. instrumental variables) вычисляются по следующей формуле:

a_IV= ^Z^tY ^.Y ^tY ^.⁻¹Y ^tZ^⁻

Z^tY

^.−1

Y ^tX. (8.8)

В случае, если количество инструментальных переменных в точности равно

количеству факторов, ( rank Y = n + 1) получаем собственно классический ме- тод инструментальных переменных. При этом матрица Y ^tZ квадратная и оценки

вычисляются как

a_IV= ^.Y ^tZ^.⁻¹Y ^tY ^.Z^tY ^.⁻¹Z^tY ^.Y ^tY ^.⁻¹Y ^tX.

Средняя часть формулы сокращается, поэтому

a_IV= ^.Y ^tZ^.⁻¹Y ^tX. (8.9)

Рассмотрим вывод классического метода инструментальных переменных, т.е. случай точной идентификации (ср. с (6.15) в главе 6):

Умножим уравнение регрессии x = zα + ε слева на инструменты y (с транс- понированием). Получим следующее уравнение:

y^tx = y^tzα + y^tε.

⁴^В^модели^о^ш^и^б^о^к^в^п^ереме^нн^ых^о^ш^и^бк^а^ре^г^рессии^имее^т^вид^ε⁻^εz ^α^,^г^де^ε^—^о^шибк^а^в^исход^н^ом^урав^н^е^н^ии^,^а^εz ^—^о^ш^и^бк^а^измере^н^ия^фа^кт^оров^z^.^Чт^о^б^ы^п^ереме^нн^ые^y^мо^жн^о^было^ис^п^{ользова}^т^ь^в^к^ачес^т^ве^и^н^с^т^руме^нт^ов^,^дос^т^а^т^оч^н^о^,^ч^т^о^б^ы^y^были^н^е^к^{оррелирова}^н^ы^с^ε^и^εz ^.

Метод инструментальных переменных 275

Если взять от обеих частей математическое ожидание, то получится

E(y^tx) = E(y^tzα),

где мы учли, что инструменты некоррелированы с ошибкой, E(y^tε) = 0.

Заменяя теоретические моменты на выборочные, получим следующие нормаль- ные уравнения, задающие оценки a:

M_yx= M_yza,

где M_yx= ¹Y ^tX и M_yz= ¹Y ^tZ . Очевидно, что эти оценки совпадут с (8.9).

N N

Фактически, мы применяем здесь метод моментов.

Метод инструментальных переменных можно рассматривать как так называе- мый двухшаговый метод наименьших квадратов. (О нем речь еще пойдет ниже в пункте 10.3.)

j
-й шаг. Строим регрессию каждого фактора Z_jна Y . Получим в этой ре- грессии расчетный значения Z^c. По формуле расчетных значений в регрессии

_Zc

_j= Y (Y

^tY )⁻¹Y

^tZ . Заметим, что если Z_jвходит в число инструментов, то по

этой формуле получим Z^c

= Z_j, т.е. эта переменная останется без изменений.

Поэтому данную процедуру достаточно применять только к тем факторам, которые не являются инструментами (т.е. могут быть коррелированы с ошибкой). В целом

для всей матрицы факторов можем записать Z^c= Y (Y ^tY )⁻¹Y ^tZ .

-й шаг. В исходной регрессии используются Z^cвместо Z . Смысл состоит в том, чтобы использовать факторы «очищенные от ошибок».

Получаем следующие оценки:

a₂_M= ^.Z^c^tZ^c^.⁻¹Z^c^tx =

= ^Z^tY ^.Y ^tY ^.⁻¹Y ^tY ^.Y ^tY ^.⁻¹Y ^tZ^⁻¹Z^tY ^.Y ^tY ^.⁻¹Y ^tx =

= ^Z^tY ^.Y ^tY ^.⁻¹Y ^tZ^⁻¹Z^tY ^.Y ^tY ^.⁻¹Y ^tx = a .

Видим, что оценки совпадают.

Если записать оценки в виде a_IV= (Z^c^tZ)⁻¹Z^c^tx, то видно, что обобщенный метод инструментальных переменных можно рассматривать как простой метод ин- струментальных переменных с матрицей инструментов Z^c.

Такая запись позволяет обосновать обобщенный метод инструментальных пе- ременных. Если исходных инструментов Y больше, чем факторов Z , и мы хотим построить на их основе меньшее количество инструментов, то имеет смысл сопо- ставить каждому фактору Z_jв качестве инструмента такую линейную комбинацию исходных инструментов, которая была бы наиболее сильно коррелирована с Z_j. Этому требованию как раз и удовлетворяют расчетные значения Z^c.

276 Глава 8. Нарушение гипотез основной линейной модели

Другое обоснование обобщенного метода инструментальных переменных со- стоит, как и выше для классического метода, в использовании уравнений E(y^tx) =

= E(y^tzα). Заменой теоретических моментов выборочными получим уравнения M_yx= M_yza, число которых больше числа неизвестных. Идея состоит в том, чтобы невязки M_yx− M_yza были как можно меньшими. Это достигается минимизацией следующей квадратичной формы от невязок:

(M_yx− M_yza)^tM ⁻¹(M_yx− M_yza),

где M_yy= ¹Y ^tY . Минимум достигается при

a = ^M_zyM ⁻¹M_yz^⁻

M_zyM ⁻¹M_yx.

Видим, что эта формула совпадает с (8.8). Эти рассуждения представляют собой применение так называемого обобщенного метода моментов, в котором количе- ство условий на моменты может превышать количество неизвестных параметров.

Чтобы можно было использовать метод инструментальных переменных на практике, нужна оценка ковариационной матрицы, с помощью которой можно было бы вычислить стандартные ошибки коэффициентов и t-статистики. Такая оценка имеет вид

M_a_IV= s

₂._Z

ct_Z

_c^.−1 _.

Здесь s²— оценка дисперсии ошибок σ², например s²= e^te/N или s²=

= e^te/(N − 1). Остатки рассчитываются по обычной формуле e = x − Za_IV. (Здесь следует помнить, что остатки, получаемые на втором шаге тут не годят- ся, поскольку они равны x − Z^ca_IV. Если использовать их для расчета оценки дисперсии, то получим заниженную оценку дисперсии и ковариационной матрицы.

Отсюда следует, что из регрессии второго шага можно использовать только оценки коэффициентов. Стандартные ошибки и t-статистики требуется пересчитывать.)

Обсудим теперь более подробно проблему идентификации⁵.

Чтобы можно было вычислить оценки (8.8), нужно, чтобы выполнялись следу- ющие условия:

Матрица инструментов должна иметь полный ранг по столбцам, иначе

(Y ^tY )⁻¹не существует.

Z^tY (Y ^tY )⁻¹Y ^tZ должна быть невырожденной.

В частности, матрица Z^tY (Y ^tY )⁻¹Y ^tZ необратима, когда rank Y < rank Z . Предположим, что матрица факторов Z имеет полный ранг, т.е. rank Z = n+1.

⁵См. также обсуждение идентификации в контексте систем уравнений ниже в пункте 10.2.

8.5. Метод инструментальных переменных 277

Т.е. если rank Y < n + 1, то уравнение неидентифицируемо, т.е. невозмож- но вычислить оценки (8.8). Таким образом, количество инструментов (включая константу) должно быть не меньше n +1 (количество регрессоров, включая кон- станту). Если rank Y > n + 1, то говорят, что уравнение сверхидентицировано. Если количество инструментов равно n + 1, то это точная идентификация.

Если возможен случай сверхидентификации, то это обобщенный метод инстру- ментальных переменных. При точной идентификации ( rank Y = n + 1) получаем собственно классический метод инструментальных переменных.

Таким образом, необходимое условие идентификации имеет следующий вид:

rank Y “ rank Z(= n + 1).

Это так называемое порядковое условие идентификации, условие на размерность матриц.

Словесная формулировка порядкового условия:

Количество инструментов Y должно быть не меньше количества ре- грессоров Z (учитывая константу).

Заметим, что можно сначала «вычеркнуть» общие переменные в Z и Y и смотреть только на количество оставшихся. Количество оставшихся инструментов должно быть не меньше количества оставшихся регрессоров.

Почему это только необходимое условие? Пусть, например, некоторый фактор Z_jортогонален Y . Тогда Z^c= 0, и невозможно получить оценки a_IV, т.е. данное условие не является достаточным.

Необходимое и достаточное условие идентификации формулируется следую- щим образом:

Матрица Z^cимеет полный ранг по столбцам: rank Z^c= n + 1.

Это так называемое ранговое условие идентификации.

Встречаются случаи, когда ранговое условие идентификации соблюдается, но матрица Z^cблизка к вырожденности, т.е. в Z^cнаблюдается мультиколли- неарность. Например, если инструмент Z_jявляется слабым ( Z_jи Y почти ор- тогональны), то Z^cблизка к вырожденности. Один из способов проверки того, является ли инструмент слабым, состоит в анализе коэффициентов детерминации и F -статистик в регрессиях на первом шаге.

278 Глава 8. Нарушение гипотез основной линейной модели

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 1213 / 1413 14 > Следующая >>>

Соседние файлы в папке Диплом

#
24.03.201581 б15.~lock.NonParametrics1.pdf#
#
24.03.201581 б18.~lock.suslov_ibragimov_ekonometrika.pdf#
#
24.03.2015247.12 Кб14012_Регрессионный_анализ.docx
#
24.03.20152.49 Mб40Algebra_lineynoy_regressii.docx
#
24.03.2015160.08 Кб24NonParametrics1.pdf
#
24.03.20155.55 Mб41suslov_ibragimov_ekonometrika.pdf
#
24.03.201530.82 Кб28vopros gosy.docx
#
24.03.201559.9 Кб40Лекция 16 регр анализ.doc