Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Эконометрика. Тихомиров

.pdf
Скачиваний:
405
Добавлен:
27.03.2016
Размер:
6.13 Mб
Скачать

Несложно заметить, что при наличии ошибок измерения у зависимой и независимых переменных эконометрическая модель может быть представлена в следующем виде:

~

~

(10.12)

y

X ( uV ),

где – вектор ошибки истинной модели; u – вектор ошибки измерений зависимой переменной, V – матрица ошибок измерений независимых переменных.

Даже при вполне естественных предположениях о взаимной независимости ошибок , u и V, истинных значений переменных хi и этих ошибок, используя примененные в двух других случаях подходы, можно показать, что:

а) дисперсия такой модели увеличивается по сравнению с моделью,

исходные данные которой измерены без ошибок;

б) использование обычного МНК дает смещенные оценки ее параметров.

В частности, заметим, что дисперсия модели (10.12) при этих предположениях определяется следующим выражением:

2=M[( uV ) ( uV )]=M[( )+(u u)+( V V )=

 

= 2+ u2+ v2,

(10.13)

а величины смещения при конечном Т и при Т определены выражениями

(10.9) и (10.10) соответственно.

Как следует из полученных выше результатов, наибольшие трудности при построении эконометрических моделей с ошибками в исходной информации на основе обычного МНК возникают в случае наличия ошибок измерений у независимых переменных. Они связаны с необходимостью устранения смещения в получаемых оценках. Основным методом, который получил достаточно убедительное теоретическое обоснование и широкое

распространение в практике эконометрических исследований в таких случаях является “метод инструментальных переменных”.

Как следует из результатов раздела , сформировав матрицу Z значений инструментальных переменных, некоррелированных, как с ошибкой

“истинной” модели , так и с ошибками измерения независимых переменных v, но имеющих ненулевую корреляцию с измеренными переменными хi,

состоятельные оценки параметров моделей (10.6) и (10.12) получим согласно следующему выражению:

~

~

1

Z' y.

(10.14)

a

(Z' X)

 

Напомним, что этот результат в данном случае следует из представления,

например, модели (10.6) с инструментальными переменными в следующем виде:

Z y= Z

~ X

Z ( –V ),

(10.15)

где слагаемое Z ( –V ) характеризует вектор ошибки этой модели.

Несложно показать, что вектор ошибок оценок параметров модели (10.15)

определяется следующим выражением:

~ a

~ (Z' X)

[Z'

( –V )],

(10.16)

При оговоренных свойствах инструментальных переменных несложно

увидеть, что математическое

ожидание

ошибки

a

равно

нулю, т. е.

 

 

 

~

 

 

M[ a ]=0, а ковариационная матрица ошибок определяется выражением:

~

 

 

 

 

 

Cov( a )=M[ a, a ' ]=

 

 

 

 

~

~ ~

 

 

 

~ 1

 

 

 

~ 1

(10.17)

M [(Z' X)

Z' ( –V ) ( – V ) Z (Z' X) ],

В условиях независимости ошибок и V выражение (10.17) приобретает

следующий вид:

 

~

1

 

 

~

1

, (10.18)

 

 

 

Cov( a )=( Z' X)

 

Z' [Cov( )+M(V V)] Z (Z' X)

 

 

 

 

~

 

 

 

 

 

 

 

 

 

 

 

где M(V V ) является

ковариационной

матрицей

вектора

V ,

т.

е.

M(V V)=Сov(V).

 

 

 

 

 

 

 

 

При условии

отсутствия

корреляционных

связей у

ошибок

t и

vit

и

независимости ошибок измерения vit, vjt, i j несложно увидеть, что выражение (10.18) приобретает следующий вид:

Cov( )+M(V V)= 2 Е+ v2 Е=( 2 + v2) Е, (10.19)

где v2 – взвешенная по параметрам дисперсия независимых переменных,

определяемая в условиях независимости ошибок vit и vjt следующим выражением:

2 v

 

1

(

 

vit

) 2 .

(10.20)

 

 

T n 1

t

i

 

 

 

 

i

 

 

 

 

В этом случае ковариационная матрица оценок параметров модели (10.15)

будет иметь следующий вид:

Cov(

~ a

)=( 2+ v2) (

~

1

~

1

.

Z' X)

 

(Z' Z) (X' Z)

 

(10.21)

~

2

2

=

2

На практике при известных оценках параметров a

сомножитель

+ v

 

может быть определен на основе следующего выражения:

2 2 2

v

 

1

( y

 

~ ~

 

~

~

(10.22)

T n 1

t

X a )' ( y

t

X a ).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Асимптотическая несмещенность и состоятельность оценок ~a ,

полученных с использованием инструментальных переменных z на основании выражения (10.14), вытекает из предполагаемой их независимости в пределе при Т с ошибками и V, и конечных перекрестных предельных

моментов с измеренными значениями переменных хi, т. е.

~

it , а также

x

 

 

независимости и отсутствии автокорреляции у ошибок и V. Иными словами, матрица Z и ошибки и V должны обладать следующими предельными свойствами:

 

 

plim(1/T )= 2;

 

 

 

 

 

plim(1/T V V)= v2;

 

 

 

 

 

plim(1/T V)=0;

 

 

 

 

 

plim(1/T Z )=0;

 

 

 

 

 

plim(1/T Z V )=0;

 

 

(10.23)

 

 

~

 

;

 

 

 

 

plim(1/T Z X )= ZX 0

 

 

 

 

 

~

 

 

 

 

 

plim(1/T Z Z)= Z 0 .

 

 

С учетом

(10.23) для

выражения (10.16)

несложно

показать, что

plim[ a ]=plim[ a – ]=0, а

ковариационная матрица оценок

a

в пределе

~

~

 

 

 

~

определяется следующим выражением:

Cov(

~ a )

 

 

 

 

 

T

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

~

1

 

 

 

 

 

 

 

~

1

 

 

 

 

 

plim[T

 

 

 

 

 

 

 

 

 

 

Z (Z' X)

 

].

(10.24)

 

T

 

 

( Z ' X )

 

 

Z '

(

V ) (

 

V )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Учитывая, что

p lim(

1

Z

T

 

 

( 2 2)

v

'

p

(–V)(– V) Z)=

lim(

1

Z ' Z )

2

plim( Z ' Z ),

 

T

 

 

 

 

 

получим следующее автокорреляций ошибок

выражение для асимптотической матрицы

вектора

a

:

 

~

 

Cov(

T

~

1

 

2

1

1

,

a )

 

 

~

Z ~

 

T

 

 

ZX

ZX

 

 

 

 

 

 

 

(10.25)

которое на практике заменяется выражением (10.21).

В разделе 3.3 было отмечено, что основным недостатком использования

инструментальных переменных при оценке параметров эконометрических моделей, является увеличение дисперсий этих оценок. При этом их дисперсии увеличиваются пропорционально снижению силы статистической взаимосвязи факторов хi и соответствующих инструментальных переменных zi. При высокой корреляции между этими переменными снижение эффективности не столь значительно.

Напомним,

что

увеличение

дисперсии

оценок

при

слабой

коррелированности

переменных zi

и

~

и

ранее,

объясняется

x i , как

уменьшением

диагональных элементов

матриц

(Z X)

и

(X Z), а,

следовательно, и ростом соответствующих показателей их обратных матриц,

что ведет к росту диагональных элементов в матрице Cov( ~a ) (см. выражение

(10.21)).

Таким образом, при выборе инструментальных переменных должно

соблюдаться следующее правило: переменные zi

 

должны коррелировать с

измеренными значениями факторов

~

i , но быть статистически не связанными

x

 

 

 

 

 

 

с ошибками их измерения vi.

 

 

 

 

 

Ранее в разделе

было показано,

что такими свойствами обладают

 

 

 

~

 

 

 

“сглаженные” значения переменных

~

,

определенные на основе

x i ,

т. е. x i

аппроксимирующих функций

~

i = (wi, t),

~

i = (t), где wi

– набор новых

x

x

 

 

переменных, определяющих тенденции развития фактора хi, а t – фактор времени.

В отсутствии таких “сглаженных переменных”, удовлетворительные

результаты можно получить, используя в качестве инструментальных

значений переменных zi ранги соответствующих переменных

~

i , т. е. числа

x

 

 

типа 1,2,3,..., характеризующие порядковые номера уровней этих переменных в их ранжированном ряду. Иными словами, 1 присваивается значению zi ,

если переменная

~

принимает наименьшее значение в ряду переменных

~

x i

x it

при t=1,2,....,Т; значение zik=2, если значение

~

 

является наименьшим среди

x

ik

 

всех оставшихся значений переменных и т. д.

10.2. Модели с фиктивными независимыми переменными

Фиктивные переменные вводятся в эконометрическую модель обычно с целью учета воздействия качественных аспектов на закономерности развития рассматриваемых процессов. К таким аспектам, например, относится различие в условиях развития процессов, предопределивших разницу их уровней в разные периоды времени при сохранении их общих тенденций (см.

рис. 10.1).

На рис. 10.1 показано, что в период (0, T1) для развития процесса была характерна тенденция (1), а в период (T1+1, T2) – тенденция (2) (например, до дефолта и после дефолта, если дефолт не повлиял на характер самой тенденции).

При этом динамические характеристики этих тенденций (темпы роста,

первая производная) совпадают.

у

2

1

t

0

T1 T1+1

T2

Рис. 10.1. Пример различий в условиях развития процесса

Если не принимать во внимание отмеченные различия и попытаться построить единую, обобщенную модель для периода (0, T2), то , очевидно,

что ее уравнение будет соответствовать пунктирной линии, проходящей между сплошными линиями, характеризующими реальные тенденции процесса в рассматриваемых периодах.

Из рис. (10.1), в частности, также вытекает, что, если эконометрическая модель строится только на основе информации первого периода, то ее уравнение будет иметь следующий вид:

уt=01 f( ,x)+ t1,

(10.26)

а, если только по информации второго периода, то

уt=02 f( ,x)+ t2,

(10.26)

Отличаются эти выражения, если не принимать во внимание возможные различия в их ошибках, только величиной свободного коэффициента, т. е. 0.

Если ввести фиктивную переменную x0i, i=1,2, со следующими свойствами:

1, в первый период;

х01=

0, во второй период;

0, в первый период;

х02=

1, во второй период;

то выражения (10.26) и (10.27) могут быть объединены в рамках одной модели следующего вида:

уt= 01 х01 02х02 f( ,x)+ t.

(10.26)

Матрица исходных данных для такой модели будет иметь следующий вид:

 

1

0

 

 

 

 

1

0

 

 

 

 

... ...

 

 

 

X

1

0

X it

,

(10.29)

0

1

 

 

 

 

 

0

1

 

 

 

 

... ...

 

 

 

 

0

1

 

 

 

Xit – матрица значений основных независимых переменных модели, i=1,2,...,

п; t=1,2,....,Т2.

Очевидно, что в этом случае условное математическое ожидание переменной у будет иметь следующий вид:

M[y/ х1 1, х2 0, Xit]= 01 f( ,x) для t=1,2,..., Т1;

и

M[y/ х1 0, х2 1, Xit]= 02 f( ,x) для t= Т1+1,..., Т2;

Заметим, что для рассматриваемого случая может быть предложена и другая модификация модели (10.28), например, с одной фиктивной

переменной (пусть х02), но содержащая свободный член. Ее вид определен следующим уравнением:

уt= 0 02 х02 f( ,x)+ t,

(10.26)

и матрица исходных данных для такой модели примет следующий вид:

 

1

0

 

 

 

 

1

0

 

 

 

 

... ...

 

 

 

X

1

0

X it

,

(10.31)

 

1

1

 

 

 

 

... ...

 

 

 

 

1

1

 

 

 

Вместе с тем, несложно увидеть, что введение свободного члена в модели

(10.28) невозможно, поскольку следствием этого является появление единичного столбца в матрице (10.29), что влечет за собой ее необратимость,

поскольку единичный столбец представляет собой линейную комбинацию столбцов значений фиктивных переменных.

Модели типа (10.28) и (10.30) легко могут быть сформированы и на случай большего числа групп фиктивных переменных. Они могут выражать определенные временные периоды (например, с целью учета сезонности),

статус объекта и т. п. В частности, в рассматриваемой в первой главе модели заболеваемости такие переменные могут выражать время года (весна, лето,

осень зима), половозрастную группу населения (взрослые и дети, мужчины и женщины). В этом случае вводятся две группы переменных – временная и половозрастная (всего восемь). Обозначим эти переменные как s1, s2, s3, s4; q1, q2, q3, q4. При этом

1, если наблюдения относятся к i-му времени года, i=1,2,3,4;

si=

0, в остальных случаях;

1, если наблюдения относятся к j-й половозрастной группе j=1,2,3,4;

qj=

0, в остальных случаях;

Тогда эконометрическая модель типа (10.28), описывающая заболеваемость в регионе в зависимости от условий жизнедеятельности,

времени года и половозрастной группы индивидуума, может быть представлена в следующем виде:

y

t

 

01

 

s1

 

02

 

s2

 

03

 

s3

 

04

 

s4

 

 

02

q

 

03

q

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

q

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

04

 

i

x it

t

,

(10.32)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

где хit – факторы жизнедеятельности.

Оставление свободного члена в модели заболеваемости, как и в модели

(10.30), приведет к уменьшению числа ее фиктивных переменных. В этом случае выражение (10.32) преобразуется к виду:

y

t

 

0

 

02

 

s2

 

03

 

s3

 

04

 

s4

 

01

q

 

 

02

q

 

03

q

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

2

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

q

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

04

 

i

x it

t

,

(10.33)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

При этом для первого временного сезона и первой половозрастной группы получим 0= 01+ 01.

Заметим, что модели типа (10.32) и (10.33) корректны, если все группы населения одинаково реагируют на изменение условий жизнедеятельности и,

кроме того, заболеваемость характеризуется параллельными сдвигами со сменой времени года.