
- •Глава X. Эконометрические модели со специфическими переменными
- •10.1. Эконометрические модели с ошибками в переменных
- •10.2. Модели с фиктивными независимыми переменными
- •10.3. Модели с дискретными зависимыми переменными
- •10.3.1. Модели бинарного выбора
- •10.3.2. Модели множественного выбора
- •10.3.3. Модели счетных данных
- •10.4. Модели с ограниченными зависимыми переменными
- •10.4.1. Модели усеченных выборок
- •10.4.2. Модели цензурированных выборок
- •10.4.3. Модели случайно усеченных выборок (selection-model)
- •10.5. Методы оценки параметров моделей с дискретными и ограниченными зависимыми переменными
- •10.5.1. Метод максимального правдоподобия
- •10.5.2. Метод максимального счета (mscore)
- •Вопросы к главе X
- •Упражнения к главе х Задание 10.1
- •Задание 10.2
- •Задание 10.3
- •Задание 10.4
- •Задание 10.5
- •Задание 10.6[1]
- •Глава XI. Методы оценки параметров нелинейных эконометрических моделей
- •11.1. Особенности оценки параметров нелинейных моделей
- •11.2. Метод прямого поиска
- •11.3. Методы оценки параметров, основанные на линейной аппроксимации модели
- •11.4. Методы, предполагающие линеаризацию целевой функции
- •11.5. Качественные характеристики оценок параметров нелинейных эконометрических моделей
- •Вопросы к главе XI
- •Глава XII. Использование эконометрических моделей в прогнозировании социально-экономических процессов
- •12.1. Особенности эконометрического прогнозирования
- •12.2. Методы оценки дисперсии прогноза при детерминированном прогнозном фоне
- •12.3. Методы оценки дисперсии прогноза при случайном прогнозном фоне
- •12.4. Прогнозирование на основе моделей временных рядов
- •Вопросы к главе XII
- •Упражнения к главе XII Задание 12.1
- •Задание 12.2
- •Краткий словарь терминов
- •Приложение 1. Функция стандартного нормального распределения
- •Приложение 2. Двусторонние квантили распределения Стьюдента
- •Приложение 5. Квантили распределения 2()
- •Список литературы
Глава X. Эконометрические модели со специфическими переменными
В эконометрических исследованиях иногда приходится учитывать взаимосвязи не только между количественными характеристиками рассматриваемых явлений, объектов, но и принимать во внимание различия в их качестве. Качество, например, может быть выражено статусом объекта, его принадлежностью к какой-либо группе, наличием или отсутствием у него определенных свойств, стохастическим (вероятностным) характером их проявления и т. п. В этих и некоторых других случаях качество может быть выражено специфическими показателями, в частности, порядковыми числами, вероятностями, дихотомическими переменными (0 или 1) и т. д. При этом такие показатели могут выражать уровни как зависимых, так и независимых переменных эконометрической модели.
К специфическим переменным могут быть отнесены также и переменные, значения которых измерены с ошибками. В частности, ошибка может возникать из-за использования выборочных средних вместо средних по генеральной совокупности (при измерении спроса, дохода и т.п.), данных экстраполяции вместо измеренных значений, наконец, при использовании неточного инструментария измерения и в целом ряде других случаев.
Включение в эконометрическую модель специфических переменных часто ведет не только к изменению ее вида, содержания, но и может создать определенные проблемы при получении оценок ее параметров. В данной главе будут рассмотрены особенности построения эконометрических моделей, содержащих некоторые виды таких специфических переменных.
10.1. Эконометрические модели с ошибками в переменных
В общем случае следует разделять три ситуации, связанные с ошибками переменных эконометрической модели: ошибки имеют место у зависимой переменной, у независимых переменных и у тех и других вместе взятых. Рассмотрим возможные последствия этих ошибок с точки зрения проблемы получения “качественных” оценок параметров модели.
1. Ошибки измерения зависимой переменной у.
Представим нелинейную эконометрическую модель в векторно-матричной форме записи
y=X+,
где, как и ранее, X – матрица значений независимых факторов размера Т(п+1), – вектор коэффициентов модели, состоящий из п+1 компоненты, а – вектор ошибки модели, обладающий “классическими” свойствами, Сov()=2E, ошибки и факторы независимы.
В отношении вектора у будем предполагать, что его компоненты, являющиеся истинными значениями переменной у в моменты t=1,2,...,Т; измерены с ошибкойut и данные измерений представлены в виде следующих сумм:
где
–
измеренное значение зависимой переменной
в момент t,
а ut –
ошибка, допущенная при измерении этого
значения. Соответственно
характеризует
вектор измеренных значений зависимой
переменной, а и
– вектор
их ошибок.
С учетом (10.1) эконометрическую модель можно представить в следующем виде:
=X+(+и). (10.2)
Дальнейшие выводы зависят от свойств ошибки и. Логично предположить, что вектор и и столбцы матрицы X (значения факторов модели) независимы, и что математическое ожидание ошибки и равно нулю: M[и]=0, и в ряду ut отсутствует автокорреляция. В этом случае очевидно, что привнесение ошибки измерения зависимой переменной ведет лишь к увеличению дисперсии модели, поскольку она при независимости ошибок t и ut определяется следующим выражением:
2=2+u2. (10.3)
Наличие у ошибки ut каких-либо свойств, отличающих ее от “белого шума” или характеризующихся ее статистическими взаимосвязями со значениями параметров хit, приводит к тому, что аналогичные свойства появляются и у суммарной ошибки модели (10.2). В этом случае при оценке ее параметров необходимо использовать соответствующие методы (обобщенный МНК, метод инструментальных переменных).
Если
математическое ожидание ошибки и отлично
от нуля (случай систематической ошибки
измерений), то очевидно, что использование,
например, МНК при оценке параметров
модели (10.2) приведет к смещенным оценкам,
поскольку в этом случае математическое
ожидание вектора ошибок оценок параметров
(ХХ)–1Х(+и)
будет отлично от нуля, так
как M[(ХХ)–1Хи]0
в силу M[и]0.
Однако, если величина смещения
ошибки и известна,
то корректировкой исходных данных
зависимой переменной уt на
ее величину несложно перейти к исходным
условиям задачи, когда
,
где
–
скорректированная ошибка зависимой
переменной.
2. Ошибки измерения независимых переменных хi, i=1,2,..., n.
Предположим,
что истинные значения независимых
переменных равны хit,
а их измеренные значения равны
,
и связь между ними определена следующим
выражением:
где vit – случайная ошибка измерения i-й переменной в момент t, i=1,2,..., n; t=1,2,..., T.
В
отношении этой ошибки будем предполагать,
что ее математическое ожидание равно
нулю, дисперсия (постоянная по времени)
равна
для
каждого i во
временном ряду ошибки vit отсутствуют
автокорреляционные связи и ошибки
измерения различных параметров независимы
между собой, т. е. cov(vi, vj)=0.
Соответствующие матрицы значений независимых переменных в этом случае связаны следующим образом:
где
и Х –
матрицы измеренных и истинных значений
независимых переменных соответственно,
а V –
матрица ошибок измерения.
В этом случае при использовании данных измерений независимых переменных эконометрическая модель может быть представлена в следующем виде:
у= (–V), (10.6)
где–V представляет собой вектор ошибки такой модели.
Оценивая коэффициенты модели (10.6) с помощью МНК, получим
(–V)]=
=
(–V),
(10.7)
где
–
вектор оценок коэффициентов модели .
Из выражения (10.7) непосредственно следует, что свойства оценок определяются вторым слагаемым его правой части. При этом несложно убедиться, что, в частности, оценки являются асимптотически смещенными (а значит и смещенными при конечном объеме выборки Т) и несостоятельными.
Заметим, что при ограниченной выборке, т. е. значение Т конечно, математическое ожидание разности векторов параметров модели и их оценок определяется следующим выражением:
M[ –]=M[ (–V)]=M[ ]–
–M[ V]. (10.8)
Даже
при условии независимости истинных
значений факторов хit и
ошибки t,
второе слагаемое правой части этого
выражения отлично от нуля. Чтобы показать
это, выразим одну из матриц
из
(10.8), с учетом ее вида (10.5). С учетом
независимости х и , х и V и
нулевых математических ожиданий
ошибок иV,
получим
M[
–]=M[
––M[
V]=
M[
V]0,
(10.9)
поскольку математическое ожидание произведения матриц VV не равно нулю.
В частности, при отмеченных выше свойствах ошибки V несложно показать, что
где дисперсия ошибки измерения i-го фактора может быть определена следующим выражением
а нулевой элемент на главной диагонали характеризует нулевую дисперсию единичного столбца матрицы .
Для модели с центрированными переменными в случае одной независимой переменной несложно показать, что величина смещения определяется следующим выражением:
Cov[(–v1),
]=M[(–v1)(
+v)]=–1 M[vv]=
–1v2.
(10.11)
где , – вектора центрированных измеренных и истинных значений независимой переменной соответственно; v – вектор ошибки измерения независимой переменной; v2 – дисперсия этой ошибки, 1 – параметр модели, которая в данном случае имеет следующий вид:
=1
+t.
Наличие
или отсутствие свойства состоятельности
у оценок
(в
предположении, что существует предел
по вероятности вторых моментов измеренных
значений переменных
,
т. е. plim[1/T(
)]0
и предел по вероятности вторых моментов
ошибки измерений plim[1/T(VV)]0)
зависит от равенства (или неравенства)
нулю предела plim[1/T
(–V)],
где, напомним, обозначение plim
характеризует предел по вероятности
при Т (см.
раздел 1.5). Несложно заметить, что это
выражение преобразуется к следующему
виду:
plim[1/T (–V)]= plim(1/T )–plim(1/T V).
При предположении об асимптотической независимости (т. е. при Т) ошибки , измеренных значений факторов и ошибок их измерения получим
plim(1/T V)=plim(1/TХV)+ plim(1/T VV)= plim(1/T VV).
Откуда следует, что асимптотическое смещение оценок параметров эконометрической модели с ошибками измерений независимых переменных определяется следующей формулой:
plim[ –]=–plim (1/T )–1 plim(1/T VV). (10.10)
Очевидно, что правая часть этого выражения не равна нулю, поскольку пределы plim (1/T )–1 и plim(1/T VV) по определению существуют и второй из них представляет собой асимптотическую ковариационную матрицу ошибок измерений.
Поскольку оценка смещенная для конечных значений Т и несостоятельная, то очевидно, что она и асимптотически смещенная.
3. Ошибки измерения зависимой переменной у и независимых переменных, хi, i=1,2,..., n.
Несложно заметить, что при наличии ошибок измерения у зависимой и независимых переменных эконометрическая модель может быть представлена в следующем виде:
(u–V),
(10.12)
где – вектор ошибки истинной модели; u – вектор ошибки измерений зависимой переменной, V – матрица ошибок измерений независимых переменных.
Даже при вполне естественных предположениях о взаимной независимости ошибок , u и V, истинных значений переменных хi и этих ошибок, используя примененные в двух других случаях подходы, можно показать, что:
а) дисперсия такой модели увеличивается по сравнению с моделью, исходные данные которой измерены без ошибок;
б) использование обычного МНК дает смещенные оценки ее параметров.
В частности, заметим, что дисперсия модели (10.12) при этих предположениях определяется следующим выражением:
2=M[(u–V)(u–V)]=M[()+(uu)+(VV)=
=2+u2+v2, (10.13)
а величины смещения при конечном Т и при Т определены выражениями (10.9) и (10.10) соответственно.
Как следует из полученных выше результатов, наибольшие трудности при построении эконометрических моделей с ошибками в исходной информации на основе обычного МНК возникают в случае наличия ошибок измерений у независимых переменных. Они связаны с необходимостью устранения смещения в получаемых оценках. Основным методом, который получил достаточно убедительное теоретическое обоснование и широкое распространение в практике эконометрических исследований в таких случаях является “метод инструментальных переменных”.
Как следует из результатов раздела , сформировав матрицу Z значений инструментальных переменных, некоррелированных, как с ошибкой “истинной” модели , так и с ошибками измерения независимых переменных v, но имеющих ненулевую корреляцию с измеренными переменными хi, состоятельные оценки параметров моделей (10.6) и (10.12) получим согласно следующему выражению:
Напомним, что этот результат в данном случае следует из представления, например, модели (10.6) с инструментальными переменными в следующем виде:
Zy= Z Z(–V), (10.15)
где слагаемое Z(–V) характеризует вектор ошибки этой модели.
Несложно показать, что вектор ошибок оценок параметров модели (10.15) определяется следующим выражением:
(–V)],
(10.16)
При
оговоренных свойствах инструментальных
переменных несложно увидеть, что
математическое ожидание ошибки
равно
нулю, т. е. M[
]=0,
а ковариационная матрица ошибок
определяется выражением:
Cov(
)=M[
]=
(–V)(–V)
(10.17)
В условиях независимости ошибок и V выражение (10.17) приобретает следующий вид:
Cov(
)=(
[Cov()+M(VV)]
(10.18)
где M(VV) является ковариационной матрицей вектора V, т. е. M(VV)=Сov(V).
При условии отсутствия корреляционных связей у ошибок t и vit и независимости ошибок измерения vit, vjt, ij несложно увидеть, что выражение (10.18) приобретает следующий вид:
Cov()+M(VV)=2Е+v2Е=(2 +v2)Е, (10.19)
где v2 – взвешенная по параметрам дисперсия независимых переменных, определяемая в условиях независимости ошибок vit и vjt следующим выражением:
В этом случае ковариационная матрица оценок параметров модели (10.15) будет иметь следующий вид:
Cov(
)=(2+v2) (
На практике при известных оценках параметров сомножитель 2+v2=2 может быть определен на основе следующего выражения:
Асимптотическая несмещенность и состоятельность оценок , полученных с использованием инструментальных переменных z на основании выражения (10.14), вытекает из предполагаемой их независимости в пределе при Т с ошибками и V, и конечных перекрестных предельных моментов с измеренными значениями переменных хi, т. е. , а также независимости и отсутствии автокорреляции у ошибок и V. Иными словами, матрица Z и ошибки и V должны обладать следующими предельными свойствами:
plim(1/T)=2;
plim(1/T VV)=v2;
plim(1/TV)=0;
plim(1/T Z)=0;
plim(1/T ZV)=0; (10.23)
plim(1/T Z
)=
;
plim(1/T Z Z)=
.
С учетом (10.23) для выражения (10.16) несложно показать, что plim[ ]=plim[ –]=0, а ковариационная матрица оценок в пределе определяется следующим выражением:
(–V)(–V)
(10.24)
Учитывая, что
(–V)(–V)Z)=
получим следующее выражение для асимптотической матрицы автокорреляций ошибок вектора :
которое на практике заменяется выражением (10.21).
В разделе 3.3 было отмечено, что основным недостатком использования инструментальных переменных при оценке параметров эконометрических моделей, является увеличение дисперсий этих оценок. При этом их дисперсии увеличиваются пропорционально снижению силы статистической взаимосвязи факторов хi и соответствующих инструментальных переменных zi. При высокой корреляции между этими переменными снижение эффективности не столь значительно.
Напомним,
что увеличение дисперсии оценок при
слабой коррелированности переменных zi и
,
как и ранее, объясняется уменьшением
диагональных элементов матриц (ZX)
и (XZ),
а, следовательно, и ростом соответствующих
показателей их обратных матриц, что
ведет к росту диагональных элементов
в матрице Cov(
)
(см. выражение (10.21)).
Таким образом, при выборе инструментальных переменных должно соблюдаться следующее правило: переменные zi должны коррелировать с измеренными значениями факторов , но быть статистически не связанными с ошибками их измерения vi.
Ранее
в разделе было
показано, что такими свойствами обладают
“сглаженные” значения переменных
,
т. е.
,
определенные на основе аппроксимирующих
функций
=(wi, t),
=(t),
где wi –
набор новых переменных, определяющих
тенденции развития фактора хi,
а t –
фактор времени.
В
отсутствии таких “сглаженных переменных”,
удовлетворительные результаты можно
получить, используя в качестве
инструментальных значений переменныхzi ранги
соответствующих переменных
,
т. е. числа типа 1,2,3,..., характеризующие
порядковые номера уровней этих переменных
в их ранжированном ряду. Иными словами,
1 присваивается значению zi ,
если переменная
принимает
наименьшее значение в ряду
переменных
при t=1,2,....,Т;
значение zik=2,
если значение
является
наименьшим среди всех оставшихся
значений переменных и т. д.