- •Глава X. Эконометрические модели со специфическими переменными
- •10.1. Эконометрические модели с ошибками в переменных
- •10.2. Модели с фиктивными независимыми переменными
- •10.3. Модели с дискретными зависимыми переменными
- •10.3.1. Модели бинарного выбора
- •10.3.2. Модели множественного выбора
- •10.3.3. Модели счетных данных
- •10.4. Модели с ограниченными зависимыми переменными
- •10.4.1. Модели усеченных выборок
- •10.4.2. Модели цензурированных выборок
- •10.4.3. Модели случайно усеченных выборок (selection-model)
- •10.5. Методы оценки параметров моделей с дискретными и ограниченными зависимыми переменными
- •10.5.1. Метод максимального правдоподобия
- •10.5.2. Метод максимального счета (mscore)
- •Вопросы к главе X
- •Упражнения к главе х Задание 10.1
- •Задание 10.2
- •Задание 10.3
- •Задание 10.4
- •Задание 10.5
- •Задание 10.6[1]
- •Глава XI. Методы оценки параметров нелинейных эконометрических моделей
- •11.1. Особенности оценки параметров нелинейных моделей
- •11.2. Метод прямого поиска
- •11.3. Методы оценки параметров, основанные на линейной аппроксимации модели
- •11.4. Методы, предполагающие линеаризацию целевой функции
- •11.5. Качественные характеристики оценок параметров нелинейных эконометрических моделей
- •Вопросы к главе XI
- •Глава XII. Использование эконометрических моделей в прогнозировании социально-экономических процессов
- •12.1. Особенности эконометрического прогнозирования
- •12.2. Методы оценки дисперсии прогноза при детерминированном прогнозном фоне
- •12.3. Методы оценки дисперсии прогноза при случайном прогнозном фоне
- •12.4. Прогнозирование на основе моделей временных рядов
- •Вопросы к главе XII
- •Упражнения к главе XII Задание 12.1
- •Задание 12.2
- •Краткий словарь терминов
- •Приложение 1. Функция стандартного нормального распределения
- •Приложение 2. Двусторонние квантили распределения Стьюдента
- •Приложение 5. Квантили распределения 2()
- •Список литературы
10.2. Модели с фиктивными независимыми переменными
Фиктивные переменные вводятся в эконометрическую модель обычно с целью учета воздействия качественных аспектов на закономерности развития рассматриваемых процессов. К таким аспектам, например, относится различие в условиях развития процессов, предопределивших разницу их уровней в разные периоды времени при сохранении их общих тенденций (см. рис. 10.1).
На рис. 10.1 показано, что в период (0, T1) для развития процесса была характерна тенденция (1), а в период (T1+1, T2) – тенденция (2) (например, до дефолта и после дефолта, если дефолт не повлиял на характер самой тенденции).
При этом динамические характеристики этих тенденций (темпы роста, первая производная) совпадают.
у
2
|
|
|
|
1
t
0 T1 T1+1 T2
Рис. 10.1. Пример различий в условиях развития процесса
Если не принимать во внимание отмеченные различия и попытаться построить единую, обобщенную модель для периода (0, T2), то , очевидно, что ее уравнение будет соответствовать пунктирной линии, проходящей между сплошными линиями, характеризующими реальные тенденции процесса в рассматриваемых периодах.
Из рис. (10.1), в частности, также вытекает, что, если эконометрическая модель строится только на основе информации первого периода, то ее уравнение будет иметь следующий вид:
уt=01f(,x)+ t1, (10.26)
а, если только по информации второго периода, то
уt=02f(,x)+ t2, (10.26)
Отличаются эти выражения, если не принимать во внимание возможные различия в их ошибках, только величиной свободного коэффициента, т. е. 0.
Если ввести фиктивную переменную x0i, i=1,2, со следующими свойствами:
х01= 1,
в первый период;
0, во второй период;
х02= 0,
в первый период;
1, во второй период;
то выражения (10.26) и (10.27) могут быть объединены в рамках одной модели следующего вида:
уt=01 х0102х02f(,x)+t. (10.26)
Матрица исходных данных для такой модели будет иметь следующий вид:
Xit – матрица значений основных независимых переменных модели, i=1,2,..., п; t=1,2,....,Т2.
Очевидно, что в этом случае условное математическое ожидание переменной у будет иметь следующий вид:
M[y/ х11, х20, Xit]=01f(,x) для t=1,2,..., Т1;
и
M[y/ х10, х21, Xit]=02f(,x) для t= Т1+1,..., Т2;
Заметим, что для рассматриваемого случая может быть предложена и другая модификация модели (10.28), например, с одной фиктивной переменной (пустьх02), но содержащая свободный член. Ее вид определен следующим уравнением:
уt=0 02х02f(,x)+t, (10.26)
и матрица исходных данных для такой модели примет следующий вид:
Вместе с тем, несложно увидеть, что введение свободного члена в модели (10.28) невозможно, поскольку следствием этого является появление единичного столбца в матрице (10.29), что влечет за собой ее необратимость, поскольку единичный столбец представляет собой линейную комбинацию столбцов значений фиктивных переменных.
Модели типа (10.28) и (10.30) легко могут быть сформированы и на случай большего числа групп фиктивных переменных. Они могут выражать определенные временные периоды (например, с целью учета сезонности), статус объекта и т. п. В частности, в рассматриваемой в первой главе модели заболеваемости такие переменные могут выражать время года (весна, лето, осень зима), половозрастную группу населения (взрослые и дети, мужчины и женщины). В этом случае вводятся две группы переменных – временная и половозрастная (всего восемь). Обозначим эти переменные как s1, s2, s3, s4; q1, q2, q3, q4. При этом
si= 1,
если наблюдения относятся к i-му
времени года, i=1,2,3,4;
0, в остальных случаях;
qj= 1, если наблюдения относятся к j-й половозрастной группе j=1,2,3,4;
0, в остальных случаях;
Тогда эконометрическая модель типа (10.28), описывающая заболеваемость в регионе в зависимости от условий жизнедеятельности, времени года и половозрастной группы индивидуума, может быть представлена в следующем виде:
где хit – факторы жизнедеятельности.
Оставление свободного члена в модели заболеваемости, как и в модели (10.30), приведет к уменьшению числа ее фиктивных переменных. В этом случае выражение (10.32) преобразуется к виду:
При этом для первого временного сезона и первой половозрастной группы получим 0=01+01.
Заметим, что модели типа (10.32) и (10.33) корректны, если все группы населения одинаково реагируют на изменение условий жизнедеятельности и, кроме того, заболеваемость характеризуется параллельными сдвигами со сменой времени года.
В этой связи модели типа (10.28), (10.30) могут быть интерпретированы как сплайн-функции, у которых зависимая переменная у одинаково и “монотонно” реагирует на изменения “количественных” независимых переменных хi на всех рассматриваемых временных интервалах и скачкообразно меняется при смене интервала.
Вместе с тем, фиктивные переменные могут быть применены при построении сплайн-функций любой модификации. Рассмотрим следующий пример. Пусть зависимая переменная у характеризует уровень дохода, а единственная переменная х – возраст индивидуума.
Предполагается, что в различных возрастных группах доход определяется специфическими формами зависимости следующего вида:
Введем фиктивные переменные d1 и d2, такие что d1=1, если х20, и d2=1, если х30. Тогда три уравнения из выражения (10.34) могут быть объединены в одно, следующего вида:
Заметим, что коэффициенты наклона на рассматриваемых участках согласно выражению (10.35) определяются следующим образом:
а свободные члены должны удовлетворять условию равенства функции у соответствующих участков х=20 и х=30. Исходя из этого получим
Выражение (10.37) определяет систему линейных ограничений на коэффициенты модели (10.34) следующего вида:
Подставляя ограничения (10.38) в (10.35), получим рассматриваемую модель дохода как сплайн-функцию в следующем виде:
где, напомним, d1 и d2 – фиктивные переменные, принимающие значения 1 на втором и третьем возрастных интервалах соответственно, и 0 – в противном случае.
В
“фиктивной” форме может быть выражена
и зависимая переменная. Такая ситуация
имеет место, например, при проведении
социологических опросов, когда их
результат может быть представлен двумя
ответами “да”, “нет” (1 или 0)
(предполагаемая покупка автомобиля,
дачи; желание иметь ребенка в семье и
т. п.), а влияющие на этот результат
факторы выражаются в произвольной форме
(количественные характеристики –
уровень дохода, жилая площадь и т. п.,
качественные характеристики – уровень
образования и т. д.). Тогда расчетные
значения
,
определенные по модели при различных
комбинациях значений независимых
переменных хi,
можно интерпретировать как оценку
условий вероятности события у при
фиксированных значениях хi, i=1,2,..., п.
