Эконометрика. Тихомиров
.pdf
|
0 |
|
1 |
|
|
0 |
|
1 |
|
0 |
|
1 |
|
2 |
|
0 |
|
1 |
|
2 |
|
0 |
0 |
1 |
1 |
0 |
|
0 |
|
0 |
1 |
|
1 |
|
1 |
) 30. (10.37) |
|||||||
( |
|
|
) ( |
|
) 30 |
( |
|
|
|
) ( |
|
|
|
Выражение (10.37) |
определяет систему линейных ограничений на |
||||
коэффициенты модели |
(10.34) следующего вида: |
|
|||
|
0 |
1 20 0 |
0 |
20 1; |
|
|
1 |
1 |
1 |
1 |
|
|
|
02 |
12 30 0 02 30 12 . |
(10.38) |
Подставляя ограничения (10.38) в (10.35), получим рассматриваемую модель дохода как сплайн-функцию в следующем виде:
y 0 |
1 |
x 0 |
d1 |
(x 20) 1 d2 (x 30) . |
(10.39) |
0 |
0 |
1 |
|
2 |
|
где, напомним, d1 и d2 – фиктивные переменные, принимающие значения 1 на втором и третьем возрастных интервалах соответственно, и 0 – в противном случае.
В “фиктивной” форме может быть выражена и зависимая переменная.
Такая ситуация имеет место, например, при проведении социологических опросов, когда их результат может быть представлен двумя ответами “да”, “нет” (1 или 0) (предполагаемая покупка автомобиля, дачи; желание иметь ребенка в семье и т. п.), а влияющие на этот результат факторы выражаются в произвольной форме (количественные характеристики – уровень дохода,
жилая площадь и т. п., качественные характеристики – уровень образования
и т. д.). Тогда расчетные значения y , определенные по модели при различных комбинациях значений независимых переменных хi, можно интерпретировать как оценку условий вероятности события у при фиксированных значениях хi, i=1,2,..., п.
10.3. Модели с дискретными зависимыми переменными
Как следует из |
рассмотренного в предыдущих разделах материалов, в |
|||
эконометрических |
исследованиях |
обычно |
предполагается, |
что |
результирующий показатель yt, является количественной величиной, которая в принципе может принимать любые значения на множестве действительных чисел. Однако в экономических и социальных исследованиях часто приходится сталкиваться с разного рода ограничениями на значения зависимой переменной. В частности, зависимая переменная может принимать только целочисленные значения: 0, 1, 2,... Примерами таких зависимых переменных являются:
1а. Семейное положение, которое выражается следующими категориями (и
соответствующими целыми числами):
–холост (1);
–женат (2);
–вдовец (3);
–разведен (4).
1б. Альтернативные товары, между которыми выбирает покупатель, и
которые представляются следующими числами:
–марка А(1);
–марка Б(2);
–марка В(3);
–марка Г(4);
–прочие марки(5).
Очевидно, что в обоих случаях числа служат только для разграничения понятий. Расстояние между двумя числами не имеет никакого значения.
2а. Оценки, полученные на экзамене:
–отлично(5);
–хорошо(4);
–удовлетворительно(3);
–неудовлетворительно(2). 2б. Классы гостиниц:
–пять звезд(1);
–четыре звезды(2);
–три звезды(3);
–две звезды(4) и т. д.
В случаях 2а и 2б (в отличие от 1а и 1б) понятия естественным образом упорядочены, и характеризующие их числа отражают этот порядок. Но различия между 1 и 2 понятиями не обязательно столь же сильные, как между 2 и 3 и т. д.
3. Число предприятий, обанкротившихся в текущем году (0,1,2...). Так называемые счетные данные (count data).
При представлении значений зависимой переменной в целочисленном виде эконометрическая модель, связывающая эти значения с соответствующим набором независимых факторов, имеет специфическое содержание. Обычно такая модель определяет вероятность осуществления события, заключающегося в том, что при известных уровнях независимых факторов зависимая переменная примет конкретное значение j из заданного набора значений j=0,1,2,....
Содержательное уравнение такой модели выглядит следующим образом:
Вероятность(событие j произойдет)=
=Вероятность(Y=j)=F(параметры, факторы). (10.40)
Модели с дискретными зависимыми переменными могут быть классифицированы в зависимости от:
а) типа переменных;
б) выбранного закона распределения.
Всвою очередь, внутри выделенных групп может быть развернута более подробная классификация в зависимости от более детальных свойств классификационных признаков. Эти детальные группировки будут рассмотрены по ходу дальнейшего изложения материала.
Внаучной литературе в зависимости от типа переменных модели с дискретными зависимыми переменными разделяются на модели выбора
среди конечного числа альтернативных вариантов (примеры 1а,1б,2а,2б)
имодели счетных данных (пример 3).
Взависимости от числа вариантов, среди которых осуществляется выбор,
различают модели бинарного выбора и модели множественного выбора. В
отличие от моделей множественного выбора в моделях бинарного выбора результирующий показатель может принимать только два значения: 0 и 1.
К моделям множественного выбора относятся модели с неупорядоченными
(примеры 1а, 1б) и упорядоченными (примеры 2а, 2б) альтернативными вариантами.
Рассмотрим особенности формализованного представления эконометрических моделей с различными видами дискретных зависимых переменных более подробно.
10.3.1. Модели бинарного выбора
Модели бинарного выбора широко используются в экономических и социальных исследованиях, особенно в экономике труда, при проведении анализа на микро-уровне. Покажем их специфические свойства на примере модели трудовой активности населения, исходные предпосылки которой состоят в следующем. Индивидуум в определенный период времени может работать или искать работу (y=1) или не делать этого (y=0). Предположим,
что состояние “работать” или “не работать” определяется набором факторов
(возраст, семейное положение, образование, опыт работы и т. д.), и
соответствующие вероятности можно представить в следующем виде:
P(y=1)= F( x);
P(y=0)=1–F( x). (10.41)
Вектор коэффициентов отражает влияние факторов, например,
характеризующих положение индивидуума в обществе, на рассматриваемую вероятность.
Одной из основных проблем при построении моделей бинарного выбора является обоснование функционала F( x). Например, предположим, как и в случае “классических” эконометрических моделей, что вероятности соответствующих событий могут быть представлены в виде линейной функции от значений рассматриваемых факторов:
|
|
|
|
|
F( x)= x= 0+ 1x1+...+ nxn, |
(10.42) |
где 0, 1,..., |
n |
– |
параметры модели; x1,..., xn – значения |
независимых |
||
факторов. |
|
|
|
|
|
|
Тогда, приняв |
|
|
|
M[yt|x t]=F( xt), соответствующую эконометрическую |
||
y |
t |
|||||
|
|
|
|
|
||
модель можно представить в следующем виде: |
|
|||||
|
|
|
|
|
yt =M[yt |x t]+(yt –M[yt |x t])= x t + t. |
(10.43) |
|
|
|
|
|
|
|
где M[yt|x t]= |
y t – условное математическое ожидание переменной yt при |
условии, что вектор независимых переменных равен x t.
Линейная форма модели представляет определенное удобство для
раскрытия содержания, входящих в нее слагаемых. Прежде всего заметим,
что между их значениями выполняется следующие соотношения (см. табл.
10.1).
|
|
|
Таблица 10.1 |
|
|
|
|
|
|
|
|
|
|
|
|
P(уt=...)= y t |
|
|
|
уt |
|
|
t |
|
|
|
|
|
|
1 |
xt |
1– xt |
(с вероятностью xt) |
|
|
|
|
|
|
0 |
xt |
– xt (с вероятностью 1– xt) |
|
|
|
|
|
|
|
Однако линейная интерпретация (10.42) закона распределения
вероятностей |
достаточно “неудобна” по своим “эконометрическим |
следствиям”. |
|
Во-первых, заметим, что из выражения (10.44) вытекает, что ошибка гетероскедастична, поскольку дисперсия ошибки зависит от вектора x. В
таких условиях оценки параметров модели (10.43), полученные на основе выражения (10.48), являются неэффективными. Для получения эффективных
оценок ее параметров, необходимо использовать обобщенный МНК.
Во-вторых, любой метод оценки параметров линейных моделей бинарного выбора не дает гарантий, что результат произведения x может принимать
значения только на интервале [0, 1]. С учетом выражения (10.44) несложно заметить, что при отрицательных значениях этого произведениях и значениях больших единицы будет иметь место и другой абсурдный результат – отрицательная дисперсия остатков. Это обстоятельство существенно ограничивает область применения линейной модели бинарного выбора. На практике она используется только для предварительной обработки данных и для сопоставления с результатами, полученными более тонкими методами.
Из приведенных рассуждений вытекает, что модель бинарного выбора должна удовлетворять двум условиям:
и
lim |
P(Y 1) 1 |
|
' x |
|
|
|
lim P(Y 1) 0, |
(10.49) |
' x
где x – область значений x, при которых P(y=1)=1, а x – – область значений x, при которых P(y=1)=0.
При этом между значениями составных частей регрессионного уравнения должно выполняться следующее соответствие (см. табл. 10.2).