Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Эконометрика. Тихомиров

.pdf
Скачиваний:
458
Добавлен:
27.03.2016
Размер:
6.13 Mб
Скачать

Для каждого индивидуума t (t=1,2,...,Т) модель, определяющая вероятности двух событий, может быть представлена в виде следующей системы:

y1t*=1x1t + 1t, если y1t=1, то y1* 0, если y1=0, то y1*0;

 

y2t*=2x2 t + 2t, если y2t=1, то y2* 0, если y2=0, то y2*0.

(10.72)

Латентные переменные y1t

*

и y2t

*

модели (10.72)

могут

 

 

интерпретироваться в терминах выгоды, получаемой в зависимости от принятого решения соответственно в первом и во втором случаях; х1t и х2t

векторы значений независимых факторов, соответствующих сделанному выбору; 1t и 2t – ошибки соответственно первого и второго уравнений; –

коэффициент ковариации ошибок 1 и 2.

Закон совместного распределения ошибок модели 1 и 2 в общем случае характеризуется следующими параметрами:

M[1]=M[2]=0;

D[1]=D[2]=1* ;

Cov[1, 2]= ,

Согласно модели (10.72) возможны следующие комбинации решений:

y

1

y

2

0;

 

 

 

 

 

 

 

y

1

1, y

2

0;

 

 

 

 

 

 

 

y1

0, y2 1;

 

 

 

 

 

 

 

y1 y2 1.

(10.73)

* Допущение равенства дисперсий – не слишком сильное. Если дисперсия ошибки принимает вместо 1 значение 2, то это равносильно умножению всех коэффициентов на . Знак произведения x при этом не изменится. Соответственно не изменится и соотношение между латентной переменной y* и наблюдаемой переменной y.

Наблюдаемые комбинации образуют массив зависимых переменных

модели (10.72).

В системе (10.72) допускается, что события являются зависимыми между собой, что означает существование ненулевой ковариационной связи между ошибками 1 и 2. Например, возможность приобретения жилья на новом месте может способствовать принятию решения о переезде или, наоборот,

переезд обусловливает необходимость аренды жилья.

Для определения функции закона распределения введем следующие обозначения: q1t=2y1t–1 и q2t=2y2t–1*. Тогда qjt=1, если уjt=1, и qjt=–1, если уjt=0, для j=1,2. Введем также в рассмотрение следующие переменные:

zjt= jxjt и wjt= qjt zjt, j=1,2

и

t*=q1t q2t .

Вероятность того, что зависимые переменные Y1 и Y2 системы (10.72) для конкретного индивидуума принимают соответственно значения y1t и y2t, при,

например, нормальном виде закона их совместного распределения

рассчитывается как

 

P(Y1=y1t, Y2=y2t)= 2(w1t, w2t, t*),

(10.74)

где 2(.) – функция нормального закона совместного

распределения

случайных переменных Y1 и Y2, имеющая следующий вид:

 

2(w1t, w2t, t*)=

w2t

 

w1t

 

2 (u1, u2 , t* )d u1 d u2 ,

 

 

(10.75)

 

 

 

 

*Индекс 2 используется для обозначения двумерного нормального распределения с плотностью 2 и интегральной функцией Ф2. Во всех остальных случаях индекс 2 показывает, что данная переменная находится во втором уравнении модели (10.57). Как и раньше, (.) и Ф(.) обозначают одномерные стандартные нормальные плотности и интегральные функции.

где u1 и u2 – переменные интегрирования и плотность этого распределения имеет следующий вид:

 

 

 

 

 

 

 

 

 

 

(1/2) (w2

w2

2

t*

w

 

 

w

2t

)/(1

t*

2)

 

 

 

 

 

 

 

 

 

 

e

1t

2t

 

 

1t

 

 

 

 

 

 

(

w1t

,

w2t

,

 

)

 

 

 

 

 

 

 

 

 

 

 

 

.

(10.76)

2

t*

 

2 (1

 

2

)

1/2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t*

 

 

 

 

 

 

 

Для определения маржинальных эффектов в модели (10.72) введем в

рассмотрение вектор хt, являющийся объединением векторов х1t и х2t* , и

вектор коэффициентов 1, такие что 1 х1t=1 хt. Вектор 1 составлен из элементов вектора коэффициентов 1 и нулей, стоящих на позициях,

которые соответствуют переменным второго уравнения. Аналогичным образом введем вектор коэффициентов 2: 2 х2t=2 хt. Тогда вероятность того, что значения y1 и y2 одновременно будут равны единице определяется следующим выражением:

P(y1=1, y2=1)=2[1 xt, 2 xt, t*].

(10.77).

Маржинальные эффекты независимых факторов xt для P(y1=1, y2=1) могут быть определены согласно следующему выражению:

2

 

g1t 1+g2t 2,

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

 

 

 

 

 

 

 

 

 

где

 

 

 

 

 

 

 

 

 

 

 

 

gt1

(w1t)

w2t

t*

w1t

,

(10.78)

 

 

 

 

 

 

 

 

 

1 2

 

 

 

 

 

 

 

t*

 

 

* хt =[х1t, х2t] .

Для получения gt2 индексы 1 и 2 в выражении (10.78) нужно поменять

местами* .

 

Математические ожидания зависимых переменных yj, j=1,2

для

конкретных наборов независимых переменных хt в соответствии с выражением (10.50) определяются как

M[yj| xt]= ( j xt), j=1,2.

(10.79)

Для модели (10.72) можно также определить условные математические

ожидания переменных y1t и y2t.

Например, математическое ожидание зависимой переменной первого уравнения при условии, что y2=1, определяется согласно формуле условной

вероятности следующим образом:

 

M[y1|y2=1, xt]=P[y1=1|y2=1, xt]=

 

=P[y1=1,y2=1|xt]/P[y2=1|xt]=

 

= 2( 1 xt, 2 xt, t*)/ ( 2 xt)

(10.80)

Аналогично определяется математическое ожидание зависимой

переменной второго уравнения при условии, что y1=1.

Маржинальные эффекты факторов xt

для функции типа (10.80)

рассчитываются как

 

M[y1|y2=1, xt]/ xt=

=[1/ ( 2 xt)] [ gt1 1+( gt22 ( ( 2 x)/ ( 2 xt)) 2]. (10.81)

Аналогичным образом могут быть построены модели с тремя и более зависимыми переменными, с учетом того, что функционал должен выражать их совместное распределение.

* См. раздел 10.5.

Многомерные модели бинарного выбора с цензурированием.

Бывают ситуации, когда наблюдаемые переменные в двумерной probit-

модели цензурируют одна другую. Например, при оценке возможности кредитования Бойз (Boyes et al., 1989) анализировал данные по следующему правилу:

y1=1, если индивидуум t не получает кредит, y1=0 в противном случае; y2=1, если индивидуум t просит кредит, y1=0 в противном случае.

Для конкретного индивидуума переменная y1 не наблюдаема, пока y2 не принимает значение 1. Таким образом, возможны следующие наборы значений зависимых переменных:

 

 

y

2

0;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

1

0, y

2

1;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

1

y

2

1.

(10.82)

 

 

 

 

 

 

 

 

 

 

(Сравните с (10.73)).

Вероятности событий, определенных выражениями (10.82), согласно

(10.75) оцениваются следующим образом:

 

P(y2=0)=1– ( 2 x2);

 

P(y1=0, y2=1)= 2(– 1 x2, 2 x2, – );

 

P(y1=1, y2=1)= 2( 1 x2, 2 x2, ),

(10.83)

где Ф(.) – функция закона нормального распределения, а функция 2(.)

определена выражением (10.75).

10.3.2. Модели множественного выбора

От многомерных probit-моделей отличаются модели множественного выбора. Многомерные probit-модели предполагают принятие нескольких решений, каждое из которых заключается в выборе одного из двух альтернативных вариантов. В моделях множественного выбора нужно принять одно решение, но выбрать между тремя и более вариантами. Часто рассматриваются два возможных типа альтернатив: упорядоченные и неупорядоченные. Например, выбор средств добраться до работы (на машине, на метро, на автобусе и т. д.) – выбор среди неупорядоченных вариантов. Выбор ценных бумаг, исходя из их рейтинга, – выбор среди упорядоченных вариантов.

Рассмотрим сначала модели с неупорядоченными альтернативными

вариантами.

В них предполагается, что наблюдаемое значение выбора t

индивидуумом j-го варианта (уt=j) связывается со значениями факторов,

сопутствующих его выбору, эконометрическим уравнением следующего вида:

уt= ( ,ztj)+ tj,

(10.84)

где – функция, отражающая характер влияния факторов на выбор t

индивидуумом j-го варианта; tj – ошибка модели; – вектор параметров модели; ztj – вектор независимых переменных –значений факторов,

влияющих на выбор t-го индивидуума, которые могут характеризовать самого индивидуума, альтернативный вариант, либо и то и другое одновременно. Например, при выборе торгового центра для покупки набора товаров вектор ztj может иметь следующую структуру:

ztj =(Kj, Rtj, Dt),

(10.85)

где Kj – количество магазинов в j-м торговом центре; Rtj

– расстояние от

дома t-го индивидуума до j-го торгового центра; Dt

– доход t-го

индивидуума.

 

Заметим, что ошибки tj (t=1,2,...,Т) модели (10.84) определяются как t1=1–

( ,zt1), t2=2– ( ,zt2),..., tJ=J– ( ,ztJ).

На основании модели (10.84) могут быть оценены вероятности выбора t

индивидуумом

каждого из альтернативных вариантов, т. е. Р(уt=1),

Р(уt=2),..., Р(уt=J).

Для этого должны быть известны:

1)функция ( ,ztj);

2)закон распределения ошибок tj.

Предположим, что функция ( ,ztj) имеет линейный вид:

( ztj)= ztj=

(1)

(2)

(n)

,

1 ztj

2 ztj

... n ztj

(10.86)

где ztj

i-я компонента вектора ztj (i=1,...,п).

(i)

 

Соответственно ошибки tj (t=1,2,...,Т) модели (10.84) примут следующий

вид: t1=1– zt1, t2=2– zt2,..., tJ=JztJ.

 

Предположим, что ошибки tj

независимы и распределены по

нормальному закону, тогда вероятность выбора t-м индивидуумом j-го варианта определяется следующим образом:

P( yt j)

 

 

' z

tJ

 

 

' z

 

 

 

' z

 

 

 

 

 

 

 

 

 

 

 

 

 

t, j 1

 

 

t, j 1

 

 

 

 

 

 

 

 

 

 

 

...

 

 

 

 

 

 

 

 

...

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

'zt1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

J

(

u1

,...,

uJ

)d

u1

... d

uj 1

d

uj 1

... d

uJ

,

(10.87)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где u1,..., uJ – переменные интегрирования, а плотность совместного распределения ошибок J (.) определяется как

 

 

 

 

 

 

 

 

 

 

 

 

1

J

( j ' z

tj

)

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

2 tj

 

 

 

 

( ' z

 

,..., ' z

 

)

 

 

 

e

2 j 1

 

. (10.88)

J

t1

tJ

J

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(2 ) 2 (

2

...

2 ) 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t1

 

tJ

 

 

 

 

 

 

 

В выражении (10.88)

2

D(

).

tj

tj

 

Из-за сложности вычисления многомерных интегралов в выражении

(10.87) модели, основанные на нормальном распределении ошибок (probit-

модели), не нашли широкого применения в исследованиях множественного выбора.

Определение вероятностей выбора Р(уt=1), Р(уt=2),..., Р(уt=J) существенно упрощается, если предположить, что ошибки tj независимы и распределены

по закону Вейбулла, т. е.

F(

tj

) exp( e tj ).

 

 

Тогда их совместная плотность распределения может быть представлена в

следующем виде:

J ( t1 ,..., tJ ) ( 1)

 

J

tj

 

tj

 

 

J

П ( e

) exp( e

).

(10.89)

 

 

 

 

 

j=1

 

 

 

 

 

На основании выражения (10.89) получим, что вероятность выбора выбора t-м индивидуумом j-го варианта определяется как

 

 

 

 

 

 

j)

 

 

tJ

 

t, j 1

 

t, j 1

 

 

 

 

 

 

 

P( y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

...

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

 

 

 

 

 

...

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t1

 

 

 

 

 

 

 

 

 

 

 

 

 

J

 

 

 

 

 

J (u1

,...,uJ )d u1...d u j 1d u j 1...d uJ e tj П exp( e tk ).(10.90)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k =1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

С учетом того, что величина ошибки tj

 

 

зависит от величины

ztj, и

J

j) 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P( yt

в этом случае окончательно имеем:

 

 

 

 

 

j 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

e 'ztj

J

 

 

 

 

 

 

 

 

 

 

 

P( yt j)

 

П exp(e 'ztk )

 

e

'ztj

 

 

 

 

 

 

 

 

 

 

 

 

k =1

 

. (10.91)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

J

 

 

J

J

 

 

 

 

 

 

 

 

 

 

 

 

 

 

e 'ztj П exp(e 'ztk )

 

e 'ztk

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j 1

 

 

k =1

 

k 1

 

Выражение (10.91) лежит в основе logit-моделей множественного выбора.

Заметим, что при способе формирования независимых факторов,

соответствующем выражению (10.85), вероятность выбора t-м индивидуумом j-го варианта будет зависеть от тех факторов, которые отражают характеристики только варианта j (число магазинов в j-м торговом центре)

либо совместные характеристики варианта j и индивидуума t (например,

расстояние от дома индивидуума до торгового центра является их совместной характеристикой).

Это можно показать следующим

образом. Представим вектор ztj в

следующем виде: ztj =[хtj, wt], где

вектор хtj

образован факторами,

отражающими характеристики варианта j и совместные характеристики

варианта j и индивидуума t, а вектор wt – факторами, отражающими исключительно характеристики индивидуума t (например, доход). Вектор параметров также представим как совокупность двух векторов =[*, ],

где * – вектор коэффициентов, соответствующих независимым переменным

хtj, а – вектор коэффициентов, соответствующих независимым переменным wt. Введя такое представление в модель (10.88), получим следующее выражение, определяющее вероятность выбора t-м индивидуумом j-го варианта:

 

 

 

e

*' xtj ' wt

 

e

*' xtj

e

' wt

 

e

*' xtj

 

 

P(

 

j)

 

 

 

 

 

 

 

 

 

 

.

(10.92)

 

 

 

 

 

 

 

 

 

 

 

 

 

Y t

 

 

J

 

*' xtj ' wt

 

J

 

*' xtj

 

 

' wt

 

J

 

*' xtj

 

 

 

 

 

e

 

e

e

 

e

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j 1

 

 

j 1

 

 

 

 

 

 

j 1

 

 

 

Из выражения (10.92) непосредственно следует, что независимые переменные wt, которые характеризуют индивидуума (но не характеризуют альтернативный вариант), действительно не будут влиять на распределение вероятностей выбора.

Для учета влияния признаков индивидуумов в модели (10.91) необходимо сформировать несколько другую структуру векторов ztj, отличающуюся от структуры, определенной выражением (10.85). Вектора ztj должны выглядеть следующим образом:

zt1

( xt1 , wt , 0,...0, );

 

 

 

 

 

 

( J 2) L

 

 

zt 2

( xt 2 ,0,...0, wt , 0,...0, );

 

 

 

 

 

 

L

( J 3) L

 

 

(10.93)

zt , j 1 ( xt , j 1 , 0,...0, , wt );

 

 

 

 

 

( J 2) L

 

ztj

( xtj , 0,...0,),

 

 

 

 

 

 

 

( J 1) L

 

 

где L – число компонент в векторе wt.

В рассмотренном выше примере, когда индивидуум с доходом Dt

выбирает один из трех торговых центров в соответствии с выражением

(10.93) вектора ztj примут следующий вид:

 

zt1=(K1, Rt1, Dt, 0);

 

zt2=(K2, Rt2, 0, Dt);

(10.94)

zt3=(K3, Rt3, 0, 0).

 

где Kj – число магазинов в j-м торговом центре, Rtj – расстояние от дома t-го индивидуума до j-го торгового центра.

Таким образом, вероятность выбора t-м индивидуумом j-го альтернативного варианта ставится в зависимость и от характеристик варианта и от характеристик индивидуумов. Однако на практике обычно формируются модели, содержащие только какой-либо один набор однородных факторов. Logit-модель, учитывающая влияние на вероятность выбора t-м индивидуумом j-го альтернативного варианта факторов хtj,

включающих характеристики варианта j и совместные характеристики