
Эконометрика. Тихомиров
.pdf
Для каждого индивидуума t (t=1,2,...,Т) модель, определяющая вероятности двух событий, может быть представлена в виде следующей системы:
y1t*=1x1t + 1t, если y1t=1, то y1* 0, если y1=0, то y1*0; |
|
||||
y2t*=2x2 t + 2t, если y2t=1, то y2* 0, если y2=0, то y2*0. |
(10.72) |
||||
Латентные переменные y1t |
* |
и y2t |
* |
модели (10.72) |
могут |
|
|
интерпретироваться в терминах выгоды, получаемой в зависимости от принятого решения соответственно в первом и во втором случаях; х1t и х2t –
векторы значений независимых факторов, соответствующих сделанному выбору; 1t и 2t – ошибки соответственно первого и второго уравнений; –
коэффициент ковариации ошибок 1 и 2.
Закон совместного распределения ошибок модели 1 и 2 в общем случае характеризуется следующими параметрами:
M[1]=M[2]=0;
D[1]=D[2]=1* ;
Cov[1, 2]= ,
Согласно модели (10.72) возможны следующие комбинации решений:
y |
1 |
y |
2 |
0; |
|
||
|
|
|
|
|
|
||
y |
1 |
1, y |
2 |
0; |
|
||
|
|
|
|
|
|
||
y1 |
0, y2 1; |
|
|||||
|
|
|
|
|
|
y1 y2 1. |
(10.73) |
* Допущение равенства дисперсий – не слишком сильное. Если дисперсия ошибки принимает вместо 1 значение 2, то это равносильно умножению всех коэффициентов на . Знак произведения x при этом не изменится. Соответственно не изменится и соотношение между латентной переменной y* и наблюдаемой переменной y.


где u1 и u2 – переменные интегрирования и плотность этого распределения имеет следующий вид:
|
|
|
|
|
|
|
|
|
|
(1/2) (w2 |
w2 |
2 |
t* |
w |
|
|
w |
2t |
)/(1 |
t* |
2) |
|
|
|
|
|
|
|
|
|
|
|
e |
1t |
2t |
|
|
1t |
|
|
|
|
|||||
|
|
( |
w1t |
, |
w2t |
, |
|
) |
|
|
|
|
|
|
|
|
|
|
|
|
. |
(10.76) |
|
2 |
t* |
|
2 (1 |
|
2 |
) |
1/2 |
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
t* |
|
|
|
|
|
|
|
Для определения маржинальных эффектов в модели (10.72) введем в
рассмотрение вектор хt, являющийся объединением векторов х1t и х2t* , и
вектор коэффициентов 1, такие что 1 х1t=1 хt. Вектор 1 составлен из элементов вектора коэффициентов 1 и нулей, стоящих на позициях,
которые соответствуют переменным второго уравнения. Аналогичным образом введем вектор коэффициентов 2: 2 х2t=2 хt. Тогда вероятность того, что значения y1 и y2 одновременно будут равны единице определяется следующим выражением:
P(y1=1, y2=1)=2[1 xt, 2 xt, t*]. |
(10.77). |
Маржинальные эффекты независимых факторов xt для P(y1=1, y2=1) могут быть определены согласно следующему выражению:
2 |
|
g1t 1+g2t 2, |
|
|
|
|
|
|
|
|
x |
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
t |
|
|
|
|
|
|
|
|
|
|
где |
|
|
|
|
|
|
|
|
|
|
|
|
gt1 |
(w1t) |
w2t |
t* |
w1t |
, |
(10.78) |
||
|
|
|
|
|
|
|
||||
|
|
1 2 |
||||||||
|
|
|
|
|
|
|
t* |
|
|
* хt =[х1t, х2t] .

Многомерные модели бинарного выбора с цензурированием.
Бывают ситуации, когда наблюдаемые переменные в двумерной probit-
модели цензурируют одна другую. Например, при оценке возможности кредитования Бойз (Boyes et al., 1989) анализировал данные по следующему правилу:
y1=1, если индивидуум t не получает кредит, y1=0 в противном случае; y2=1, если индивидуум t просит кредит, y1=0 в противном случае.
Для конкретного индивидуума переменная y1 не наблюдаема, пока y2 не принимает значение 1. Таким образом, возможны следующие наборы значений зависимых переменных:
|
|
y |
2 |
0; |
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
y |
1 |
0, y |
2 |
1; |
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
y |
1 |
y |
2 |
1. |
(10.82) |
|
|
|
|
|
|
|
|
|
|
(Сравните с (10.73)).
Вероятности событий, определенных выражениями (10.82), согласно
(10.75) оцениваются следующим образом: |
|
P(y2=0)=1– ( 2 x2); |
|
P(y1=0, y2=1)= 2(– 1 x2, 2 x2, – ); |
|
P(y1=1, y2=1)= 2( 1 x2, 2 x2, ), |
(10.83) |
где Ф(.) – функция закона нормального распределения, а функция 2(.)
определена выражением (10.75).
10.3.2. Модели множественного выбора
От многомерных probit-моделей отличаются модели множественного выбора. Многомерные probit-модели предполагают принятие нескольких решений, каждое из которых заключается в выборе одного из двух альтернативных вариантов. В моделях множественного выбора нужно принять одно решение, но выбрать между тремя и более вариантами. Часто рассматриваются два возможных типа альтернатив: упорядоченные и неупорядоченные. Например, выбор средств добраться до работы (на машине, на метро, на автобусе и т. д.) – выбор среди неупорядоченных вариантов. Выбор ценных бумаг, исходя из их рейтинга, – выбор среди упорядоченных вариантов.
Рассмотрим сначала модели с неупорядоченными альтернативными
вариантами.
В них предполагается, что наблюдаемое значение выбора t-м
индивидуумом j-го варианта (уt=j) связывается со значениями факторов,
сопутствующих его выбору, эконометрическим уравнением следующего вида:
уt= ( ,ztj)+ tj, |
(10.84) |
где – функция, отражающая характер влияния факторов на выбор t-м
индивидуумом j-го варианта; tj – ошибка модели; – вектор параметров модели; ztj – вектор независимых переменных –значений факторов,
влияющих на выбор t-го индивидуума, которые могут характеризовать самого индивидуума, альтернативный вариант, либо и то и другое одновременно. Например, при выборе торгового центра для покупки набора товаров вектор ztj может иметь следующую структуру:
ztj =(Kj, Rtj, Dt), |
(10.85) |

|
|
|
|
|
|
|
|
|
|
|
|
1 |
J |
( j ' z |
tj |
) |
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
1 |
|
|
2 tj |
|
|
|||
|
|
( ' z |
|
,..., ' z |
|
) |
|
|
|
e |
2 j 1 |
|
. (10.88) |
||||
J |
t1 |
tJ |
J |
|
|
1 |
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
(2 ) 2 ( |
2 |
... |
2 ) 2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
t1 |
|
tJ |
|
|
|
|
|
|
|
В выражении (10.88) |
2 |
D( |
). |
tj |
tj |
|
Из-за сложности вычисления многомерных интегралов в выражении
(10.87) модели, основанные на нормальном распределении ошибок (probit-
модели), не нашли широкого применения в исследованиях множественного выбора.
Определение вероятностей выбора Р(уt=1), Р(уt=2),..., Р(уt=J) существенно упрощается, если предположить, что ошибки tj независимы и распределены
по закону Вейбулла, т. е. |
F( |
tj |
) exp( e tj ). |
|
|
Тогда их совместная плотность распределения может быть представлена в
следующем виде:
J ( t1 ,..., tJ ) ( 1) |
|
J |
tj |
|
tj |
|
|
J |
П ( e |
) exp( e |
). |
(10.89) |
|||
|
|
|
|||||
|
|
j=1 |
|
|
|
|
|
На основании выражения (10.89) получим, что вероятность выбора выбора t-м индивидуумом j-го варианта определяется как
|
|
|
|
|
|
j) |
|
|
tJ |
|
t, j 1 |
|
t, j 1 |
|
|
|
|
|||
|
|
|
P( y |
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
... |
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
t |
|
|
|
|
|
|
... |
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
t1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
J |
|
|
|
|
|
|
J (u1 |
,...,uJ )d u1...d u j 1d u j 1...d uJ e tj П exp( e tk ).(10.90) |
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
k =1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
С учетом того, что величина ошибки tj |
|
|
зависит от величины |
– ztj, и |
||||||||||||||||
J |
j) 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
P( yt |
в этом случае окончательно имеем: |
|
|
|
|
|
||||||||||||||
j 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
e 'ztj |
J |
|
|
|
|
||
|
|
|
|
|
|
|
P( yt j) |
|
П exp(e 'ztk ) |
|
e |
'ztj |
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
k =1 |
|
. (10.91) |
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
J |
|
|
J |
J |
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
e 'ztj П exp(e 'ztk ) |
|
e 'ztk |
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
j 1 |
|
|
k =1 |
|
k 1 |
|

Выражение (10.91) лежит в основе logit-моделей множественного выбора.
Заметим, что при способе формирования независимых факторов,
соответствующем выражению (10.85), вероятность выбора t-м индивидуумом j-го варианта будет зависеть от тех факторов, которые отражают характеристики только варианта j (число магазинов в j-м торговом центре)
либо совместные характеристики варианта j и индивидуума t (например,
расстояние от дома индивидуума до торгового центра является их совместной характеристикой).
Это можно показать следующим |
образом. Представим вектор ztj в |
|
следующем виде: ztj =[хtj, wt], где |
вектор хtj |
образован факторами, |
отражающими характеристики варианта j и совместные характеристики
варианта j и индивидуума t, а вектор wt – факторами, отражающими исключительно характеристики индивидуума t (например, доход). Вектор параметров также представим как совокупность двух векторов =[*, ],
где * – вектор коэффициентов, соответствующих независимым переменным
хtj, а – вектор коэффициентов, соответствующих независимым переменным wt. Введя такое представление в модель (10.88), получим следующее выражение, определяющее вероятность выбора t-м индивидуумом j-го варианта:
|
|
|
e |
*' xtj ' wt |
|
e |
*' xtj |
e |
' wt |
|
e |
*' xtj |
|
|
|||||
P( |
|
j) |
|
|
|
|
|
|
|
|
|
|
. |
(10.92) |
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
Y t |
|
|
J |
|
*' xtj ' wt |
|
J |
|
*' xtj |
|
|
' wt |
|
J |
|
*' xtj |
|
|
|
|
|
|
e |
|
e |
e |
|
e |
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
j 1 |
|
|
j 1 |
|
|
|
|
|
|
j 1 |
|
|
|
Из выражения (10.92) непосредственно следует, что независимые переменные wt, которые характеризуют индивидуума (но не характеризуют альтернативный вариант), действительно не будут влиять на распределение вероятностей выбора.
Для учета влияния признаков индивидуумов в модели (10.91) необходимо сформировать несколько другую структуру векторов ztj, отличающуюся от структуры, определенной выражением (10.85). Вектора ztj должны выглядеть следующим образом:
zt1 |
( xt1 , wt , 0,...0, ); |
|
|
|
|
|
|
|
( J 2) L |
|
|
zt 2 |
( xt 2 ,0,...0, wt , 0,...0, ); |
|
|
|
|
|
|
|
L |
( J 3) L |
|
|
(10.93) |
||
zt , j 1 ( xt , j 1 , 0,...0, , wt ); |
|
||
|
|
|
|
|
( J 2) L |
|
|
ztj |
( xtj , 0,...0,), |
|
|
|
|
|
|
|
( J 1) L |
|
|
где L – число компонент в векторе wt.
В рассмотренном выше примере, когда индивидуум с доходом Dt
выбирает один из трех торговых центров в соответствии с выражением
(10.93) вектора ztj примут следующий вид: |
|
zt1=(K1, Rt1, Dt, 0); |
|
zt2=(K2, Rt2, 0, Dt); |
(10.94) |
zt3=(K3, Rt3, 0, 0). |
|
где Kj – число магазинов в j-м торговом центре, Rtj – расстояние от дома t-го индивидуума до j-го торгового центра.
Таким образом, вероятность выбора t-м индивидуумом j-го альтернативного варианта ставится в зависимость и от характеристик варианта и от характеристик индивидуумов. Однако на практике обычно формируются модели, содержащие только какой-либо один набор однородных факторов. Logit-модель, учитывающая влияние на вероятность выбора t-м индивидуумом j-го альтернативного варианта факторов хtj,
включающих характеристики варианта j и совместные характеристики