
Эконометрика. Тихомиров
.pdfP(yt =J)=1– ( J–1– x t).
где (.) – функция закона стандартного нормального распределения.
Из выражений (10.114) следует, что эти вероятности Р(yt =j), j=0,...,J будут положительными, если выполняется следующее условие:
0 1 2 ... J–1. (10.115)
На рис. 10.4 показано распределение вероятностей выбора конкретных альтернатив.
Рассмотрим особенности определения маржинальных эффектов факторов
хt, которые будут характеризовать изменение вероятности выбора j-го альтернативного варианта при изменении одного из независимых факторов на 1 единицу. Допустим, имеется три варианта (этот случай предполагает только один параметр положения ). В соответствии с выражением (10.114)
вероятности выбора каждого из вариантов определяются как
P(yt=0)= (– xt); |
|
P(yt=1)= ( – xt)– (– xt); |
|
P(yt=2)=1– ( – xt) |
(10.116) |

0.4 f( t)
0.3
0.2
0.1
0 |
|
yt=0 |
yt=1 yt=2 |
yt=3 |
|
|
yt=4 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
1– xt |
2– |
|
3– |
|
|
||
|
|
|
|
||||||
|
|
|
|
Рис.10.4. Вероятности в упорядоченной probit-модели.
Тогда маржинальные эффекты факторов определяются согласно следующему выражению:
P[yt=0]/xt=–(xt);P[yt=1]/xt=[ (– xt)–(– xt)] ;
P[yt=2]/xt= (– xt). (10.117)
где (.) – функция плотности распределения стандартной нормальной переменной.
На рис. 10.5 сплошной линией изображено распределение yt в зависимости от ошибки t. Рисунок характеризует маржинальный эффект при увеличении одного из факторов хit (i=1,2,..., n) при неизменных и . Этот эффект эквивалентен смещению графика распределения вправо, что показано пунктирной линией.

Эконометрическая модель в этом случае связывает количество произошедших событий (у) с факторами, характеризующими условия,
сопровождавшие эти события.
Дискретный характер зависимой переменной дает основание предполагать,
что линейные модели, связывающие число событий с уровнями сопровождающих их факторов, будут не совсем адекватны реальным данным
из-за того, что расчетные значения |
|
t |
могут принимать любые, не |
|
y |
||||
|
|
|
обязательно целые значения. В таких ситуациях более приемлемыми являются модели другого типа, в частности, модель регрессии Пуассона.
Зависимость числа событий уt, произошедших за фиксированный временной интервал (t, t+1) (день, неделя, месяц), от значений влияющих на это число факторов согласно этой модели представляется следующим
образом:
y |
' xt t |
|
|
t , |
(10.118) |
t |
e |
||||
t |
e |
|
|
|
где – вектор параметров уравнения; xt – вектор независимых переменных,
характеризующих условия появления событий; t – ошибка уравнения;
t |
|
e |
. |
(10.119) |
|
|
' xt |
|
|
Предполагается, что число событий уt распределено по закону Пуассона с параметром t.
С учетом этого вероятность осуществления каждого числа событий уt
может быть определена согласно следующему выражению:
P(Y t yt) |
e t |
t |
yt |
, yt |
0,1,2,... |
(10.120) |
yt |
! |
|
||||
|
|
|
|
|
Заметим, что в соответствии с (10.118) при нулевом математическом ожидании ошибки условное математическое ожидание числа событий для заданного набора значений факторов xt определяется как
' xt |
. |
(10.121) |
M [y | xt ] t e |
Согласно модели Пуассона условное математическое ожидание и условная дисперсия при заданных значениях факторов xt равны между собой:
M [y | xt ] D[y | xt ] t . |
(10.122) |
С учетом (10.121) маржинальный эффект факторов может быть оценен следующим образом:
M[y |xt]/ xt= t . |
(10.123) |
Рассмотрим особенности формирования модели Пуассона для случаев цензурирования и усечения исходных значений зависимой переменной уt.
Цензурированной выборке отвечает следующий пример. Предположим,
что модель описывает количество событий, характеризующих частоту посещения врача респондентами в прошлом году. Варианты ответов: 0, 1, 2, 3
и более. Всем ответам, имеющим значение более 2, присваивается значение
3. Цензурированные выборки обычно получают путем объединения ряда значений с низкой вероятностью появления в одно.
Согласно закону Пуассона для цензурированной выборки вероятности того, результирующий показатель уt принимает конкретное значение
(j=0,1,2...), определяются как
|
|
e t |
tj |
|
Pt P( yt |
j) |
|
|
, если yt 0,1,2; |
j ! |
|
|||
|
|
|
|
P( y |
t |
3) 1 P( y |
t |
3) 1 [P( y |
t |
0) P( y |
t |
1) P( y |
t |
2)]. |
(10.125) |
|
|
|
|
|
|
|
Усеченные наборы значений зависимой переменной уt характеризуют ситуацию, когда одно или группа значений выражают специфическое содержание (отличное от того, которое выражено другими значениями).
Например, задан вопрос: “Сколько раз вы посещали курорты в прошедшем году?” Ответ “0” может обозначать отсутствие денег, времени или принципиальное нежелание проводить время таким образом. Ненулевые значения ответов говорят о желании проводить время таким образом. В
таком случае эконометрическая модель может отражать зависимость частоты посещений курорта от факторов жизнедеятельности индивидуума с учетом элиминирования его неприятия курорта как места отдыха.
Если модель формируется для оценки вероятностей принятия переменной
уt только положительных значений (т. е. ее нулевые значения усекаются), то согласно (10.120) выражения, определяющие эти вероятности имеют следующий вид:
|
|
P |
|
|
e |
t |
yt |
|
|
|
Pt |
|
yt |
|
|
|
t |
, если yt |
1,2,..., |
(10.126) |
|
|
P0 |
|
! (1 e t ) |
|||||||
1 |
|
y |
|
|
|
|||||
|
|
|
|
t |
|
|
|
|
|
|
где показатель t определен в соответствии с выражением (10.119).
Отрицательная биномиальная модель.
Как уже отмечалось, в пуассоновской модели предполагается, что математическое ожидание и дисперсия числа событий уt равны друг другу.
Это свойство существенно ограничивает ее применение, поскольку реальные процессы им не обладают. Вследствие этого в эконометрических исследованиях обычно рассматриваются некоторые модификации пуассоновской модели, в которых свойство (10.122) не выполняется.
Например, в условное математическое ожидание (выражение (10.119))
вводится ненаблюдаемое воздействие, которое предполагается случайным:


|
|
|
|
|
|
|
|
|
|
|
|
e |
|
u |
|
( t ut ) |
y |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
t |
|
t |
|
t |
|
|
|
|
|
1 |
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
e |
|
|
|
ut |
d ut |
|||
|
|
f ( y |
| |
xt |
) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ut |
|||||||||
|
|
|
|
|
|
|
|
y |
! |
|
|
|
|
|
Г( ) |
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
t |
|
|
|
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
t |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
y |
t |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
y 1 |
|
|
|
||||
|
|
|
|
|
|
|
|
|
t |
|
e |
|
|
u |
|
1 |
|
|
|
|
( |
|
) u |
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
t |
ut |
|
e |
|
|
ut |
t |
d ut |
|||||||||||||||
|
|
|
|
|
|
|
1) Г( ) |
|
|
|
|
|
|
|
|
|
|
|
|
|
t |
t |
|
|
|
|
|
|
||||||||
|
|
|
Г( y |
t |
|
|
|
|
|
|
|
|
|
|
|
0 |
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
y |
|
Г( yt) |
|
|
|
|
|
|
|
Г( yt) |
|
y |
|
|
|
|
|
|
|||||||||||||||
|
|
t |
|
t |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
y |
|
|
|
|
|
|
|
|
|
|
|
rt |
|
t |
(1 rt) |
|
, (10.131) |
|||||
Г( yt |
1) Г( ) ( t |
) |
t |
|
Г( yt |
1) Г( ) |
|
|
|
|
|
|
|
|
||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
где |
rt |
t |
. |
|
t 1 |
||||
|
|
|
Заметим, что выражение (10.131) является одной из форм представления плотности отрицательного биномиального распределения. Это распределение имеет условное математическое ожидание по xt, равное t, и условную дисперсию – t(1+(1/ ) t). Таким образом, действительно снимается главное ограничение пуассоновской модели – условие равенства математического ожидания и дисперсии числа событий.
Модель преодоления препятствий (hurdle-model).
Данные модели предназначены для описания процессов, нулевые уровни
(значения) которых выражают принципиально другое содержание, по сравнению с положительными, которые, как и в рассмотренных ранее моделях, являются целочисленными. Напомним, что в примере с частотой посещения курортов нулевой ответ означал нежелание проводить время на курорте ни при каких условиях.
Модель преодоления препятствий, предложенная Мюллеэйем (Mullaey, 1986), предполагает, что вероятность нулевого значения процесса не зависит от факторов, влияющих на вероятности остальных значений. Вероятности же ненулевых значений подчинены пуассоновскому закону. С учетом этого модель преодоления препятствий может быть представлена, например, в виде следующей системы уравнений:
P[ yt 0] e ;

|
|
|
|
t |
j |
|
|
P[y |
|
j] |
(1 e |
) e |
t |
, j 1,2,... |
(10.132) |
t |
|
t |
) |
||||
|
|
|
|
|
|||
|
|
|
|
|
|
||
|
|
|
j !(1 e |
|
|
Из первого уравнения системы (10.132) следует, что в данном варианте этой модели для оценки вероятности Р(yt=0), используется показательный закон распределения.
Параметры модели , t определяются на основе исходных данных,
представленных набором значений yt (yt=j, j=0,1,2,...) и факторов хt. При этом
учитывается условие нормировки вероятностей P[yt=j], т. е. |
t |
j] 1. |
|
P[ y |
|
|
j |
|
Несложно заметить, что математическое ожидание зависимой переменной
yt модели (10.132) определяется следующим образом:
|
|
|
|
|
|
|
|
|
|
|
|
) |
|
|
|
|
|
|
|
|
|
|
|
|
|
0 |
(1 e |
|
t , |
(10.133) |
|
|
|
|
|
|
|
|
|
|
M [yt ] e |
1 e |
t |
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
где |
(1 |
e |
|
) |
/ (1 |
e |
|
t |
) – сомножитель, применяемый |
|
|
для |
нормировки |
||
|
|
|
|||||||||||||
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
вероятностей.
Мюллеэй (Mullaey, 1986), Хейлброн (Heilbron, 1989), Ламберт (Lambert, 1992) рассмотрели модификацию модели преодоления препятствий (10.132),
в котором нулевые результаты могут появляться в двух режимах. В первом режиме результирующий показатель – всегда 0. Во втором режиме работает обычный пуассоновский процесс, который может принимать как нулевые,
так и ненулевые значения. Например, значение yt может характеризовать количество бракованных изделий, выпускаемых за определенный промежуток времени. Если производственный процесс контролируется, то количество бракованных деталей равно 0. Если не контролируется, то предполагается, что количество бракованных изделий распределено по закону Пуассона и может принимать как нулевые, так и любые целочисленные значения. Таким образом, вероятности нулевого и ненулевого

количества бракованных изделий могут быть определены согласно следующей схеме:
P[ yt 0] P[режим 1] P[ yt 0|режим 2] P[режим 2];
P[ y |
t |
j] P[ y |
t |
j|режим 2] P[режим 2], j 1,2,... |
(10.134) |
|
|
|
|
Пусть z – индикатор режима 1 (z=0) или 2 (z=1). С учетом этого расширенная модель преодоления препятствий по аналогии с выражением
(10.132) может быть представлена в виде следующей системы:
P[zt=0]=F( wt),
|
|
|
|
|
e |
t |
|
j |
|
|
P[y |
|
j| |
zt |
1] |
|
t |
. |
(10.135) |
||
t |
|
j ! |
|
|||||||
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
где F( wt) – функция, определяющая вероятность первого режима, в качестве которой часто используют функции законов нормального или логистического распределения (см. соответственно выражения (10.50) и
(10.52)); wt – независимые переменные, влияющие на вероятность второго режима; – вектор параметров.
10.4.Модели с ограниченными зависимыми переменными
Впрактике социально-экономических исследований на микро-уровне достаточно часто возникают ситуации, когда зависимая переменная является количественной и непрерывной, т. е. удовлетворяет предпосылкам классической модели, но выборка подвергается усечению или цензурированию.
Усечение имеет место, когда данные выбираются из некоторого большего
по объему подмножества данных (наблюдений), например, в исследовании