Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебник 2.docx
Скачиваний:
10
Добавлен:
01.05.2025
Размер:
802.32 Кб
Скачать

10.3.3. Модели счетных данных

В практических исследованиях достаточно часто приходится сталкиваться с зависимыми переменными, которые представляют собой результаты подсчетов. Примерами таких переменных являются число выданных за год патентов, количество выпускников вузов, число аварий на судах и т. д. Эконометрическая модель в этом случае связывает количество произошедших событий (у) с факторами, характеризующими условия, сопровождавшие эти события.

Дискретный характер зависимой переменной дает основание предполагать, что линейные модели, связывающие число событий с уровнями сопровождающих их факторов, будут не совсем адекватны реальным данным из-за того, что расчетные значения   могут принимать любые, не обязательно целые значения. В таких ситуациях более приемлемыми являются модели другого типа, в частности, модель регрессии Пуассона.

Зависимость числа событий уt, произошедших за фиксированный временной интервал (tt+1) (день, неделя, месяц), от значений влияющих на это число факторов согласно этой модели представляется следующим образом:

 

 

где  – вектор параметров уравнения; xt  – вектор независимых переменных, характеризующих условия появления событий; t – ошибка уравнения;

  .                             (10.119)

 

Предполагается, что число событий уt  распределено по закону Пуассона с параметром t.

С учетом этого вероятность осуществления каждого числа событий уt может быть определена согласно следующему выражению:

 

 

Заметим, что в соответствии с (10.118) при нулевом математическом ожидании ошибки условное математическое ожидание числа событий для заданного набора значений факторов x  определяется как

 

 

Согласно модели Пуассона условное математическое ожидание и условная дисперсия при заданных значениях факторов xt  равны между собой:

 

 

С учетом (10.121) маржинальный эффект факторов может быть оценен следующим образом:

 

M[y |xt]/ xt=t.                         (10.123)

 

Рассмотрим особенности формирования модели Пуассона для случаев цензурирования и усечения исходных значений зависимой переменной уt.

Цензурированной выборке отвечает следующий пример. Предположим, что модель описывает количество событий, характеризующих частоту посещения врача респондентами в прошлом году. Варианты ответов: 0, 1, 2, 3 и более.  Всем ответам, имеющим значение более 2, присваивается значение 3. Цензурированные выборки обычно получают путем объединения ряда значений с низкой вероятностью появления в одно.

Согласно закону Пуассона для цензурированной выборки вероятности того, результирующий показатель уt принимает конкретное значение (j=0,1,2...), определяются как

 

Усеченные наборы значений зависимой переменной уt  характеризуют ситуацию, когда одно или группа значений выражают специфическое содержание (отличное от того, которое выражено другими значениями). Например, задан вопрос: “Сколько раз вы посещали курорты в прошедшем году?”  Ответ “0” может обозначать  отсутствие денег, времени или принципиальное нежелание проводить время таким образом. Ненулевые значения ответов говорят о желании проводить время таким образом. В таком случае эконометрическая модель может отражать зависимость частоты посещений курорта от факторов жизнедеятельности индивидуума с учетом элиминирования его неприятия курорта как места отдыха.

Если модель формируется для оценки вероятностей принятия переменной уt  только положительных значений (т. е. ее нулевые значения усекаются), то согласно (10.120) выражения, определяющие эти вероятности имеют следующий вид:

 

 

где  показатель t  определен в соответствии с  выражением (10.119).

Отрицательная биномиальная модель.

Как уже отмечалось, в пуассоновской модели предполагается, что математическое ожидание и дисперсия числа событий уt равны друг другу. Это свойство существенно ограничивает ее применение, поскольку реальные процессы им не обладают. Вследствие этого в эконометрических исследованиях обычно рассматриваются некоторые модификации пуассоновской модели, в которых свойство (10.122) не выполняется. Например, в условное математическое ожидание  (выражение (10.119)) вводится ненаблюдаемое воздействие, которое предполагается случайным:

 

t=t ut= ,

 

где t  – условное (по воздействию ut) математическое ожидание переменной ytut .

Согласно выражению (10.127) распределение уt, обусловленное факторами x t  и ошибкой ut, остается пуассоновским. Его плотность, определяемая набором вероятностей Р(yt=j|xtut), имеет следующий вид:

 

 

Из выражения (10.128) следует, что вероятность числа событий yt=j при условии xtut   является случайной величиной, зависящей от ошибки utM[Р(yt=j|xt,ut)]= =f(yt|xt). В этом случае функция  плотности “обычного” пуассоновского закона имеет вид математического ожидания функции (10.128):

 

 

где g(ut) – функция плотности распределения ошибки ut.

Вид функции g(ut) определяет и характер распределения уt|xt. В теории с целью упрощения математических выкладок в качестве g(ut) обычно рассматривают гамма-распределение, т. е.

 

 

С учетом (10.130) выражение математического ожидания функции плотности примет следующий вид:

 

 Заметим, что выражение (10.131) является одной из форм представления плотности отрицательного биномиального распределения. Это распределение имеет условное математическое ожидание по xt, равное t, и условную дисперсию –t(1+(1/)t). Таким образом, действительно снимается главное ограничение пуассоновской модели – условие равенства математического ожидания и дисперсии числа событий.

Модель преодоления препятствий (hurdle-model).

Данные модели предназначены для описания процессов, нулевые уровни (значения) которых выражают принципиально другое содержание, по сравнению с положительными, которые, как и в рассмотренных ранее моделях, являются целочисленными. Напомним, что в примере с частотой посещения курортов нулевой ответ означал нежелание проводить время на курорте ни при каких условиях.

Модель преодоления препятствий, предложенная Мюллеэйем (Mullaey, 1986), предполагает, что вероятность нулевого значения процесса не зависит от факторов, влияющих на  вероятности остальных значений. Вероятности же ненулевых значений подчинены пуассоновскому закону. С учетом этого модель преодоления препятствий может быть представлена, например, в виде следующей системы уравнений:

 

 

Из первого уравнения системы (10.132) следует, что в данном варианте этой модели для оценки вероятности Р(yt=0), используется показательный закон распределения.

 Параметры модели t  определяются на основе исходных данных, представленных набором значений yt (yt=jj=0,1,2,...) и факторов хt. При этом учитывается условие нормировки вероятностей P[yt=j], т. е. 

Несложно заметить, что математическое ожидание зависимой переменной yt  модели (10.132) определяется следующим образом:

 

 

где  / – сомножитель, применяемый для нормировки вероятностей.

Мюллеэй (Mullaey, 1986), Хейлброн (Heilbron, 1989), Ламберт (Lambert, 1992) рассмотрели модификацию модели преодоления препятствий (10.132), в котором нулевые результаты могут появляться в двух режимах. В первом режиме результирующий показатель – всегда 0. Во втором режиме работает обычный пуассоновский процесс, который может принимать как нулевые, так и ненулевые значения. Например, значение yt  может характеризовать количество бракованных изделий, выпускаемых за определенный промежуток времени. Если производственный процесс контролируется, то количество бракованных деталей равно 0. Если не контролируется, то предполагается, что количество бракованных изделий распределено по закону Пуассона и может принимать как нулевые, так и любые целочисленные значения. Таким образом, вероятности нулевого и ненулевого количества бракованных изделий могут быть определены согласно следующей схеме:

 

 

 

Пусть z – индикатор режима 1 (z=0) или 2 (z=1). С учетом этого расширенная модель преодоления препятствий по аналогии с выражением (10.132) может быть представлена в виде следующей системы:

 

P[zt=0]=F(wt),

 

где F(wt) – функция, определяющая вероятность первого режима, в качестве которой часто используют функции законов нормального или логистического распределения (см. соответственно выражения (10.50) и (10.52)); wt  – независимые переменные, влияющие на вероятность второго режима;  – вектор параметров.