Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Эконометрика. Тихомиров

.pdf
Скачиваний:
458
Добавлен:
27.03.2016
Размер:
6.13 Mб
Скачать

доходов рассматриваются семьи с доходами ниже или выше определенного уровня (скажем, черты бедности).

Вместо усечения выборок может применяться также их цензурирование. В

частности, в исследованиях доходов рассматривается вся выборка, но принимается, что у семей с доходами выше или ниже определенного уровня доходы находятся на этом же уровне. Следствием цензурирования и усечения выборок является искажение значений выборочных параметров распределений, в частности, их математических ожиданий и дисперсий.

Соответственно выводы, полученные на основании усеченных и цензурированных выборок, следует очень осторожно распространять на генеральную совокупность.

10.4.1. Модели усеченных выборок

Предположим, усеченное распределение является частью неусеченного распределения, которая находится выше или ниже определенного порогового значения.

Плотность непрерывной случайной переменной z, усеченной выше уровня b, определяется согласно следующему выражению:

f (z|z b)

f (z)

.

(10.136)

P(z b)

 

 

 

Выражение (10.136) вытекает, из формулы условной вероятности. В самом деле, условная вероятность того, что случайная величина z примет некоторое значение при условии, что z b, определяется следующим образом:

b

f (z| z b)dz

 

f (z, z b)dz /

f (z b)dz.

(10.137)

 

b

b

 

Продифференцировав левую и правую части выражения (10.137) по z,

получим (10.136).

Во многих практических исследованиях предполагается, что случайная величина z распределена по нормальному закону. В этом случае вероятность того, что z b определяется согласно следующему выражению:

P(z b) 1

b

1

( ),

(10.138)

 

 

 

 

 

где и соответственно математическое ожидание и стандартное отклонение случайной величины z; =(b– )/ ; Ф(.) – значение стандартной нормальной интегральной функции распределения в соответствующей точке.

Тогда согласно выражению (10.136), функция плотности усеченного нормального распределения определяется как:

 

 

 

 

 

 

 

 

2

 

2

 

 

1

 

z

 

 

f (z)

 

(2

1/2

) e

(z )

/(2

)

 

 

 

 

 

 

 

 

 

 

 

 

f (z| z b)

 

 

 

 

 

 

 

 

 

 

 

, (10.139)

( )

 

 

( )

 

 

 

 

 

( )

1

 

 

1

 

 

 

 

 

1

 

где (.) – стандартная нормальная функция распределения.

На рис. 10.6 представлены графики функций плотностей усеченного стандартного нормального распределения с =0 и =1 для b=–0,5; 0; 0,5. Из графиков, представленных на этом рисунке следует, что усечение как бы

“поднимает” функцию плотности на оставшемся после усечения участке над

графиком этой функции “неусеченного” распределения.

В дальнейшем случайную переменную с усеченным распределением будем

называть усеченной случайной переменной.

Заметим, что математическое ожидание и дисперсия усеченной случайной

переменной определяются согласно следующим выражениям:

M[z|z b]=

zf (z|z b)dz.

(10.140)

 

 

b

 

 

D[z|z b]=

 

 

 

 

(z M [z|z b])2

f (z|z b)dz.

(10.141)

 

b

 

 

 

Проведя интегрирование в выражениях (10.140)–(10.141) с учетом того,

что функция плотности f(z, z b) определена выражением (10.139), получим,

что математическое ожидание и дисперсия усеченной случайной переменной z соответственно равны:

M[z|при усечении]= + ( ).

(10.142)

D[z|при усечении]= 2 [1– ( )].

(10.143)

где =(b– )/ ;

 

( )= ( )/[1– ( )], если z b;

(10.144)

( )=– ( )/ ( ), если z b;

(10.145)

( )= ( ) [ ( )– ].

(10.146)

Пло тно с ть

 

 

 

 

 

 

1.2

 

 

 

 

 

 

 

Указатель

 

 

 

 

1

усечения

 

 

 

 

Среднее

 

 

 

 

 

 

 

 

 

0.8

значение

 

 

 

 

 

 

 

 

 

 

0.6

 

 

 

 

 

 

0.4

 

 

 

 

 

 

0.2

 

 

 

 

 

x

 

 

 

 

 

 

0

 

 

 

 

 

 

-3

-2

-1

0

1

2

3

Рис. 10.6. Зависимости плотностей усеченного нормального

распределения от степени усечения

Функцию ( ) называют обратным отношением Миллса или функцией отказов (hazard-function), b – степенью усечения.

Заметим, что ( ) 1 при любом значении .

Из выражения (10.142) следует, что математическое ожидание усеченной стандартной нормальной переменной является функцией от степени усечения

(см. рис. 10.7).

Рассмотрим некоторые результаты, приведенные на рис. 10.7. В частности,

математическое ожидание стандартной нормальной величины при усечении z 0 равно 0,79, а при усечении z b равно –0,79.

Несложно также убедиться, что вероятность того, что х меньше b, является возрастающей функцией от b. С возрастанием этой вероятности увеличивается количество нерассматриваемых элементов совокупности, а,

следовательно, возрастает и математическое ожидание усеченной случайной переменной.

M[z|z b

0,79

b

0

M[z|z b]

Рис. 10.7. Графики зависимости математических ожиданий

стандартной нормальной величины от степени усечения

На рис. 10.8 приведена функция, отражающая взаимосвязь между математическим ожиданием M[z|z b] и вероятностью Р[z b] для

стандартного нормального распределения.

3 M[z|z b]

P[z b]=0 b

2

1

P[z b

0

0

0.5

1

Рис.10.8. Условное среднее как функция степени усечения.

Предположим, что зависимость некоторой случайной переменной yt, от значений влияющих на нее факторов, можно представить следующим образом:

yt =xt + t,

(10.148)

где xt – вектор независимых переменных, влияющих на переменную yt; –

вектор параметров; t – ошибка модели, в отношении которой предполагается, что она распределена по стандартному нормальному закону с нулевым математическим ожиданием и постоянной дисперсией, t N[0,

2].

Переменная yt, описанная выражением (10.148), распределена по нормальному закону с математическим ожиданием t=xt и дисперсией 2.

Рассмотрим распределение зависимой переменной yt

при условии, что

наблюдаемые значения yt

превышают некоторый

порог b. Согласно

выражению (10.142) получим, что условное математическое ожидание yt для модели (10.148) является нелинейной функцией от хt и , и определяется как

M[yt | yt b]=xt +

 

[(b ' xt ) / ]

.

(10.149)

 

[(b ' xt ) / ]

1

 

 

Перепишем выражение (10.149) с использованием функции отказов (t)

(см. выражение (10.144)):

M[yt | yt b]=xt +(t),

(10.150)

где t =(b xt)/ .

С учетом вида выражения (10.150) оценим величину маржинального эффекта факторов xt для случая усеченной выборки:

M [y

| y

 

b]

 

t

 

t

 

 

 

 

x

 

 

 

 

t

 

 

 

 

d

d

 

t t

 

 

t

 

 

 

 

x

 

 

t

 

( t

t

t)

 

=

2

 

 

 

 

 

 

 

 

 

2

t

t) (1 ( t)).

(10.151)

(1 t

Поскольку для каждого набора факторов xt выполняется соотношение 0 (t) 1, то из выражения (10.151) вытекает, что для любого xit (i=1,2,..., n; t=1,2,...,T) маржинальный эффект меньше соответствующего коэффициента

i.

Заметим, что в силу специфики выражения (10.150) ошибка t модели

(10.146), построенной для усеченной выборки, имеет математическое

ожидание (t). Дисперсия

ошибки t

в этом случае

определяется

следующим образом:

 

 

 

 

D[t | yt b]= 2[1–(t)].

(10.152)

где 2 – дисперсия ошибки модели (10.148), построенной на неусеченной выборке; ( t)= ( t)[ ( t)– t]; ( t)= ( t)/[1–( t)]; t =(b xt)/ .

Таким образом, из выражений (10.150) и (10.152) вытекает, что оценки параметров модели (10.148), определенные на основании усеченной выборки зависимой переменной (yt b или yt b), являются смещенными и

несостоятельными по сравнению с оценками, которые могли бы быть получены по полной выборке.

10.4.2. Модели цензурированных выборок

Напомним, что в случае цензурирования зависимой переменной yt вместо ее значений выше (или ниже) определенного уровня рассматривается сам этот уровень.

Например, если спрос на билеты существенно превышает предложение, то за уровень спроса принимается количество проданных билетов

(цензурирование сверху). В этом случае распределение случайной величины может быть представлено в виде сочетания дискретного и непрерывного распределений (см. рис. 10.9).

Спрос на ме с та

П рода нные биле ты

Рис. 10.9. Распределение, цензурированное “сверху”

Подходы к исследованию цензурированных и усеченных выборок очень похожи. Также обычно предполагают, что случайная переменная у имеет нормальное распределение.

Покажем, как изменятся математическое ожидание и дисперсия случайной переменной у, если выборка ее значений цензурируется снизу.

Введем в рассмотрение новую случайную переменную у*, такую, что

если у* b, то у=b;

 

если у* b, то у=у*,

(10.153)

где b – точка цензурирования.

Если у* N[ , 2], то математическое ожидание и дисперсия

цензурированной случайной величины y соответственно равны*

 

M[y]= b+(1– ) ( + );

(10.154)

D[y]= 2 (1– ) [(1– )+( – )2 ],

(10.155)

где

 

[( b– )/ ]= ( )=P(у* b)= ;

(10.156)

= /(1– );

(10.157)

= 2– .

(10.158)

* Доказательство:

Используя (10.142), выражение математического ожидания цензурированной переменной запишем в следующем виде:

M[y]=P(y=b) M[y| y=b]+P(у b) M[y| у b]= =P(у* b) b+ P(у* b) M[y*| у* b]= b+(1– ) ( + ).

Используя известную формулу представления дисперсии случайной величины D[y]=M[условная дисперсия]+ D[условное среднее] с учетом выражений (10.142)–(10.143), имеем

M[условное среднее]= D[y| y=b]+(1– ) D[y| у b]= = 0+(1– ) D[y*| у* b]= (1– ) 2 (1– );

D[условное среднее]= {bM[y]}2+(1– ) {M[y| у b]–M[y]}2= = {bb–(1– ) ( + )}2+(1– ) {( + )– b–(1– ) ( + )}2= = {(1– ) (b– – )}2+(1– ) { (b– – )}2.

Сделав замену b– = ,приведем в этом выражении подобные составляющие. В результате получим:

D[условное среднее]={ (1– )2+(1– ) 2} 2 ( – )2= = (1– ) 2 ( – )2.

Из последнего выражения непосредственно следует, что дисперсия D[y] может быть представлена в следующем виде:

D[y]= 2 (1– ) [(1– )+( – )2 ].

При b=0 выражение математического ожидания переменной y имеет следующий вид:

M [y| b 0]

 

( ), где

( / ) .

 

 

 

( / )

Если цензурирование проводится сверху, необходимо только заменить Ф на 1–Ф и переопределить , как в выражении 10.144.

Цензурированная модель (tobit-модель).

Для описания зависимости цензурированной переменной yt от влияющих на нее факторов обычно используется так называемая tobit-модель.

Tobit-модель исходит из того, что цензурированная переменная yt

описывается следующим выражением:

yt= xt+ t. (10.159)

где yt – наблюдаемые значения зависимой переменной (например, либо фактические расходы на отдых за границей, либо 0); xt – вектор независимых переменных, влияющих на зависимую переменную yt, – вектор параметров;

t – ошибка модели.

 

 

 

 

Далее tobit-модель предполагает, что цензурированным значениям yt

(т. е.

yt=0; b=0 –

точка

цензурирования)

соответствует

неположительное

произведение

xt

( xt 0); а нецензурированным

значениям yt

положительное ( xt 0).

Из выражения (10.159) следует, что условное математическое ожидание переменной уt по факторам xt определяется как

M[уt]= xt. (10.160)

Математическое ожидание уt с учетом цензурирования (т. е. M[уtцен]) для точки цензурирования b=0 определяются следующим образом (см.

выражение (10.154)):

M [yt

цен

| xt ]

' x

t

( ' xt

t),

(10.161)

 

 

 

 

 

 

 

 

 

 

 

 

где

 

 

 

 

 

 

 

 

 

 

t

( ' xt / )

.

 

(10.162)

 

 

( ' xt / )

 

 

 

 

 

 

 

В соответствии с выражением (10.160) маржинальные эффекты факторов xt

для математического ожидания переменной уt (без учета цензурирования)

определяются как

M [y

| x

t

]

 

 

t

 

 

.

(10.163)

x

 

 

 

 

 

 

 

 

t

 

 

 

 

 

В соответствии с выражением (10.161) маржинальные эффекты факторов xt

для математического ожидания переменной уt с учетом цензурирования могут быть представлены в следующем виде:

M [y

цен

| x

]

 

' x

 

 

 

t

 

 

t

 

 

 

 

t

 

 

 

.

(10.164)

x

 

 

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Заметим, что tobit-модель предполагает, что изменение факторов xt

приводит к тому, что вероятность P(yt 0) и математическое ожидание

М(yt|yt 0) обязательно меняются в одинаковом направлении. Действительно,

согласно выражению (10.156) вероятность того, что уt 0 определяется как

P(уt0)=P(xt 0)= (xt / ).

(10.165)

Соответственно маржинальный эффект факторов xt для вероятности

P(уt 0) может быть представлен в следующем виде:

P(yt0)/хt= (xt) . (10.166)

Если коэффициент i положителен, то согласно выражениям (10.164) и (10.166) с увеличением фактора хit (i=1,2,..., n; t=1,2,..., T) увеличивается как