Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Эконометрика. Тихомиров

.pdf
Скачиваний:
458
Добавлен:
27.03.2016
Размер:
6.13 Mб
Скачать

Оценки максимального правдоподобия получаются путем одновременного приравнивания трех производных (по 1, 2 и ) нулю.

Модель Пуассона, являющаяся базовой моделью счетных данных (см.

выражение (10.118)), представляет собой нелинейную регрессию. Логарифм функции правдоподобия для модели Пуассона имеет следующий вид:

l=lnL=

T [ t t 1

+ yt x t –ln(yt!)]=

T

[ e

 

 

'x t

t 1

 

+ yt x t –ln(yt!)].

(10.210)

Необходимые условия его максимизации можно записать следующим образом:

lnL/ =

T

'x t

) xt

( yt

e

t 1

 

 

0.

(10.211)

Рассмотрим особенности выражений для оценки параметров усеченной регрессии (10.148).

В соответствии с выражением (10.139) плотность распределения усеченной случайной переменной уt определяется как

 

 

1

[( y

 

' x

) / ]

 

 

 

 

t

 

 

)

 

 

 

t

 

 

f ( y

 

 

 

 

.

(10.212)

 

 

 

 

 

t

 

1 [( y

 

' x

 

) / ]

 

 

 

t

t

 

 

 

 

 

 

 

 

Логарифм функции правдоподобия является суммой логарифмов этих плотностей, т. е.

ln L l T [ln(2 ) ln 2]

1

2

( yt ' xt )2

 

 

 

 

 

 

T

 

2

 

2

 

t 1

 

T

 

b ' xt

 

(10.213)

ln

1

 

.

 

t 1

 

 

 

После некоторых преобразований выражения, на основании которых определяются оценки параметров модели примут следующий вид:

l

T

yt

' xt

 

t

 

 

 

 

 

 

 

 

x

 

t 1

 

 

2

 

 

t

 

 

 

 

 

 

 

0;

l

T

 

 

1

 

( yt ' xt )

2

 

t

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= 0;

(10.214)

2

 

2

 

4

 

 

2

t 1

2

 

2

 

 

2

 

 

где t =(b xt)/ и t = (t)/[1–Ф( t)].

Рассмотрим оценивание параметров tobit-модели (10.159). Логарифм функции правдоподобия для цензурированной регрессии может быть представлен следующим образом:

 

 

1

 

 

 

 

( y

 

' x

)

2

 

 

 

 

2

 

t

 

ln L l

 

 

ln(2 ) ln

 

 

 

t

 

 

2

 

 

 

 

2

 

y

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

ln

1

' xt

.

(10.215)

 

yt 0

 

 

 

Первая часть выражения (10.215) соответствует классической регрессионной модели для нецензурированных наблюдений, а вторая часть – вероятностям для цензурированных наблюдений. Это – нестандартное выражение логарифма правдоподобия, так оно получено на основе сочетания дискретного и непрерывного условных распределений.

Необходимые условия максимизации функции правдоподобия будут иметь следующий вид:

l

 

yt ' xt

 

t xt 0;

 

2

yt 0

yt 0

 

l

 

 

 

 

1

 

 

( yt

' xt )

2

t

t

 

 

 

 

 

 

 

 

 

= 0;

(10.216)

 

2

2

2

 

2

4

2

2

 

yt 0

 

 

 

yt 0

 

 

 

 

 

 

 

 

 

 

 

 

где t =(b xt)/ и t = ( t)/[1–Ф( t)].

Асимптотическая ковариационная матрица оценок* параметров моделей с дискретными и ограниченными зависимыми переменными, полученных с помощью метода максимального правдоподобия, может быть определена

двумя способами:

1) как обратная матрица к матрице математического ожидания вторых производных логарифма правдоподобия (взятой с противоположным

знаком):

 

AsyCov(a)= (–M( 2l/ a a))–1,

(10.208)

где AsyD(a) – асимптотическая ковариационная матрица оценок максимального правдоподобия.

Заметим, что матрица вторых производных логарифма правдоподобия

используется в итеративных расчетах при получении оценок параметров.

2)

как оценка Берндта, Хола, Хола и Хаусмана (БХХХ-оценка):

 

 

 

 

2

 

 

 

 

,

(10.209)

 

 

AsyCov(a) B g

xt

x't

 

 

 

t

 

 

 

 

 

 

 

t

 

 

 

 

 

 

где

gt yt t для logit-модели и

gt t

для probit-модели ( t определено в

выражении (10.193)).

БХХХ-оценка применяется при тестировании гипотез о коэффициентах моделей с дискретными и ограниченными зависимыми переменными.

* При некоторых условиях регулярности последовательность случайных векторов T (aT ) сходится по распределению к нормально распределенному случайному вектору с нулевым средним и матрицей ковариаций H–1( ). Вследствие этого матрица H–1( ) называется асимптотической ковариационной матрицей оценки максимального правдоподобия а.

10.5.2. Метод максимального счета (MSCORE)

Рассмотрим особенности метода максимального счета, применяемого наряду с методом максимального правдоподобия для оценки параметров модели бинарного выбора.

Этот метод использует критерий, представляющий собой максимум числа совпадений реальных и расчетных ответов, который критерий можно представить в следующем виде:

Max S ( )=

1 T

T

 

 

[

 

zt

t 1

 

(1 2 ) sgn

( xt)]* .

(10.210)

Параметр – это установленный квантиль; sgn( xt) – знак числа xt; zt=2yt –1 (zt =–1, если yt=0; zt=1, если yt=1). Если =1, метод максимального счета выбирает оценку параметров a таким образом, чтобы максимизировать число раз, когда xt имеет тот же знак, что и zt.

Метод по своей сути является полупараметрическим, поскольку он

использует не параметры распределений, а их заменители.

Оценки параметров ai (i=1,2,…, n) определяются путем перебора возможных их сочетаний при заданном уровне точности (например, 0,0001) с

учетом ограничения

n

 

1.

ai

 

 

2

 

 

i 1

 

 

Так как метод максимального счета не предполагает вычисление функции правдоподобия, то невозможно определить и информационную матрицу для определения стандартных ошибок оценок. Чтобы получить представление об изменчивости оценок, обычно используется метод самонастройки

(bootstapping). Он заключается в следующем. После вычиcления набора оценок коэффициентов aT из выборки делается К случайных подвыборок,

содержащих по наблюдений. Для каждой k-й подвыборок метод максимального счета дает свои оценки a (k). Тогда среднеквадратические отклонения можно оценить следующим образом:

* См. Мански (Manski, 1975,1985, 1986) и Мански и Томпсон (Manski and Tompson, 1986)

MSD(a)

1

K

 

(k )

 

] [

 

(k )

 

]' .

(10.211)

К

[

a

aT

a

aT

 

k 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Отметим еще раз, что элементы матрицы MSD не являются ковариациями соответствующих оценок, они лишь характеризуют их взаимную изменчивость.

Преимущество полупараметрических методов оценки параметров состоит в том, что при их использовании не возникают ошибки, связанные с неправильным выбором закона распределения погрешностей модели. С

другой стороны, нет никаких гарантий, что полученные на их основе оценки будут лучше, чем «параметрические». Существенным недостатком полупараметрических методов является то, что они требуют очень большого количества вычислений для получения оценок параметров. Это выдвигает определенные ограничения в отношении максимального еоличества параметров модели и объема исходной информации. Сейчас метод максимального счета не используется для оценки более чем 15

коэффициентов на основе 1500-2000 наблюдений. Еще один недостаток этого подхода обусловлен невозможностью параллельного получения вместе с оценками параметров дополнительной информации, относящейся к характеристикам качества модели, точности оценок и т. п. Для содержательного анализа влияния факторов на зависимую переменную очень важны маржинальные эффекты, а на основе полупараметрических методов оценить их также не представляется возможным.

Как развитие метода максимального счета можно рассматривать,

предложенный его авторами метод вторичного анализа результатов. Этот метод позволяет получить оценки математического ожидания переменной yt,

взависимости от величин, влияющих на нее факторов.

Рассмотрим основные положения этого метода. Пусть

F (zt )=M[yt | xt=zt]

(10.212)

представляет собой гладкую функцию “отклика” yt

на xt. Основываясь на

векторе параметров оценок параметров a (полученном с помощью метода максимального счета), авторы предлагают построить F (zt) с помощью так называемого kernel-метода.

Для вектора оценок параметров a и известных значений независимых

переменных xt (t=1,..., T) определим следующие значения:

 

 

zt=a xt,

 

(10.213)

 

1

 

T

1/2

 

s

 

(zt

 

) 2

.

(10.214)

z

 

T

t 1

 

 

Для произвольного значения z*, принадлежащего области допустимых значений произведения a x, можно определить следующий набор весов

(kernel-функций) wt (t=1,..., T):

*

K [(z

*

zt) / ( s)],

 

wt (z )

 

 

rt

(z

*

zt) / ( s),

 

 

 

 

 

 

 

где

 

 

 

 

 

 

 

 

K (rt) P(rt) [1 P(rt)]

 

 

и

 

 

 

 

 

 

 

 

P(

) [1 exp( c

 

1

.

rt

)]

rt

 

 

 

 

 

 

 

(10.215) (10.216)

(10.217)

(10.218)

Константа

с ( /

3)

1

0,55

используется

для

стандартизации

 

 

 

 

 

 

 

логистического распределения, которое применяется в kernel-функции; –

параметр сглаживания. Значения должны быть досаточно велики, чтобы функция F(z*) была гладкой, использование маленьких, близких к нулю,

значений усиливает большую колебания функции. Хорошей теоретической основы для выбора не существует, за исключением

некоторых предположений, которые можно сделать на основе описательной статистики.

Функция F(z*) (в выражении (2.212)) определяется следующим образом:

 

T

 

 

 

wt (z*) yt

 

 

F(z*)

t 1

.

(10.219)

T

 

wt (z*)

 

 

 

t 1

 

 

где – наблюдаемые значения уt, t=1,..., T.

Расчетные значения функции F(z*) при заданном наборе факторов хt

обычно интерпретируются как математическое ожидание зависимой переменной yt (М[yt]).

Вопросы к главе X

1.Каковы последствия ошибок измерений зависимой переменной?

2.Каковы последствия ошибок измерений независимых переменных?

3.Каковы последствия ошибок измерений и зависимой и независимых переменных?

4.Охарактеризуйте модели с фиктивными независимыими переменными.

5.Дайте классификацию моделей с дискретными заивисимыми переменными.

6.В чем состоит суть моделей бинарного выбора?

7.Какие законы распределений наиболее часто используются в моделях бинарного выбора?

8.В чем состоят недостатки линейной модели вероятности?

9.Охарактеризуйте модель бинарного выбора, исходящую из групповых данных?

10.Что собой представляет многомерная probit-модель?

11.Что собой представляют модели множественного выбора?

12.Какие типы моделей используются для описания выбора среди неупорядоченных альтернатив?

13.Каким образом моделируется выбор среди упорядоченных альтернатив?

14.Какие законы распределений используются в моделях счетных данных?

15.Охарактеризуйте последствия построения эконометрической модели на основе усеченной выборки?

16.Как изменяются математическое ожидание и дисперсия зависимой переменной, если при оценки параметров модели используется цензурированная выборка?

17.Охарактеризуйте модели случайно усеченных выборок.

18.Каковы особенности применения метода максимального правдоподобия для оценки параметров моделей с дискретными зависимыми переменными?

19.Как выглядят необходимые условия максимизации логарифма функции правдоподобия для моделей усеченных и цензурированных выборок?

20.Что собой представляет метод максимального счета?

21.В чем суть kernel-метода?

Упражнения к главе Х

Задание 10.1

Logit-модель была применена к выборке, в которой y=1, если количество занятых в фирме выросло (y=0 – в противном случае), х1 – доход фирмы, в

млн. $; х2=1, если фирма относится к области высоких технологий (х2=0 – в

противном случае). Получена следующая модель:

z 0,40 0,20 x1 010, x2 .

Требуется определить оценку вероятности роста занятости для фирмы высокотехнологичной фирмы А с доходом в 5 млн. $ и для фирмы Б, не относящейся к сфере высоких технологий и имеющей доход 7 млн. $.

Задание 10.2

Имеется выборка, состоящая из 528 наблюдений, в которой y=1, если заработная плата работника ниже 5$ в час (y=0 – в противном случае).

Предполагается, что уровень заработной платы зависит от следующих факторов: х1 – образование, лет; х2 – пол (1–женский, 0 – мужской); х3 – опыт работы, лет. В табл. 10.1 приведены коэффициенты, полученные при оценке линейной регрессии y от х1, х2 и х3 с помощью МНК, и при оценке Logit-

модели с помощью нелинейного МНК.

 

 

 

Таблица 10.1

 

 

 

 

 

 

Коэффициенты

 

 

 

 

 

 

 

 

линейной

Logit-

Выборочные средние

 

 

регрессии

модели

 

 

 

 

 

 

 

1

0,94

5,87

1

 

 

 

 

 

 

х1

–0,05

–0,56

13,09

 

 

 

 

 

 

х2

0,15

1,26

0,46

 

 

 

 

 

 

х3

–0,01

–0,06

17,66

 

 

 

 

 

 

Требуется:

1.Определить на основе Logit-модели, оценку вероятности для мужчины

идля женщины, имеющих 12 лет образования и 15 лет опыта работы,

оказаться низкооплачиваемыми работниками.

2. Определить на основе Logit-модели, изменение оценки вероятности быть низко оплачиваемым работником для мужчины с характеристиками из п. 1, если он проучится на один год больше.

3. Ответить на вопросы п. 1–2 с использованием линейной регрессионной модели.

Задание 10.3

Имеется выборка, состоящая из 528 наблюдений, в которой y=1, если работник состоит в профсоюзе (y=0 – в противном случае). Предполагается,

что членство в профсоюзе зависит от следующих факторов: х1

образование, лет; х2 – пол (1–женский, 0 – мужской); х3 – опыт работы, лет; х4

– опыт работы в квадрате. Выборочные средние равны

y 018, ; x1 13,09; x2 0,46; x3 17,66; x4 459,45.

На основе выборочных данных была получена следующая Probit-модель:

 

 

 

 

y F ( 0,900

0,015 x1 0,599 x2

0,029 x3

0,0003 x4).

Требуется определить, насколько снижается вероятность быть членом профсоюза в расчете на год дополнительного образования.

Задание 10.4

Имеется набор данных, состоящий из 6 наблюдений.

y

0

0

0

1

1

1

x

–1

–2

0

1

1

1

Требуется:

1.Оценить линейную модель вероятности с помощью МНК. Рассчитать

R2.

2.Использовать оцененную модель для разделения индивидуумов на 2

группы. Рассчитать количество случаев правильного отнесения к соответствующей группе, применяя следующее правило классификации:

группа I (y=1), если

 

y 1/ 2;

группа II (y=0), если

 

y 1 / 2.

Сопоставьте долю правильного попадания и коэффициент детерминации.