
Эконометрика / Лекции.Евстратчик / Модели бинарного выбора +ММП
.pdfМодели с дискретными зависимыми переменными
Вэкономических и чаще социальных исследованиях (поведение отдельных индивидов:
работников, женщин, мужчин, домохозяйств) часто приходится сталкиваться с разного рода ограничениями на значения зависимой переменной.
Вчастности, зависимая переменная может принимать только целочисленные значения: 0, 1, 2,... (До этого предполагалось, что Y - непрерывна)
МОДЕЛИ
1.с качественными зависимыми переменными
модели бинарного выбора
1 |
работать |
1 |
выдать кредит |
1 |
голосовать |
ЗА |
Y |
не работать |
Y |
не выдать |
Y |
голосовать |
|
0 |
0 |
0 |
ПРОТИВ |
1 купить
Y0 не покупать
мультиноминальные модели (множественного выбора), неупорядоченные выбор марки автомобиля
модели с упорядоченными зависимыми переменными
оценки за экзамен, класс гостиницы
2.с ограничениями на количественные зависимые переменные
модели с усеченными выборками
модели с цензурированными выборками
модели времени жизни
3.Модели с порядковыми зависимыми переменными (близки по типу к моделям с упорядоченными откликами, но здесь зависимая переменная позволяет не только упорядочить признак, но и приписать ему некоторое число - ранг (доход семьи - низкий. средний, высокий; состояние больногохорошее, удовлетворительное, плохое): ordered models или ranking data)
1

Модели бинарного выбора
Зависимая переменная принимает 2 значения
В ЛИНЕЙНОЙ ВЕРОЯТНОСТНОЙ МОДЕЛИ БИНАРНОГО ВЫБОРА НАРУШАЮТСЯ ВСЕ ПРЕДПОСЫЛКИ МНК.
|
|
Обычная линейная регрессионная модель yi a 1x1i |
|
p xpi i Х i не |
подходит для описания этой ситуации.
1.линейная модель предполагает, что зависимая переменная имеет непрерывное распределение, а здесь необходимо, чтобы она имела дискретное распределение;
2.могут принимать только 2 значения
уt |
|
t |
|
|
|
1 |
|
|
|
Х |
1 xt |
|
|
|
0 |
|
|
|
Х |
xt |
|
|
|
т.е. ошибки не имеют нормального распределения
3. Ошибки линейной вероятностной модели имеют следующие характеристики:
E i xi 1 xi 1 xi xi 0
|
|
|
|
|
|
|
|
|
|
||
|
|
Var i |
|
xi |
xi 1 xi 2 1 xi xi 2 xi 1 xi |
|
|||||
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
где Var i |
|
xi – |
условная дисперсия ошибки i при условии, |
что вектор независимых |
|||||||
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
переменных равен xi . |
|
|
|
|||||||
|
|
|
|
||||||||
|
|
|
Т.о. в модели будет присутствовать гетероскедастичность |
т.к. дисперсия ошибки |
зависит от вектора x , т.е. оценки МНК будут не эффективными – нужно использовать ОМНК.
4. Yi - по смыслу прогнозные значения вероятности. Эти значения могут лежать вне
0;1 .
5. -оценки не поддаются разумной интерпретации
2

Хотелось бы найти модель, которая порождала бы дискретное распределение, зависящее от X, которое бы хорошо описывало данные.
Модели бинарного выбора обычно формулируются в терминах латентной переменной -
zi .
для моделирования подбирают функции, область значений которых определяется
отрезком [0, 1], а zi является аргументом
В качестве такой функции естественно выбрать какую-либо дифференцируемую
функцию распределения, определенную на всей прямой.
Предполагается, что существует некоторая количественная латентная (скрытая)
|
|
|
|
переменная zi , линейно связанная с факторами zi Xi i |
|
||
|
Yi |
1, когда zi превосходит некоторое пороговое значение (например 0) |
|
|
Yi |
0 , когда меньше порогового значения |
|
|
|
|
|
|
P(Yi 1) P(zi 0) P( Xi i 0) P( i Xi ) |
||
|
Если распределение ошибок симметрично (то есть график плотности симметричен |
||
относительно оси ординат), то для функции распределения |
выполняется тождество |
F(x) 1 F( x).
можно записать
P( i Xi ) 1 P( i Xi ) 1 F( Xi ) F(Xi ) или
P(Yi 1) F( X i )
Вероятность условного мат.ожидания
P y 1 xi F Хi
P y 0 xi 1 F Хi
здесь F Хi :
3
линейная функция от xi и
принимает значения в пределах 0,1
монотонно возрастает по вектору объясняющих переменных
д. выполняться условия
1)F z 1 при z
2)F z 0 при z
4

В КАЧЕСТВЕ ФУНКЦИИ F ВЫБИРАЮТ ЛИБО Ф-Ю СТАНДАРТНОГО НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ, ЛИБО ЛОГИСТИЧЕСКОГО РАСПРЕДЕЛЕНИЯ
|
F z |
|
|
ez |
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
||||
ЛОГИТ МОДЕЛЬ |
1 ez |
1 e z |
|
|
|
|
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
P Yi |
1 |
|
xi |
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
T |
|
||||
Условная вероятность положительных исходов: |
|
|
|
1 |
e xi |
|
||||||||||||||||
Ф-я плотности - f (x) |
|
e x |
|
|
ex |
|
|
|
|
|
|
|
|
|
||||||||
|
e x )2 |
|
ex )2 |
|
|
|
|
|
|
|
|
|||||||||||
|
(1 |
(1 |
|
|
|
|
|
|
|
|
||||||||||||
|
F z |
|
1 |
|
|
|
z |
z 2 |
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
e 2 dz |
|
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|||||||||||||
ПРОБИТ МОДЕЛЬ |
|
2 |
|
|
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
P Yi |
|
xi |
1 |
xiT |
|
( xiT |
|
)2 |
|
|
|
|
|
1 |
|
|
dz |
||||||
|
|
|
|
|
e |
2 |
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Условная вероятность положительных исходов: |
|
|
|
2 |
|
|
|
|
|
||||
|
|
|
|
|
|
|
|||||||
Ф-я плотности - f x |
|
1 |
|
x2 |
|
|
|
|
|
|
|
|
|
|
|
e 2 |
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
||
2 |
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
Для логит - 2 32 , для пробит - 2 1
(нельзя напрямую сравнивать коэффициенты этих моделей)
5

Вопрос о том, какое из распределений более подходит для практических исследований, остается открытым.
|
Напрямую модели пробит- и логит сравнивать нельзя , т.к. в логист.р-и 2 |
2 |
|
|
|
||||||
, поэтому |
|||||||||||
|
|
|
|
|
|
|
|
3 |
|
|
|
|
коэффициенты |
|
из модели logit надо домножить на |
|
3 |
|
и тогда сравнивать с |
|
|
- |
|
|
|
|
i |
||||||||
|
|
i |
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
коэффициентами из модели probit, где 2 1
на участке [–1,2; 1,2] обе они ведут себя практически одинаково.
вне этого участка, т. е. на хвостах распределения, значения имеют некоторые отличия (логистическое распределение имеет более “тяжелый хвост”, чем
нормальное).
Практика показывает, что при отсутствии существенного преобладания одной альтернативы над другой, а также для выборок с небольшим разбросом переменных, выводы, полученные на основе probit- и logit-моделей, как правило, совпадают.
(Кривые, получаемые по пробит- и логит-моделям, отличаются очень мало как друг от друга, так и от теоретической кривой)
6

Функции не линейны по параметрам и оцениваются ММП.
Метод Максимального Правдоподобия (ММП)
Метод максимального правдоподобия в его современном виде был предложен английским статистиком Р. Фишером (1912), однако в частных формах метод использовался К.Гауссом (1777-1855), а еще раньше, в в 18 веке, к его идее были близки И.Ламберт (1728-1777) и Д.Бернулли (1700-1782).
для оценки нелинейных функций
при анализе временных рядов
основное предположение - распределение объясняемой переменной известно с точностью до конечного числа неизвестных параметров
оценки параметров, полученные по ММП обеспечивают максимальную правдоподобность исходного предположения о виде распределения У
для удобства вычисляют логарифм ФМП
в отличие от оценок МНК оценки ММП редко м.б. выражена в аналитической форме, чаще это результат численной процедуры
для оценки обычной регрессии так же м.б. использован ММП, в этом случае возможно аналитически найти оценки
в моделях дискретного выбора аналитического выражения для оценок, как правило нет
Оценки ММП состоятельные, асимптотически нормальны и эффективны
7
Согласно ММП в качестве оценок выбираются те значения параметров, при которых данные результаты наблюдений "наиболее вероятны" (т.е. максимизировать вероятность получить данную выборку при значениях параметров).
L PY1 |
(1 P )1Y1 |
PY2 |
(1 P )1Y2 |
...PYn (1 P )1Yn |
|
||||
|
1 |
1 |
2 |
|
2 |
|
n |
n |
|
n |
|
(1 P )1i1 |
n |
|
' )Y (1 F ( X ' ))1Y |
|
|||
PYi |
F ( X |
|
|||||||
i 1 |
i |
i |
i 1 |
i |
|
i |
|
||
|
|
|
|
|
|
|
Чаще используют максимум логарифмической функции правдоподобия:
N |
ln(1 F ( X iT )) (1 Yi ) ln F ( X iT ) |
|
ln L Yi |
. |
|
i 0 |
|
|
|
|
Для логит/пробит моделей ln L 0.
8
Последовательность решения:
1.Составляется функция правдоподобия.
2.Вычисляется логарифм функции правдоподобия.
3.Оценки параметров получаются в результате решения системы уравнений:
ln L 0 |
i 1, 2,3,..., k |
i |
|
4.Проверяется условие максимума функции правдоподобия.
ММП не всегда приводит к приемлемым результатам, однако в достаточно широком круге практически важных случаев этот метод является наилучшим.
Оценки максимального правдоподобия при больших n , состятельны и
асимптотически нормальны и асимптотически эффективны.
Для определения параметров используют численные методы, например, метод Ньютона, реализованный в программном пакете Gretl.
9

Дополнительно
ММП для оценки параметров линейной регрессии
|
|
|
|
|
|
|
|
|
Yt |
a bX t |
t |
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
Ошибки регрессии |
t |
независимы и распределены по нормальному закону |
t |
~ N 0, 2 |
. |
|||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
Или, что является эквивалентной записью |
Y |
~ N (a bX |
t |
, 2 ) |
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
t |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||
Имея набор наблюдений X t ,Yt |
, t 1,2,..., n |
|
можно ответить на вопрос: при каких |
|
|
|||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||
значениях параметров a,b, 2 |
|
вероятность получить этот набор наблюдений наибольшая? |
|
|||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||
|
Составляется функция правдоподобия, |
равная произведению плотностей вероятности |
||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||
отдельных наблюдений (считается, что все t |
независимы): |
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||
L Y ,Y ,..,Y , a, b, 2 p Y ,Y ,..,Y |
|
X |
1 |
, X |
2 |
,.., X |
n |
a, b, 2 |
|
|
|
|
||||||||||||||||||||||
|
|
|
|
|
|
|||||||||||||||||||||||||||||
1 2 |
n |
|
|
|
|
|
|
|
1 2 |
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
n |
|
|
n |
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
||
n |
|
|
|
|
2 |
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
П p Yt |
2 |
|
2 exp |
|
|
|
|
Yt a bXt |
|
|
|
|
|
|
|
|||||||||||||||||||
2 |
|
2 |
|
|
|
|
|
|
|
|||||||||||||||||||||||||
t 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||
p - плотность вероятности, зависящая от X |
,Y и параметров a,b, 2 . |
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
t |
|
|
t |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Для того чтобы найти наиболее правдоподобные значения параметров, необходимо найти такие их значения, при которых функция правдоподобия достигает своего максимума.
Так как функции L и lnL одноременно достигают своего максимума, достаточно искать максимум логарифма функции правдоподобия:
ln L Y1 ,Y2 |
,..,Yn |
, a,b, 2 |
n |
ln 2 |
n |
ln 2 |
1 |
Yt |
a b X t 2 |
||||||||
|
|
2 |
|||||||||||||||
|
|
|
2 |
|
2 |
|
2 |
|
|
||||||||
|
|
|
|
|
|
|
|
|
|||||||||
|
|
Необходимые условия экстремума функции lnL имеют вид |
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
ln L |
|
|
1 |
|
Yt a b X t 0 |
|
|
|
|||||
|
|
|
|
a |
|
|
|
|
|
|
|||||||
|
|
|
|
|
2 |
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
ln L |
|
|
1 |
X t Yt a b X t 0 |
|
|
|
||||||
|
|
|
|
b |
|
2 |
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
10