книги / Эконометрика. Начальный курс
.pdf12.1. Модели бинарного и множественного выбора |
321 |
ний. Можно показать, что в подобных ситуациях непосредствен ное применение метода наименьших квадратов дает смещенные оценки параметров.
Пример урезания выборки дает исследование распределения семей по объему выплачиваемых налогов или изучение зависимо сти выплачиваемых налогов от размера семьи, возраста се членов и т. п. Здесь из рассмотрения могут исключаться семьи, имеющие доход ниже официального уровня бедности. В этом случае уро вень бедности определяет урезание выборки. Метод наименьших квадратов здесь также приводит к смещенным оценкам.
Подчеркнем разницу между цензурированием и урезанием. В первой ситуации даже для цензурированного наблюдения извест ны значения независимых переменных, в то время как во втором случае известен лишь уровень урезания, а значения независимых переменных для исключенных из рассмотрения объектов неиз вестны.
12.1.Модели бинарного и множественного выбора
Для наглядности будем изучать модели бинарного выбора на при мере покупки семьей автомобиля. Обозначая, как и раньше, за висимую переменную у, будем считать, что у = 1, если в течение исследуемого периода времени семья купила автомобиль, и у = О в противном случае. Ясно, что на решение о покупке автомоби ля влияют самые различные факторы: доход семьи, количество ее членов, их возраст, место проживания семьи и т. п. Набор этих ха рактеристик можно представить вектором х = (жь ... ,xfc)/ (неза висимые переменные). Сохраняя основные идеи регрессионного подхода, будем предполагать, что на решение семьи влияют также неучтенные случайные факторы (ошибки). Выдвигая различные предположения о характере зависимости у от х , будем получать разные модели. Здесь мы рассмотрим три модели: линейную мо дель вероятности и так называемые probit- и logit-модели.
322 Гл. 12. Дискретные зависимые переменные и цензурированные выборки
Линейная модель вероятности
Воспользуемся обычной линейной моделью регрессии:
yt = x't /3 + et, |
t = 1,... ,n, |
(12.1) |
где t — номер наблюдения (семьи), /3 = ( f t,... ,ft.)' — набор неиз вестных параметров (коэффициентов), £* — случайная ошибка. Так как yt принимает значения 0 или 1 и E(et) = 0, то
Е (yt) = 1 • Р (yt = 1) + 0 • P(yt = 0) = P(yt = 1) * x't /3.
Таким образом, модель (12.1) может быть записана в виде
P(yt = l) = * 'tft |
(12.2) |
поэтому ее называют линейной моделью вероятности (linear prob ability model).
Отметим некоторые особенности этой модели, наличие кото рых не позволяет успешно применять метод наименьших квадра тов для оценивания коэффициентов /3 и прогнозирования.
Из соотношения (12.1) следует, что ошибка е в каждом на блюдении может принимать только два значения: £t = 1 —х*/3 с вероятностью P(yt = 1) и £t = —x't /3 с вероятностью 1 —P(yt = 1). Это, в частности, не позволяет считать ошибку нормально распре деленной или имеющей распределение, близкое к нормальному. Далее, непосредственным вычислением получаем, что дисперсия ошибки V(£t) = Ф(/3(1 —x J/З) зависит от х*, т. е. модель (12.1) гетероскедастична (п.6.1). Как известно, оценки коэффициентов /3, полученные обычным методом наименьших квадратов, в этом случае не являются эффективными, и желательно пользоваться доступным обобщенным методом наименьших квадратов (п. 5.3).
Самым серьезным недостатком линейной модели вероятности является тот факт, что прогнозные значения yj = x't /3, которые по смыслу модели есть прогнозные^значения вероятности P(yt = 1), могут лежать вне отрезка (0,1) (/3 — оценка коэффициентов /3, по лученная с помощью обычного или обобщенного метода наимень ших квадратов), что, конечно же, не поддается разумной интер претации. Это обстоятельство существенно ограничивает область
12.1. Модели бинарного и множественного выбора |
323 |
применимости линейной модели вероятности. Ее целесообразно использовать при большом числе наблюдений и при достаточно точной спецификации модели, а также как инструмент первичной обработки данных для сравнения с результатами, получаемыми более тонкими методами.
Probit- и iogti-модели
Описание моделей
Основной недостаток линейной модели вероятности есть след ствие предположения о линейной зависимости вероятности Р (з/t = 1) от /3 (см. (12.2)). Его можно преодолеть, если считать, что
P(yt = l)= F (® 't /3), |
(12.3) |
где F(-) — некоторая функция, область значений которой лежит в отрезке [0,1]. В частности, в качестве F(-) можно взять функцию распределения некоторой случайной величины. Одна из возмож ных интерпретаций модели (12.3) выглядит следующим образом. Предположим, что существует некоторая количественная пере менная у*, связанная с независимыми переменными x t обычным регрессионным уравнением
У* =®'t /3 + et, |
(12.4) |
где ошибки St независимы и одинаково распределены с нулевым средним и дисперсией о 1. Пусть также F(-) — функция распре деления нормированной случайной ошибки St/<r. Величина у£ яв ляется ненаблюдаемой (латентной), а решение, соответствующее значению у* = 1, принимается тогда, когда у* превосходит неко торое пороговое значение. Так, в примере с покупкой автомоби ля можно считать, что у* представляет накопления семьи с но мером t. Без ограничения общности, если константа включена в число регрессоров, можно считать это пороговое значение равным нулю. Величину у* можно также интерпретировать как разность полезностей альтернативы 1 и альтернативы 0.
324 Гд. 12. Дискретные зависимые переменные и цензурированные выборки
Таким образом,
yt = 1, если y l > О,
(12.5)
yt = 0, если yl < 0.
Тогда, предполагая, что случайные ошибки £t имеют одно и то же симметричное распределение F( ) (т.е. F(—х) = 1 —F(x)), получаем:
P(yt = 1) = р (у; ^ о) = р(*; /з + et >о)
= P(et ^ - х [ /3) = Р (£t < x't (3) = F |
, (12.6) |
что с точностью до нормировки совпадает с (12.3).
Замечание. В модели (12.4)-(12.6) параметры /3 и а участвуют только в виде отношения и не могут быть по отдельности иденти фицированы (т.е. оценить можно лишь /З/сг). Поэтому в данном случае без ограничения общности можно считать, что а = 1.
Наиболее часто в качестве функции F( ) используют: —функцию стандартного нормального распределения:
U
—00
исоответствующую модель называют probit-моделъю;
—функцию логистического распределения:
исоответствующую модель называют logit-моделъю.
Всвете рассмотренной выше интерпретации модели (12.3) ис пользование функции нормального распределения представляет ся достаточно естественным. Применение функции логистическо го распределения во многом объясняется простотой численной ре ализации процедуры оценивания параметров. Вопрос о том, ка кую из моделей (probit или logit) следует использовать в том или ином случае, является достаточно сложным. Можно, на пример, выбрать ту модель, для которой больше значение соот ветствующей функции правдоподобия. Отметим также, что для
326 Гл. 12. Дискретные зависимые переменные и цензурированные выборки
Отсюда легко вытекает, что |
|
L = п и * ; л г (1 - F W , |
|
t |
|
Логарифмируя, получаем: |
|
I = In L = 5 > * In F{x't /3) + (1 - y t) ln(l - F(x't /3))]. |
(12.9) |
t |
|
Дифференцируя равенство (12.9) по вектору /3 (приложение ЛА, п. 19), получаем векторное уравнение правдоподобия
91 |
X" (ytV^x>t ® |
(1~ у^р(х'1&Лд- _ п |
( 12.10) |
др |
4 ^\F(x'tf3) |
1 -F(x'tP) ) * |
|
Для logit-модрпн оно существенно упрощается. Действительно, пользуясь легко проверяемым тождеством А'(и) = Л(и)(1 —Л(и)), имеем
5 ^ (!ft-A (x /t /3))xt = 0. t
Уравнение правдоподобия (12.10) является системой нелиней ных (относительно /3) уравнений, в общем случае нельзя най ти ее аналитическое решение и приходится прибегать к числен ным методам. Отметим также, что уравнение правдоподобия есть лишь необходимое условие локального экстремума. Можно пока зать (см., например, (Greene, 1997)), что для probit- и loyit-ъло- делей логарифмическая функция правдоподобия I является во гнутой по /3 функцией и, значит, решение уравнения (12.10) дает оценку максимального правдоподобия набора параметров /3. Про цедуры оценивания probit- и logit-моделей реализованы в боль шинстве современных эконометрических компьютерных пакетов.
Пример. Факторы некредитоспособности российских банков. Этот пример основан иа результатах дипломной работы выпускницы РЭШ 1999 г. Б. Б. Баян-оол.
Как те или иные характеристики банка влияют на его жизне способность? Для исследования этой проблемы была рассмотрена
12.1. Модели бинарного и множественного выбора |
327 |
Ufgit-иодепь с бинарной переменной, принимающей значения 1 или О, в зависимости от того, находится ли банк в критическом состо янии или нет. Решение о том, является ли банк проблемным или иет, принималось на основании рейтинга банков, опубликованного в журнале «Профиль» от 21 июня 1999 г. Значение 1 приписыва лось банкам с отрицательным капиталом; банкам, имеющим 4-ю группу проблемиости; банкам, у которых отозвана лицензия или принято решение об отзыве. Остальным банкам присвоено значе ние 0. Из многочисленных характеристик банков (возраст, капитал, ликвидные активы, работающие рисковые активы, обязательства до востребования, суммарные обязательства, уставный фонд, чи стые активы и т. п.) в окончательную модель после анализа и мно гочисленных попыток были включены следующие переменные:
TOTLIAB —суммарные обязательства (тыс. руб.); CURRENCY — валютная составляющая (%); EQUITY/ASS, где EQUITY —недвижимость (тыс. руб.), ASS — чистые активы (тыс. руб.);
PROFIT/ASS, где PROFIT —прибыль (убыток) (тыс. руб.); RETAIL/TOTLIAB, где RETAIL — средства частиых лиц (тыс.
РУб.);
TOTLLAB/PREF, где PREF —работающие рисковые активы (тыс. руб.).
Модель включает 182 наблюдения. Результаты оценивания с помощью Цг»1-модели приведены в таблице 12.1. Полученные ре зультаты согласуются с экономической интуицией. В частности, в результате кризиса наименее устойчивыми оказались крупные
имельчайшие банки. Поскольку в выборке представлены средние
икрупные банки, то положительность коэффициентов при пере менных, характеризующих величину банка, согласуется с реально стью.
Переменная |
|
|
Таблица 12.1 |
|
Коэфф. |
Стапд. откл. |
t-статист. Р-знач. |
||
С |
-3.19 |
0.87 |
-3.68 |
0.000 |
TOTLIAB |
2.14E-07 |
7.21E-08 |
2.97 |
0.003 |
CURRENCY |
-0.09G |
0.031 |
-3.13 |
0.021 |
EQUITY/ASS |
-8.58 |
3.71 |
-2.31 |
0.022 |
PROFIT/ASS |
-26.99 |
9.49 |
-2.84 |
0.005 |
RETAIL/TOTLIAB |
3.53 |
1.23 |
2.87 |
0.005 |
TOTLIAB/PREF |
2.00 |
0.90 |
2.23 |
0.027 |
12.1. Модели бинарного и множественного выбора |
329 |
Соответствующим образом изменится логарифмическая функция правдоподобия (12.9):
+ ( l - * ) t a ( l - * ( = £ ) ) ] .
Это означает, что теперь необходимо оценивать п + к —1 неизвест ных параметров (без ограничения общности одну из дисперсий можно считать равной 1), что без дополнительных предположе ний невозможно сделать состоятельно на основе я наблюдений.
Аналогично тому, как это делается в тесте Бреуша-Пагана (глава 6), можно предполагать ту или иную форму зависимости дисперсий от экзогенных факторов и тестировать гипотезы об от сутствии гетероскедастичности (подробнее см. (Greene, 1997)).
Вп. 4.4 мы рассмотрели проблемы исключения существенных
ивключения несущественных переменных для линейных регрес сионных моделей. Можно поставить аналогичный вопрос: какое влияние оказывает пропуск существенных переменных в уравне нии (12.4) на оценивание модели бинарного выбора (12.3)? Исчер пывающий ответ на него выходит за рамки нашей книги. Отметим лишь, что в данном случае, даже если исключенные существен ные переменные ортогональны включенным, оценки параметров будут, в отличие от линейной схемы, смещенными и несостоя тельными (подробнее см. (Greene, 1997) и (Johnston and DiNardo, 1997)).
Модели множественного выбора
Модели множественного выбора, когда имеется не две, а несколь ко альтернатив, можно строить и изучать, обобщая подходы и методы, используемые для моделей бинарного выбора.
Номинальные зависимые переменные
Если соответствующая переменная является номинальной (ка чественной), то множественный выбор может быть представлен как последовательность бинарных выборов. Поясним это простым примером. Предположим, что изучается выбор одной из трех
330 Гл. 12. Дискретные зависимые переменные и цензурированные выборки
профессий: инженер, научный работник, преподаватель. Введем три бинарных переменных, соответствующих каждой профессии: у* = 1 для инженеров, у* = 0 для всех остальных; у* = 1 для научных работников, у* = 0 для всех остальных; у* = 1 для пре подавателей, у* = 0 для всех остальных.
Тогда выбор одной из трех альтернатив можно описать в виде «дерева» последовательных решений, в узлах которого происхо дит бинарный выбор.
В каждом узле, применяя технику оценивания для бинарных мо делей, можно оценить условную вероятность выбора соответству ющей альтернативы. Безусловная вероятность вычисляется по формуле умножения вероятностей. Так, например,
Р(у‘ = 1) = Р(у‘ = 0, у» = 0) = Р(у<= 0)Р(у* = 0 | у‘ = 0).
В последнем произведении первый сомножитель оценивается в первом узле (стрелка вниз), второй — во втором (стрелка вниз). Обобщение этого метода на случай любого числа альтернатив не представляет труда.
Однако у данного способа построения моделей множественно го выбора есть очевидный недостаток: «дерево» последователь ных решений можно строить по-разному, и результаты оценива ния будут, вообще говоря, разными.
Другой подход к моделям множественного выбора с качествен ной зависимой переменной основан на понятии случайной полез ности (как уже отмечалось выше, в probit- или /pytt-моделях скры