Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Эконометрика. Начальный курс

.pdf
Скачиваний:
16
Добавлен:
20.11.2023
Размер:
21.93 Mб
Скачать

12.1. Модели бинарного и множественного выбора

321

ний. Можно показать, что в подобных ситуациях непосредствен­ ное применение метода наименьших квадратов дает смещенные оценки параметров.

Пример урезания выборки дает исследование распределения семей по объему выплачиваемых налогов или изучение зависимо­ сти выплачиваемых налогов от размера семьи, возраста се членов и т. п. Здесь из рассмотрения могут исключаться семьи, имеющие доход ниже официального уровня бедности. В этом случае уро­ вень бедности определяет урезание выборки. Метод наименьших квадратов здесь также приводит к смещенным оценкам.

Подчеркнем разницу между цензурированием и урезанием. В первой ситуации даже для цензурированного наблюдения извест­ ны значения независимых переменных, в то время как во втором случае известен лишь уровень урезания, а значения независимых переменных для исключенных из рассмотрения объектов неиз­ вестны.

12.1.Модели бинарного и множественного выбора

Для наглядности будем изучать модели бинарного выбора на при­ мере покупки семьей автомобиля. Обозначая, как и раньше, за­ висимую переменную у, будем считать, что у = 1, если в течение исследуемого периода времени семья купила автомобиль, и у = О в противном случае. Ясно, что на решение о покупке автомоби­ ля влияют самые различные факторы: доход семьи, количество ее членов, их возраст, место проживания семьи и т. п. Набор этих ха­ рактеристик можно представить вектором х = (жь ... ,xfc)/ (неза­ висимые переменные). Сохраняя основные идеи регрессионного подхода, будем предполагать, что на решение семьи влияют также неучтенные случайные факторы (ошибки). Выдвигая различные предположения о характере зависимости у от х , будем получать разные модели. Здесь мы рассмотрим три модели: линейную мо­ дель вероятности и так называемые probit- и logit-модели.

322 Гл. 12. Дискретные зависимые переменные и цензурированные выборки

Линейная модель вероятности

Воспользуемся обычной линейной моделью регрессии:

yt = x't /3 + et,

t = 1,... ,n,

(12.1)

где t — номер наблюдения (семьи), /3 = ( f t,... ,ft.)' — набор неиз­ вестных параметров (коэффициентов), £* — случайная ошибка. Так как yt принимает значения 0 или 1 и E(et) = 0, то

Е (yt) = 1 • Р (yt = 1) + 0 • P(yt = 0) = P(yt = 1) * x't /3.

Таким образом, модель (12.1) может быть записана в виде

P(yt = l) = * 'tft

(12.2)

поэтому ее называют линейной моделью вероятности (linear prob­ ability model).

Отметим некоторые особенности этой модели, наличие кото­ рых не позволяет успешно применять метод наименьших квадра­ тов для оценивания коэффициентов /3 и прогнозирования.

Из соотношения (12.1) следует, что ошибка е в каждом на­ блюдении может принимать только два значения: £t = 1 —х*/3 с вероятностью P(yt = 1) и £t = —x't /3 с вероятностью 1 —P(yt = 1). Это, в частности, не позволяет считать ошибку нормально распре­ деленной или имеющей распределение, близкое к нормальному. Далее, непосредственным вычислением получаем, что дисперсия ошибки V(£t) = Ф(/3(1 —x J/З) зависит от х*, т. е. модель (12.1) гетероскедастична (п.6.1). Как известно, оценки коэффициентов /3, полученные обычным методом наименьших квадратов, в этом случае не являются эффективными, и желательно пользоваться доступным обобщенным методом наименьших квадратов (п. 5.3).

Самым серьезным недостатком линейной модели вероятности является тот факт, что прогнозные значения yj = x't /3, которые по смыслу модели есть прогнозные^значения вероятности P(yt = 1), могут лежать вне отрезка (0,1) (/3 — оценка коэффициентов /3, по­ лученная с помощью обычного или обобщенного метода наимень­ ших квадратов), что, конечно же, не поддается разумной интер­ претации. Это обстоятельство существенно ограничивает область

12.1. Модели бинарного и множественного выбора

323

применимости линейной модели вероятности. Ее целесообразно использовать при большом числе наблюдений и при достаточно точной спецификации модели, а также как инструмент первичной обработки данных для сравнения с результатами, получаемыми более тонкими методами.

Probit- и iogti-модели

Описание моделей

Основной недостаток линейной модели вероятности есть след­ ствие предположения о линейной зависимости вероятности Р (з/t = 1) от /3 (см. (12.2)). Его можно преодолеть, если считать, что

P(yt = l)= F (® 't /3),

(12.3)

где F(-) — некоторая функция, область значений которой лежит в отрезке [0,1]. В частности, в качестве F(-) можно взять функцию распределения некоторой случайной величины. Одна из возмож­ ных интерпретаций модели (12.3) выглядит следующим образом. Предположим, что существует некоторая количественная пере­ менная у*, связанная с независимыми переменными x t обычным регрессионным уравнением

У* =®'t /3 + et,

(12.4)

где ошибки St независимы и одинаково распределены с нулевым средним и дисперсией о 1. Пусть также F(-) — функция распре­ деления нормированной случайной ошибки St/<r. Величина у£ яв­ ляется ненаблюдаемой (латентной), а решение, соответствующее значению у* = 1, принимается тогда, когда у* превосходит неко­ торое пороговое значение. Так, в примере с покупкой автомоби­ ля можно считать, что у* представляет накопления семьи с но­ мером t. Без ограничения общности, если константа включена в число регрессоров, можно считать это пороговое значение равным нулю. Величину у* можно также интерпретировать как разность полезностей альтернативы 1 и альтернативы 0.

324 Гд. 12. Дискретные зависимые переменные и цензурированные выборки

Таким образом,

yt = 1, если y l > О,

(12.5)

yt = 0, если yl < 0.

Тогда, предполагая, что случайные ошибки £t имеют одно и то же симметричное распределение F( ) (т.е. F(—х) = 1 —F(x)), получаем:

P(yt = 1) = р (у; ^ о) = р(*; /з + et >о)

= P(et ^ - х [ /3) = Р (£t < x't (3) = F

, (12.6)

что с точностью до нормировки совпадает с (12.3).

Замечание. В модели (12.4)-(12.6) параметры /3 и а участвуют только в виде отношения и не могут быть по отдельности иденти­ фицированы (т.е. оценить можно лишь /З/сг). Поэтому в данном случае без ограничения общности можно считать, что а = 1.

Наиболее часто в качестве функции F( ) используют: —функцию стандартного нормального распределения:

U

—00

исоответствующую модель называют probit-моделъю;

функцию логистического распределения:

исоответствующую модель называют logit-моделъю.

Всвете рассмотренной выше интерпретации модели (12.3) ис­ пользование функции нормального распределения представляет­ ся достаточно естественным. Применение функции логистическо­ го распределения во многом объясняется простотой численной ре­ ализации процедуры оценивания параметров. Вопрос о том, ка­ кую из моделей (probit или logit) следует использовать в том или ином случае, является достаточно сложным. Можно, на­ пример, выбрать ту модель, для которой больше значение соот­ ветствующей функции правдоподобия. Отметим также, что для

12.1. Модели бинарного и множественного выбора

значений и, достаточно близких по модулю к нулю (напр* при и € [—1.2, 1.2]), функции Ф(и) и Л(и) ведут себя прим одинаково, в то же время «хвосты» логистического распре, ния значительно «тяжелее» «хвостов» нормального распре, ния. Практический опыт показывает, что для выборок с не( шим разбросом объясняющих переменных и при отсутстви. щественного преобладания одной альтернативы над другой i ственные выводы, получаемые с помощью probit- и logit-мо) будут, как правило, совпадать.

Поскольку модель (12.3) нелинейна по параметрам /3, i интерпретация отличается от привычной интерпретации коэ( циентов линейных регрессионных моделей. Предположим,1 функции распределения F(-) есть плотность р(-). Диффер* руя по векторному аргументу х (приложение ЛА, п. 19) и опу нижний индекс t (номер наблюдения), получаем:

дР(^ 1} = F '(x '0 )0 = p (x '0 )0 . (

Таким образом, предельный эффект каждого объясняющего тора X j , j = 1,..., к является переменным и зависит от знач всех остальных факторов х = (xj, ... , х*)'.

При использовании этой модели для получения представл о «среднем» предельном эффекте рекомендуется вычислять изводные (12.7) для средних по выборке значений незавиа переменных х.

Оценивание модели

Для оценивания параметров /3 модели (12.3) обычно исполь метод максимального правдоподобия (глава 10). Предполо что наблюдения у \ , ... ,уп независимы. Поскольку yt может нимать значения только 0 или 1, то функция правдоподобия t следующий вид:

L = L(y,f. -.,!/„)= П (! -

£)) П

/*)■

(

yi=o

yt=1

326 Гл. 12. Дискретные зависимые переменные и цензурированные выборки

Отсюда легко вытекает, что

 

L = п и * ; л г (1 - F W ,

 

t

 

Логарифмируя, получаем:

 

I = In L = 5 > * In F{x't /3) + (1 - y t) ln(l - F(x't /3))].

(12.9)

t

 

Дифференцируя равенство (12.9) по вектору /3 (приложение ЛА, п. 19), получаем векторное уравнение правдоподобия

91

X" (ytV^x>t ®

(1~ у^р(х'1д- _ п

( 12.10)

др

4 ^\F(x'tf3)

1 -F(x'tP) ) *

 

Для logit-модрпн оно существенно упрощается. Действительно, пользуясь легко проверяемым тождеством А'(и) = Л(и)(1 —Л(и)), имеем

5 ^ (!ft-A (x /t /3))xt = 0. t

Уравнение правдоподобия (12.10) является системой нелиней­ ных (относительно /3) уравнений, в общем случае нельзя най­ ти ее аналитическое решение и приходится прибегать к числен­ ным методам. Отметим также, что уравнение правдоподобия есть лишь необходимое условие локального экстремума. Можно пока­ зать (см., например, (Greene, 1997)), что для probit- и loyit-ъло- делей логарифмическая функция правдоподобия I является во­ гнутой по /3 функцией и, значит, решение уравнения (12.10) дает оценку максимального правдоподобия набора параметров /3. Про­ цедуры оценивания probit- и logit-моделей реализованы в боль­ шинстве современных эконометрических компьютерных пакетов.

Пример. Факторы некредитоспособности российских банков. Этот пример основан иа результатах дипломной работы выпускницы РЭШ 1999 г. Б. Б. Баян-оол.

Как те или иные характеристики банка влияют на его жизне­ способность? Для исследования этой проблемы была рассмотрена

12.1. Модели бинарного и множественного выбора

327

Ufgit-иодепь с бинарной переменной, принимающей значения 1 или О, в зависимости от того, находится ли банк в критическом состо­ янии или нет. Решение о том, является ли банк проблемным или иет, принималось на основании рейтинга банков, опубликованного в журнале «Профиль» от 21 июня 1999 г. Значение 1 приписыва­ лось банкам с отрицательным капиталом; банкам, имеющим 4-ю группу проблемиости; банкам, у которых отозвана лицензия или принято решение об отзыве. Остальным банкам присвоено значе­ ние 0. Из многочисленных характеристик банков (возраст, капитал, ликвидные активы, работающие рисковые активы, обязательства до востребования, суммарные обязательства, уставный фонд, чи­ стые активы и т. п.) в окончательную модель после анализа и мно­ гочисленных попыток были включены следующие переменные:

TOTLIAB —суммарные обязательства (тыс. руб.); CURRENCY — валютная составляющая (%); EQUITY/ASS, где EQUITY —недвижимость (тыс. руб.), ASS — чистые активы (тыс. руб.);

PROFIT/ASS, где PROFIT —прибыль (убыток) (тыс. руб.); RETAIL/TOTLIAB, где RETAIL — средства частиых лиц (тыс.

РУб.);

TOTLLAB/PREF, где PREF —работающие рисковые активы (тыс. руб.).

Модель включает 182 наблюдения. Результаты оценивания с помощью Цг»1-модели приведены в таблице 12.1. Полученные ре­ зультаты согласуются с экономической интуицией. В частности, в результате кризиса наименее устойчивыми оказались крупные

имельчайшие банки. Поскольку в выборке представлены средние

икрупные банки, то положительность коэффициентов при пере­ менных, характеризующих величину банка, согласуется с реально­ стью.

Переменная

 

 

Таблица 12.1

Коэфф.

Стапд. откл.

t-статист. Р-знач.

С

-3.19

0.87

-3.68

0.000

TOTLIAB

2.14E-07

7.21E-08

2.97

0.003

CURRENCY

-0.09G

0.031

-3.13

0.021

EQUITY/ASS

-8.58

3.71

-2.31

0.022

PROFIT/ASS

-26.99

9.49

-2.84

0.005

RETAIL/TOTLIAB

3.53

1.23

2.87

0.005

TOTLIAB/PREF

2.00

0.90

2.23

0.027

328 Гл. 12. Дискретные зависимые переменные и цензурированные выборки

Проверка гипотез

Для probit- или logit-моделей проверка гипотез о наличии огра­ ничений на коэффициенты, в частности, гипотез о значимости одного или группы коэффициентов, может проводиться с помо­ щью любого из трех тестов — Вальда, отношения правдоподо­ бия, множителей Лагранжа, рассмотренных в главе 10 (п. 10.6). Большинство эконометрических пакетов, в которых реализованы probit- или logit-модели, имеют встроенные процедуры проверки ограничений с указанием метода тестирования.

Ошибки спецификации

Кратко рассмотрим проблемы, возникающие при нарушении некоторых предположений, лежащих в основе модели (12.3). По­ дробное изложение этого материала требует привлечения доволь­ но сложных методов и выходит за рамки данной книги. Более детально эти вопросы изложены, например, в (Greene, 1997) или (Johnston and DiNardo, 1997).

Рассматривая реализацию (12.4), (12.5) модели (12.3) с помо­ щью ненаблюдаемой переменной у*, мы предполагали, что ошиб­ ки et одинаково распределены, в частности, гомоскедастичны. Из­ вестно (п.6 .1), что при нарушении этого условия, т. е. при нали­ чии гетероскедастичпости, оценки метода наименьших квадратов в линейных регрессионных моделях перестают быть эффективны­ ми, но остаются несмещенными и состоятельными. В нашем слу­ чае гетеросксдастичпость, вообще говоря, приводит к нарушению состоятельности и асимптотической несмещенности. На содержа­ тельном уровне это нетрудно попять, исходя из следующих сооб­ ражений. Пусть ошибки £t, t = 1,... ,п распределены нормально с пулевым средним и дисперсиями at, t = 1,... ,п (гетероскедастичность) и предположим, что выполнено (12.5). Тогда, повторяя выкладки (12.6 ), получим:

где Ф(-) — функция стандартного нормального распределения.

12.1. Модели бинарного и множественного выбора

329

Соответствующим образом изменится логарифмическая функция правдоподобия (12.9):

+ ( l - * ) t a ( l - * ( = £ ) ) ] .

Это означает, что теперь необходимо оценивать п + к —1 неизвест­ ных параметров (без ограничения общности одну из дисперсий можно считать равной 1), что без дополнительных предположе­ ний невозможно сделать состоятельно на основе я наблюдений.

Аналогично тому, как это делается в тесте Бреуша-Пагана (глава 6), можно предполагать ту или иную форму зависимости дисперсий от экзогенных факторов и тестировать гипотезы об от­ сутствии гетероскедастичности (подробнее см. (Greene, 1997)).

Вп. 4.4 мы рассмотрели проблемы исключения существенных

ивключения несущественных переменных для линейных регрес­ сионных моделей. Можно поставить аналогичный вопрос: какое влияние оказывает пропуск существенных переменных в уравне­ нии (12.4) на оценивание модели бинарного выбора (12.3)? Исчер­ пывающий ответ на него выходит за рамки нашей книги. Отметим лишь, что в данном случае, даже если исключенные существен­ ные переменные ортогональны включенным, оценки параметров будут, в отличие от линейной схемы, смещенными и несостоя­ тельными (подробнее см. (Greene, 1997) и (Johnston and DiNardo, 1997)).

Модели множественного выбора

Модели множественного выбора, когда имеется не две, а несколь­ ко альтернатив, можно строить и изучать, обобщая подходы и методы, используемые для моделей бинарного выбора.

Номинальные зависимые переменные

Если соответствующая переменная является номинальной (ка­ чественной), то множественный выбор может быть представлен как последовательность бинарных выборов. Поясним это простым примером. Предположим, что изучается выбор одной из трех

330 Гл. 12. Дискретные зависимые переменные и цензурированные выборки

профессий: инженер, научный работник, преподаватель. Введем три бинарных переменных, соответствующих каждой профессии: у* = 1 для инженеров, у* = 0 для всех остальных; у* = 1 для научных работников, у* = 0 для всех остальных; у* = 1 для пре­ подавателей, у* = 0 для всех остальных.

Тогда выбор одной из трех альтернатив можно описать в виде «дерева» последовательных решений, в узлах которого происхо­ дит бинарный выбор.

В каждом узле, применяя технику оценивания для бинарных мо­ делей, можно оценить условную вероятность выбора соответству­ ющей альтернативы. Безусловная вероятность вычисляется по формуле умножения вероятностей. Так, например,

Р(у‘ = 1) = Р(у‘ = 0, у» = 0) = Р(у<= 0)Р(у* = 0 | у‘ = 0).

В последнем произведении первый сомножитель оценивается в первом узле (стрелка вниз), второй — во втором (стрелка вниз). Обобщение этого метода на случай любого числа альтернатив не представляет труда.

Однако у данного способа построения моделей множественно­ го выбора есть очевидный недостаток: «дерево» последователь­ ных решений можно строить по-разному, и результаты оценива­ ния будут, вообще говоря, разными.

Другой подход к моделям множественного выбора с качествен­ ной зависимой переменной основан на понятии случайной полез­ ности (как уже отмечалось выше, в probit- или /pytt-моделях скры­