Добавил:

ivanov666 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Пермский национальный исследовательский политехнический университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

книги / Эконометрика. Начальный курс

.pdf

Скачиваний:

Добавлен:

20.11.2023

Размер:

21.93 Mб

Скачать

☆

<<< < Предыдущая 21 22 23 24 25 26 27 28 29 30 31 3233 / 5833 34 35 36 37 38 39 40 41 42 43 44 45 > Следующая >>>

12.1. Модели бинарного и множественного выбора

321

ний. Можно показать, что в подобных ситуациях непосредствен ное применение метода наименьших квадратов дает смещенные оценки параметров.

Пример урезания выборки дает исследование распределения семей по объему выплачиваемых налогов или изучение зависимо сти выплачиваемых налогов от размера семьи, возраста се членов и т. п. Здесь из рассмотрения могут исключаться семьи, имеющие доход ниже официального уровня бедности. В этом случае уро вень бедности определяет урезание выборки. Метод наименьших квадратов здесь также приводит к смещенным оценкам.

Подчеркнем разницу между цензурированием и урезанием. В первой ситуации даже для цензурированного наблюдения извест ны значения независимых переменных, в то время как во втором случае известен лишь уровень урезания, а значения независимых переменных для исключенных из рассмотрения объектов неиз вестны.

12.1.Модели бинарного и множественного выбора

Для наглядности будем изучать модели бинарного выбора на при мере покупки семьей автомобиля. Обозначая, как и раньше, за висимую переменную у, будем считать, что у = 1, если в течение исследуемого периода времени семья купила автомобиль, и у = О в противном случае. Ясно, что на решение о покупке автомоби ля влияют самые различные факторы: доход семьи, количество ее членов, их возраст, место проживания семьи и т. п. Набор этих ха рактеристик можно представить вектором х = (жь ... ,xfc)/ (неза висимые переменные). Сохраняя основные идеи регрессионного подхода, будем предполагать, что на решение семьи влияют также неучтенные случайные факторы (ошибки). Выдвигая различные предположения о характере зависимости у от х , будем получать разные модели. Здесь мы рассмотрим три модели: линейную мо дель вероятности и так называемые probit- и logit-модели.

322 Гл. 12. Дискретные зависимые переменные и цензурированные выборки

Линейная модель вероятности

Воспользуемся обычной линейной моделью регрессии:

yt = x't /3 + et,

t = 1,... ,n,

(12.1)

где t — номер наблюдения (семьи), /3 = ( f t,... ,ft.)' — набор неиз вестных параметров (коэффициентов), £* — случайная ошибка. Так как yt принимает значения 0 или 1 и E(et) = 0, то

Е (yt) = 1 • Р (yt = 1) + 0 • P(yt = 0) = P(yt = 1) * x't /3.

Таким образом, модель (12.1) может быть записана в виде

P(yt = l) = * 'tft

(12.2)

поэтому ее называют линейной моделью вероятности (linear prob ability model).

Отметим некоторые особенности этой модели, наличие кото рых не позволяет успешно применять метод наименьших квадра тов для оценивания коэффициентов /3 и прогнозирования.

Из соотношения (12.1) следует, что ошибка е в каждом на блюдении может принимать только два значения: £t = 1 —х*/3 с вероятностью P(yt = 1) и £t = —x't /3 с вероятностью 1 —P(yt = 1). Это, в частности, не позволяет считать ошибку нормально распре деленной или имеющей распределение, близкое к нормальному. Далее, непосредственным вычислением получаем, что дисперсия ошибки V(£t) = Ф(/3(1 —x J/З) зависит от х*, т. е. модель (12.1) гетероскедастична (п.6.1). Как известно, оценки коэффициентов /3, полученные обычным методом наименьших квадратов, в этом случае не являются эффективными, и желательно пользоваться доступным обобщенным методом наименьших квадратов (п. 5.3).

Самым серьезным недостатком линейной модели вероятности является тот факт, что прогнозные значения yj = x't /3, которые по смыслу модели есть прогнозные^значения вероятности P(yt = 1), могут лежать вне отрезка (0,1) (/3 — оценка коэффициентов /3, по лученная с помощью обычного или обобщенного метода наимень ших квадратов), что, конечно же, не поддается разумной интер претации. Это обстоятельство существенно ограничивает область

12.1. Модели бинарного и множественного выбора

323

применимости линейной модели вероятности. Ее целесообразно использовать при большом числе наблюдений и при достаточно точной спецификации модели, а также как инструмент первичной обработки данных для сравнения с результатами, получаемыми более тонкими методами.

Probit- и iogti-модели

Описание моделей

Основной недостаток линейной модели вероятности есть след ствие предположения о линейной зависимости вероятности Р (з/t = 1) от /3 (см. (12.2)). Его можно преодолеть, если считать, что

P(yt = l)= F (® 't /3),

(12.3)

где F(-) — некоторая функция, область значений которой лежит в отрезке [0,1]. В частности, в качестве F(-) можно взять функцию распределения некоторой случайной величины. Одна из возмож ных интерпретаций модели (12.3) выглядит следующим образом. Предположим, что существует некоторая количественная пере менная у*, связанная с независимыми переменными x t обычным регрессионным уравнением

У* =®'t /3 + et,

(12.4)

где ошибки St независимы и одинаково распределены с нулевым средним и дисперсией о 1. Пусть также F(-) — функция распре деления нормированной случайной ошибки St/<r. Величина у£ яв ляется ненаблюдаемой (латентной), а решение, соответствующее значению у* = 1, принимается тогда, когда у* превосходит неко торое пороговое значение. Так, в примере с покупкой автомоби ля можно считать, что у* представляет накопления семьи с но мером t. Без ограничения общности, если константа включена в число регрессоров, можно считать это пороговое значение равным нулю. Величину у* можно также интерпретировать как разность полезностей альтернативы 1 и альтернативы 0.

324 Гд. 12. Дискретные зависимые переменные и цензурированные выборки

Таким образом,

yt = 1, если y l > О,

(12.5)

yt = 0, если yl < 0.

Тогда, предполагая, что случайные ошибки £t имеют одно и то же симметричное распределение F( ) (т.е. F(—х) = 1 —F(x)), получаем:

P(yt = 1) = р (у; ^ о) = р(*; /з + et >о)

= P(et ^ - х [ /3) = Р (£t < x't (3) = F

, (12.6)

что с точностью до нормировки совпадает с (12.3).

Замечание. В модели (12.4)-(12.6) параметры /3 и а участвуют только в виде отношения и не могут быть по отдельности иденти фицированы (т.е. оценить можно лишь /З/сг). Поэтому в данном случае без ограничения общности можно считать, что а = 1.

Наиболее часто в качестве функции F( ) используют: —функцию стандартного нормального распределения:

—00

исоответствующую модель называют probit-моделъю;

—функцию логистического распределения:

исоответствующую модель называют logit-моделъю.

Всвете рассмотренной выше интерпретации модели (12.3) ис пользование функции нормального распределения представляет ся достаточно естественным. Применение функции логистическо го распределения во многом объясняется простотой численной ре ализации процедуры оценивания параметров. Вопрос о том, ка кую из моделей (probit или logit) следует использовать в том или ином случае, является достаточно сложным. Можно, на пример, выбрать ту модель, для которой больше значение соот ветствующей функции правдоподобия. Отметим также, что для

12.1. Модели бинарного и множественного выбора

значений и, достаточно близких по модулю к нулю (напр* при и € [—1.2, 1.2]), функции Ф(и) и Л(и) ведут себя прим одинаково, в то же время «хвосты» логистического распре, ния значительно «тяжелее» «хвостов» нормального распре, ния. Практический опыт показывает, что для выборок с не( шим разбросом объясняющих переменных и при отсутстви. щественного преобладания одной альтернативы над другой i ственные выводы, получаемые с помощью probit- и logit-мо) будут, как правило, совпадать.

Поскольку модель (12.3) нелинейна по параметрам /3, i интерпретация отличается от привычной интерпретации коэ( циентов линейных регрессионных моделей. Предположим,1 функции распределения F(-) есть плотность р(-). Диффер* руя по векторному аргументу х (приложение ЛА, п. 19) и опу нижний индекс t (номер наблюдения), получаем:

дР(^ 1} = F '(x '0 )0 = p (x '0 )0 . (

Таким образом, предельный эффект каждого объясняющего тора X j , j = 1,..., к является переменным и зависит от знач всех остальных факторов х = (xj, ... , х*)'.

При использовании этой модели для получения представл о «среднем» предельном эффекте рекомендуется вычислять изводные (12.7) для средних по выборке значений незавиа переменных х.

Оценивание модели

Для оценивания параметров /3 модели (12.3) обычно исполь метод максимального правдоподобия (глава 10). Предполо что наблюдения у \ , ... ,уп независимы. Поскольку yt может нимать значения только 0 или 1, то функция правдоподобия t следующий вид:

L = L(y,f. -.,!/„)= П (! -

£)) П

/*)■

(

yi=o

yt=1

326 Гл. 12. Дискретные зависимые переменные и цензурированные выборки

Отсюда легко вытекает, что
L = п и * ; л г (1 - F W ,
t
Логарифмируя, получаем:
I = In L = 5 > * In F{x't /3) + (1 - y t) ln(l - F(x't /3))].	(12.9)
t

Дифференцируя равенство (12.9) по вектору /3 (приложение ЛА, п. 19), получаем векторное уравнение правдоподобия

91	X" (ytV^x>t ®	(1~ у^р(х'1&Лд- _ п	( 12.10)
др	4 ^\F(x'tf3)	1 -F(x'tP) ) *

Для logit-модрпн оно существенно упрощается. Действительно, пользуясь легко проверяемым тождеством А'(и) = Л(и)(1 —Л(и)), имеем

5 ^ (!ft-A (x /t /3))xt = 0. t

Уравнение правдоподобия (12.10) является системой нелиней ных (относительно /3) уравнений, в общем случае нельзя най ти ее аналитическое решение и приходится прибегать к числен ным методам. Отметим также, что уравнение правдоподобия есть лишь необходимое условие локального экстремума. Можно пока зать (см., например, (Greene, 1997)), что для probit- и loyit-ъло- делей логарифмическая функция правдоподобия I является во гнутой по /3 функцией и, значит, решение уравнения (12.10) дает оценку максимального правдоподобия набора параметров /3. Про цедуры оценивания probit- и logit-моделей реализованы в боль шинстве современных эконометрических компьютерных пакетов.

Пример. Факторы некредитоспособности российских банков. Этот пример основан иа результатах дипломной работы выпускницы РЭШ 1999 г. Б. Б. Баян-оол.

Как те или иные характеристики банка влияют на его жизне способность? Для исследования этой проблемы была рассмотрена

12.1. Модели бинарного и множественного выбора

327

Ufgit-иодепь с бинарной переменной, принимающей значения 1 или О, в зависимости от того, находится ли банк в критическом состо янии или нет. Решение о том, является ли банк проблемным или иет, принималось на основании рейтинга банков, опубликованного в журнале «Профиль» от 21 июня 1999 г. Значение 1 приписыва лось банкам с отрицательным капиталом; банкам, имеющим 4-ю группу проблемиости; банкам, у которых отозвана лицензия или принято решение об отзыве. Остальным банкам присвоено значе ние 0. Из многочисленных характеристик банков (возраст, капитал, ликвидные активы, работающие рисковые активы, обязательства до востребования, суммарные обязательства, уставный фонд, чи стые активы и т. п.) в окончательную модель после анализа и мно гочисленных попыток были включены следующие переменные:

TOTLIAB —суммарные обязательства (тыс. руб.); CURRENCY — валютная составляющая (%); EQUITY/ASS, где EQUITY —недвижимость (тыс. руб.), ASS — чистые активы (тыс. руб.);

PROFIT/ASS, где PROFIT —прибыль (убыток) (тыс. руб.); RETAIL/TOTLIAB, где RETAIL — средства частиых лиц (тыс.

РУб.);

TOTLLAB/PREF, где PREF —работающие рисковые активы (тыс. руб.).

Модель включает 182 наблюдения. Результаты оценивания с помощью Цг»1-модели приведены в таблице 12.1. Полученные ре зультаты согласуются с экономической интуицией. В частности, в результате кризиса наименее устойчивыми оказались крупные

имельчайшие банки. Поскольку в выборке представлены средние

икрупные банки, то положительность коэффициентов при пере менных, характеризующих величину банка, согласуется с реально стью.

Переменная			Таблица 12.1
Переменная	Коэфф.	Стапд. откл.	t-статист. Р-знач.
С	-3.19	0.87	-3.68	0.000
TOTLIAB	2.14E-07	7.21E-08	2.97	0.003
CURRENCY	-0.09G	0.031	-3.13	0.021
EQUITY/ASS	-8.58	3.71	-2.31	0.022
PROFIT/ASS	-26.99	9.49	-2.84	0.005
RETAIL/TOTLIAB	3.53	1.23	2.87	0.005
TOTLIAB/PREF	2.00	0.90	2.23	0.027

328 Гл. 12. Дискретные зависимые переменные и цензурированные выборки

Проверка гипотез

Для probit- или logit-моделей проверка гипотез о наличии огра ничений на коэффициенты, в частности, гипотез о значимости одного или группы коэффициентов, может проводиться с помо щью любого из трех тестов — Вальда, отношения правдоподо бия, множителей Лагранжа, рассмотренных в главе 10 (п. 10.6). Большинство эконометрических пакетов, в которых реализованы probit- или logit-модели, имеют встроенные процедуры проверки ограничений с указанием метода тестирования.

Ошибки спецификации

Кратко рассмотрим проблемы, возникающие при нарушении некоторых предположений, лежащих в основе модели (12.3). По дробное изложение этого материала требует привлечения доволь но сложных методов и выходит за рамки данной книги. Более детально эти вопросы изложены, например, в (Greene, 1997) или (Johnston and DiNardo, 1997).

Рассматривая реализацию (12.4), (12.5) модели (12.3) с помо щью ненаблюдаемой переменной у*, мы предполагали, что ошиб ки et одинаково распределены, в частности, гомоскедастичны. Из вестно (п.6 .1), что при нарушении этого условия, т. е. при нали чии гетероскедастичпости, оценки метода наименьших квадратов в линейных регрессионных моделях перестают быть эффективны ми, но остаются несмещенными и состоятельными. В нашем слу чае гетеросксдастичпость, вообще говоря, приводит к нарушению состоятельности и асимптотической несмещенности. На содержа тельном уровне это нетрудно попять, исходя из следующих сооб ражений. Пусть ошибки £t, t = 1,... ,п распределены нормально с пулевым средним и дисперсиями at, t = 1,... ,п (гетероскедастичность) и предположим, что выполнено (12.5). Тогда, повторяя выкладки (12.6 ), получим:

где Ф(-) — функция стандартного нормального распределения.

12.1. Модели бинарного и множественного выбора

329

Соответствующим образом изменится логарифмическая функция правдоподобия (12.9):

+ ( l - * ) t a ( l - * ( = £ ) ) ] .

Это означает, что теперь необходимо оценивать п + к —1 неизвест ных параметров (без ограничения общности одну из дисперсий можно считать равной 1), что без дополнительных предположе ний невозможно сделать состоятельно на основе я наблюдений.

Аналогично тому, как это делается в тесте Бреуша-Пагана (глава 6), можно предполагать ту или иную форму зависимости дисперсий от экзогенных факторов и тестировать гипотезы об от сутствии гетероскедастичности (подробнее см. (Greene, 1997)).

Вп. 4.4 мы рассмотрели проблемы исключения существенных

ивключения несущественных переменных для линейных регрес сионных моделей. Можно поставить аналогичный вопрос: какое влияние оказывает пропуск существенных переменных в уравне нии (12.4) на оценивание модели бинарного выбора (12.3)? Исчер пывающий ответ на него выходит за рамки нашей книги. Отметим лишь, что в данном случае, даже если исключенные существен ные переменные ортогональны включенным, оценки параметров будут, в отличие от линейной схемы, смещенными и несостоя тельными (подробнее см. (Greene, 1997) и (Johnston and DiNardo, 1997)).

Модели множественного выбора

Модели множественного выбора, когда имеется не две, а несколь ко альтернатив, можно строить и изучать, обобщая подходы и методы, используемые для моделей бинарного выбора.

Номинальные зависимые переменные

Если соответствующая переменная является номинальной (ка чественной), то множественный выбор может быть представлен как последовательность бинарных выборов. Поясним это простым примером. Предположим, что изучается выбор одной из трех

330 Гл. 12. Дискретные зависимые переменные и цензурированные выборки

профессий: инженер, научный работник, преподаватель. Введем три бинарных переменных, соответствующих каждой профессии: у* = 1 для инженеров, у* = 0 для всех остальных; у* = 1 для научных работников, у* = 0 для всех остальных; у* = 1 для пре подавателей, у* = 0 для всех остальных.

Тогда выбор одной из трех альтернатив можно описать в виде «дерева» последовательных решений, в узлах которого происхо дит бинарный выбор.

В каждом узле, применяя технику оценивания для бинарных мо делей, можно оценить условную вероятность выбора соответству ющей альтернативы. Безусловная вероятность вычисляется по формуле умножения вероятностей. Так, например,

Р(у‘ = 1) = Р(у‘ = 0, у» = 0) = Р(у<= 0)Р(у* = 0 | у‘ = 0).

В последнем произведении первый сомножитель оценивается в первом узле (стрелка вниз), второй — во втором (стрелка вниз). Обобщение этого метода на случай любого числа альтернатив не представляет труда.

Однако у данного способа построения моделей множественно го выбора есть очевидный недостаток: «дерево» последователь ных решений можно строить по-разному, и результаты оценива ния будут, вообще говоря, разными.

Другой подход к моделям множественного выбора с качествен ной зависимой переменной основан на понятии случайной полез ности (как уже отмечалось выше, в probit- или /pytt-моделях скры

<<< < Предыдущая 21 22 23 24 25 26 27 28 29 30 31 3233 / 5833 34 35 36 37 38 39 40 41 42 43 44 45 > Следующая >>>

Соседние файлы в папке книги

#
20.11.202314.57 Mб3Экология и научно-технический прогресс. Урбанистика.pdf
#
20.11.202311.06 Mб1Экология производства химических продуктов из углеводородов нефти и газа..pdf
#
20.11.2023673.03 Кб1Экология. Обучение чтению гипертекста (на материале английского языка).pdf
#
20.11.202314.32 Mб2Экология. Энергосбережение. Экономика.pdf
#
20.11.20234.06 Mб2Экология..pdf
#
20.11.202321.93 Mб16Эконометрика. Начальный курс.pdf
#
20.11.20235.8 Mб1Экономика отрасли машиностроение..pdf
#
20.11.20231.14 Mб3Экономика автотранспортного предприятия..pdf
#
20.11.20236.83 Mб0Экономика горного предприятия..pdf
#
20.11.20235.65 Mб9Экономика замкнутого цикла и управление отходами..pdf
#
20.11.2023583.2 Кб0Экономика и бизнес. Теоретические вопросы и практические задания.pdf