
Диплом / suslov_ibragimov_ekonometrika
.pdf632 |
Глава21.Модели с качественными зависимыми переменными |
u(s) = zαs + εs ,или что функция имеет один и тот же вид,коэффициенты в зависимости от s не меняются,а меняются только факторы,определяющие выбор, то есть u(s) = zs α + εs .В первом случае z можно интерпретировать как характеристики индивидуума,принимающего решение.Это собственно мультиномиальный логит.Во втором случае zs можно интерпретировать как характеристики s-й альтернативы.Этот второй вариант называют условным логитом.
Можно предложить модель,которая включает оба указанных варианта.Обозначимчерез w характеристикииндивидуума,ачерез zs характеристики s-ойаль- тернативы(в том числе те,которые специфичны для конкретных индивидуумов). Например,при изучении выбора покупателями супермаркета альтернативами являются имеющиеся супермаркеты, w мог бы включать информацию о доходах и т.п.,а в zs следует включить информацию о супермаркетах(уровень цен,широта ассортимента и т.п.)и характеристики пар ы покупательÑсупермаркет,такие как расстояние до супермаркета от места жительства потребителя.
В такой модели u(s) = zs α + wδs + εs |
и вероятности вычисляются по формуле |
||
Pr(x = s) = |
|
ezsα+wδs |
|
|
S 1 |
. |
|
|
|
eztα+wδt |
|
|
%t=0− |
||
Заметим,что в этой модели есть неоднозначность.В частности,если прибавить |
|||
ккоэффициентам δs одинитотжевектор |
Ñэтовсеравно,чтоумножитьчисли- |
тель и знаменатель на ew .Таким образом,для идентификации модели требуется какая-либо нормировка векторов δs .Можно,например,положить δ0 = 0.
Для оценивания модели используется метод максимального правдоподобия.
Пусть (xi , zi0, . . . , zi,S−1, wi ), i = 1, . . . , N Ñимеющиеся наблюдения.Обозначим
ezisα+wiδs
pis(α,δ ) = Pr(xi = s) = %S−1 ezitα+wiδt .
t=0
Тогда логарифмическая функция правдоподобия имеет вид
ln L(α,δ ) = S!−1 ! ln pis(α,δ ),где Is = {i|xi = s}.
s=0 i Is
На основе xi можно ввести набор фиктивных переменных dis ,таких что
dis = |
|
1, |
xi = s, |
|
|
|
|
|
|
0, |
x = s. |
|
|
|
i ! |
|
|
|
|
21.2Оценивание модели с биномиальной зависимой переменной |
633 |
||
В этих обозначениях функция правдоподобия приобретет вид |
|
||
|
N |
S−1 |
|
|
!i ! |
|
|
ln L(α,δ ) = |
|
dis ln pis (α,δ ). |
|
=1 s=0
21.2.3.Моделирование зависимости от посторонних альтернатив в мультиномиальных моделях
Длямультиномиальногологитаотношениевероятностейдвухальтернатив(Çсоотношение шансовÈ)равно
Pr(x = s) |
|
e(zsα+wδs) |
||
|
|
= |
|
= e((zs−zt)α+w(δs−δt)). |
Pr(x = t) |
e(ztα+wδt) |
Онозависиттолькоотхарактеристикэтихдвухальтернатив,нонеотхарактеристик остальных альтернатив.Это свойство называется независимостью от посторонних альтернатив.Оно позволяет оценивать мультиномиальные модели на подмножестве полного множества альтернатив и получать корректные(состоятельные)оценки.Однако это свойство мультиномиального логита во многих ситуациях выбора не очень реалистично.
Рассмотрим,например,выбор между передвижением на поезде,на самолете авиакомпанииAи на самолете авиакомпанииB.Известно,что50%пассажиров выбирает поезд, 25% ÑавиакомпаниюAи25% ÑавиакомпаниюB.Допустим, авиакомпании предоставляют примерно одинаковые услуги по схожей цене,и пассажиры предпочитают одну из двух авиакомпаний по каким-то чисто субъективным причинам.Если авиакомпании объединятся,то естественно ожидать,что соотношение шансов для поезда и самолета будет равно один к одному.Однако с точки зрения мультиномиального логита соотношение шансов должно остаться два к одному,посколькухарактеристикипередвиженияпоездомипередвижениясамолетом остались теми же.
Предложено несколько модификаций этой модели,которые уже не демонстрируют независимость от посторонних альтернатив,и,следовательно,более реалистичны.
В модели вложенного логита используется иерархическая структура альтернатив.Вдвухуровневой моделисначаладелается выбормеждугруппамиальтернатив, а затем делается выбор внутри выбранной группы.В приведенном примере есть две группы альтернатив: ÇсамолетÈиÇпоездÈ.Внутри группыÇсамолетÈделается выбор между авиакомпаниямиAиB.ГруппаÇпоездÈсодержит только одну альтернативу,поэтому выбор внутри нее тривиален.
Пустьимеется l группальтернатив.Обозначимчерез Sk множество альтернатив,принадлежащих k-й группе.Безусловная вероятность того,что будет выбрана
634 |
Глава21.Модели с качественными зависимыми переменными |
альтернатива s из группы k в модели вложенного логита,определяется формулой (запишем ее только для условного логита,т.е.модели,где от альтернативы зависят факторы,но не коэффициенты)
Pr(x = s) = |
e(zúkαú +zsα) |
= |
ezúkαú ezsα |
. |
|
l |
l |
||||
|
|
|
|||
|
%m=1 %t Sm e(zúmαú +ztα) |
|
%m=1 ezúmαú %t Sm eztα |
|
Если альтернативы s и t принадлежат одной и той же группе k,то отношение вероятностей равно
Pr(x = s) |
= |
ezúkαú ezsα |
= |
ezsα |
. |
|
Pr(x = t) |
|
ezúkαú eztα |
|
|||
|
|
eztα |
Это отношение,как и в обычном мультиномиальном логите,зависит только от характеристик этих альтернатив.В то же время,если альтернативы s и t принадлежат разным группам, k и m соответственно,то отношение вероятностей равно
Pr(x = s) |
= |
ezúkαú ezsα |
= |
ezúkαú +zsα . |
||
Pr(x = t) |
|
|
ezúmαú eztα |
|
ezúmαú +ztα |
|
Это отношение зависит,кроме характеристик самих альтернатив,также от характеристик групп,к которым они принадлежат.
Другое направление модификации модели мультиномиального логита исходит из того,что независимость от посторонних альтернатив является следствием двух предположений,лежащих в основе модели:то,что ошибки εs одинаково распределены и,следовательно,имеют один аковую дисперсию,и то,что они независимы.
Во-первых,можно предположить,что имеет место гетероскедастичность. (Имеется в виду не гетероскедастичность по наблюдениям,а гетероскедастичность по альтернативам.)Для того чтобы ввести гетероскедастичность в модель,достаточнодополнитьраспределенияошибокмасштабирующимикоэффициентами.При этом ошибка εs имеет функцию распределения
Fs (y) = e−e−y/σs .
Поскольку одновременно все σs идентифицировать нельзя,то требуется нормировка.Например,можно принять,что σ0 = 1.С помощью такой модификации мы получим гетероскедастичную модель с распределением экстремального значения.
Во-вторых,можно предположить,что ошибки εs могут быть коррелированными друг с другом.Обычно в таком случае используют многомерное нормальное

636 Глава21.Модели с качественными зависимыми переменными
Pub = 1,если хотя бы один ребенок посещает государственную школу,иначе 0; Priv = 1,если хотя бы один ребенок посещает частную школу,иначе 0; Years Ñ срок проживания в данном районе; Teach = 1,если человек работает учителем, иначе 0; LnInc Ñлогарифм годового дохода семьи в долл.; PropTax Ñлогарифм налогов на имущество в долл.за год(зам еняет плату за обучениеÑплата зависит от имущественного положения); Yes = 1,если человек проголосовал на референдумеÇзаÈ, 0,еслиÇпротивÈ.Зависимая переме ннаяÑ Yes.В модель включаются все перечисленные факторы,а также квадратYears.
1.1.Получите приближенные оценки для логита и пробита с помощью линейной регрессии.
1.2.Оцените логитипробитспомощью ММПисравните спредыдущимпунктом.
1.3.Вычислите коэффициенты логита через коэффициенты пробита и сравните с предыдущими результатами.
1.4.На основе оценок МП для логита найдите маргинальные значения дляTeach, LnIncиPropTaxпри среднем уровне факторов.
1.5.Постройте график вероятности голосованияÇзаÈв зависимости отYearsпри среднем уровне остальных факторов.
1.6.Постройте аналогичный график маргинального значенияYears.
Упражнение2
Рассматриваетсямодельмультиномиальногологита.Вмоделиимеетсятриальтернативы: 0, 1и2.Для каждой из альтернатив s = 0, 1, 2 полезность рассчиты-
вается по формуле us = zs α + βs + εs ,где α = 2, βs = s/5,а ошибки εs имеют распределение экстремального значения. Поскольку функция распределения для
распределения экстремального значения имеет вид F (ε) = e−e−ε ,то ошибки можногенерироватьпоформуле ε = −ln (−ln (ξ)), ξ имеетравномерное распределе-
ние на отрезке [0; 1].Зависимая переменная |
x принимает одно из трех возможных |
||
значений(0, 1или2)в зависимости |
от того,какая полезность выше. |
||
2.1.Пусть z1 = 0.4, z2 = 0.3, |
z3 = 0.2.Проверить методом Монте-Карло |
||
формулу для вероятностей: |
|
|
|
Pr(x = s) = |
ezsα+βs |
, |
|
|
|||
2 |
|||
|
|
t% |
|
|
|
eztα+βt |
|
|
|
=0 |
|
21.3.Упражнения и задачи |
637 |
сгенерировав выборку из1000наблюдений для x и рассчитав эмпирические |
|
частоты. |
|
2.2.Сгенерировать данные по модели,взяв zs N (0, 2) |
для всех s.Сгенери- |
ровав набор из1000наблюдений (xi, z0i , z1i , z2i ),где |
i = 1, . . . , 1000,по- |
лучить оценки параметров модели мультиномиального логита,предполагая, что β0 = 0.Сравнить с истинными значениями параметров.
Задачи
1.Чему равны оценки максимального правдоподобия по модели логит с одной константой?
2.Запишите7терминов,которые имеют отношение к моделям с качественной зависимой переменной.
3.Рассмотрите модель с бином иальной зависимой переменной x,принимающейзначения0или1изависящейотфиктивнойпеременной z,принимающей значения0или1.Модель включает также константу.Данные резюмируются следующей таблицей(в клетках стоят количества соответствующих наблюдений):
|
x = 0 |
x = 1 |
|
|
|
z = 0 |
N00 |
N01 |
|
|
|
z = 1 |
N10 |
N11 |
|
|
|
а)Пусть в основе модели лежит некоторая дифференцируемая функция распределения F (á),заданная навсейдействительной прямой.Найдите
Pr (x = 1) при z = 0 и при z = 1.
б)Запишите в компактном виде логарифмическую функцию правдоподобия.
в)Запишите условия первого порядка для оценок максимального правдоподобия,обозначая F ! (y) = f (y).
г)Для N00 = 15, N01 = 5, N10 = 5, N11 = 15 получите оценки логита методом максимального правдоподобия.
д)Для тех же данных получите оценки пробита методом максимального правдоподобия,используя таблицы стандартного нормального распределения.
е)Какможноопределить,значималификтивнаяпеременная z?Запишите формулусоответствующей статистикииукажите,каконараспределена.
638 |
Глава21.Модели с качественными зависимыми переменными |
ж)Получите формулу для приближенных оценок логита методом усреднения(используя линейность отношения шансов для логита).Сравните с формулой для оценок максимального правдоподобия.
4.Изучается зависимость курения среди студентов от пола.В следующей таблице приведены данные по40студентам:
Пол |
Количество наблюдений |
Доля курящих |
|
|
|
Муж. |
20 |
0.3 |
|
|
|
Жен. |
20 |
0.4 |
|
|
|
Оцените по этим данным модель логит методом максимального правдоподобия.Используйте приэтом то,что ln 2 = 0.693, ln 3 = 1.099 и ln 11 = 2.398.
5.Пусть переменная x,принимающая значения 0 или 1,зависит от одного фактора z.Модель включает также константу.Данные приведены в таблице:
x |
0 |
0 |
1 |
1 |
0 |
1 |
0 |
1 |
0 |
1 |
|
|
|
|
|
|
|
|
|
|
|
z |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|
|
|
|
|
|
|
|
|
|
|
Запишите для этих данных логарифмическую функцию правдоподобия модели с биномиальной зависимой переменной.
6.Оцените упорядоченный пробит методом максимального правдоподобия по следующим данным:
x |
0 |
1 |
2 |
3 |
4 |
|
|
|
|
|
|
количество на- |
50 |
40 |
45 |
80 |
35 |
блюдений |
|
|
|
|
|
|
|
|
|
|
|
7.Модель с биномиальной зависимой переменной имеет вид:
x÷ = αz + β + ε,
1, x÷ > 0, x =
0, x÷ < 0,
где z Ñфиктивнаяпеременная.Связьмежду x и z заданатаблицей(вклетках указано количество наблюданий):

21.3.Упражнения и задачи |
|
|
639 |
|||
|
|
|
|
|
|
|
|
|
|
|
x |
|
|
|
|
|
|
|
|
|
|
|
|
0 |
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
z |
0 |
24 |
|
28 |
|
|
|
|
|
|
|
|
|
1 |
32 |
|
16 |
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
а)Найдите оценки коэффициентов логита и пробита по методу усреднения сгруппированных наблюдений.
б)Найдите оценки максимального правдоподобия.
в)Проверьте значимость модели в целом по статистике отношения правдоподобия.
8.По некоторым данным был оценен ря д моделей с биномиальной зависимой переменной и факторами z1 и z2.В таблице приведены результаты оценивания этих моделей методом максимального правдоподобия.В скобках записаны стандартные ошибки коэффициентов.Прочерк означает,что данный фактор не был включен в модель.В последней строке приведено значение логарифмической функции правдоподобия в максимуме.
|
|
Логит Пробит |
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
I |
II |
III |
|
IV |
V |
IV |
VII |
VIII |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Кон< |
1.87 |
0.28 |
1.88 |
|
0.28 |
1.14 |
0.17 |
1.16 |
0.18 |
станта |
(0.38) |
(0.20) |
(0.38) |
|
(0.20) |
(0.21) |
(0.12) |
(0.21) |
(0.12) |
|
|
|
|
|
|
|
|
|
|
Z1 |
Ð0.08 |
0.0012 |
Ñ |
|
Ñ |
Ð0.06 |
0.0011 |
Ñ |
Ñ |
(0.33) |
(0.19) |
|
(0.19) |
(0.12) |
|||||
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
Z2 |
Ð2.00 |
Ñ |
Ð1.99 |
|
Ñ |
Ð1.21 |
Ñ |
Ð1.20 |
Ñ |
(0.44) |
(0.44) |
|
(0.24) |
(0.25) |
|||||
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
ln L |
Ð44.4 |
Ð68.2 |
Ð44.5 |
|
Ð68.3 |
Ð44.2 |
Ð68.3 |
Ð44.4 |
Ð68.5 |
|
|
|
|
|
|
|
|
|
|
Какую из моделей следует выбрать?Обоснуйте свой ответ.
9.Рассмотрите модель дискретного выбора из двух альтернатив с линейной случайной функцией полезности вида:
u(s) = αzs + β + εs , s = 0.1,
где все ошибки εs имеют равномерное распределение U [−γ,γ ] и независимы по уравнениям и по наблюдениям.
а)Найдите вероятности выбора s = 0 и s = 1 для такой модели.
640 Глава21.Модели с качественными зависимыми переменными
б)Объясните,идентифицируемы ли одновременно параметры α, β и γ . Если нет,то предложите идентифицирующую нормировку.
в)Запишите функцию правдоподобия для этой модели.
10.Покажите,чтологарифмическая функцияправдоподобия длябиномиального логитаявляетсявсюдувогнутойпопараметрам.Какиепреимуществадаетэто свойство?
11.Рассмотрите модель дискретного выбора из двух альтернатив: s = 1 и s = 2, в основе которого лежит случайная полезность ui(s) = zis α + εis ,предполагая,чтоошибкидвухальтернативкоррелированыираспределенынормально:
|
ε1i |
|
|
N |
|
0 |
, |
σ12 |
σ12 |
. |
|
ε2i |
|
|
|
0 |
|
σ12 |
σ22 |
|
|
|
|
|
|
|
|
|
|
|
|
|
Какие параметры идентифицируемы?Аргументируйте свой ответ.Предложите нормировки,которые позволят оценить такую модель биномиального пробита.Каким методом можно оценить такойÇкоррелированныйÈпробит?
12.Пусть Λ (á), Φ (á) Ñфункции распределения логистического и стандартного нормального распределения соответственно.
а)Покажите,что выпуклая комбинация F (y) = (1 − α)Λ(y) + αΦ(y), α [0; 1],также задает функцию распре деления(удовлетворяющую всем должным требованиям).
б)Постройте на основе F (y) модель,которая охватывает как логит,так и пробит.
в)Запишителогарифмическуюфункциюправдоподобиядлятакоймодели.
г)Запишите условия первого порядка для оценок максимального правдоподобия.
д)Является ли параметр α идентифицируемым? (Аргументируйте свой ответ формально.)
13.Рассмотрите модель дискретного выбора из двух альтернатив с линейной случайной функцией полезности вида:
u(s) = zs α + εs , s = 0.1,
где все ошибки ε0 и ε1 независимы и их функция распределения имеет вид
F (y) = e−e−y .

21.3.Упражнения и задачи |
641 |
а)Покажите,что
( ) ey
Pr ε1 − ε0 < y = 1 + ey .
б)Найдите вероятности выбора s = 0 и s = 1 для такой модели.Покажите,что данная модель совпадает с логитом.
14.Пусть в упорядоченном логите зависимая переменная x принимает три значения(0, 1, 2).Найдите,как вероятность того,что x = 2,зависит от параметра γ1 (границы между1и2),т.е.найдите соответствующее маргинальное значение.
15.Выведите формулу оценок максимал ьного правдоподобия для регрессии с упорядоченной зависимой переменной с одной константой.Для количества наблюдений,соответствующих выбору альтернативы s,используйте обозначение Ns . (Подсказка:удобно перейти от исходных параметров к вероятно-
стям ps = Pr (x = s).)
16.Рассмотритеиспользованиеупорядоче ннойрегрессиидлямоделированиярешения индивидуума о получении образования.Пусть в основе принимаемого решения имеется некоторый индекс,выражающий полезность от образования:
Ui = Ziα + εi, εi N (0; σ2).
Чем выше индекс,тем более вероятен выбор более высокого уровня образования.Более конкретно,пусть имеются некоторые известные заранее пороговые значения для индекса, γ1 и γ2,такие что:
Ðпри Ui > γ2 индивидуум i заканчивает вуз;
Ðпри γ1 < Ui ! γ2 индивидуум i заканчивает среднюю школу,но не получает высшего образования;
Ðпри Ui ! γ1 индивидуум i получает только неполное среднее образование.
а)Какой вид может иметь зависимая переменная в такой модели?
б)Покажите,что в данной модели нельзя однозначно идентифицировать как β,так и σ.
в)Можно ли однозначно идентифицировать |
β/σ ? |
г)Можно ли однозначно идентифицировать |
β,если положить σ = 1? |