Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ЭКОНОМЕТРИКА и математическая экономика / Эконометрика. Учебник продвинутый (2005)

.pdf
Скачиваний:
512
Добавлен:
20.04.2015
Размер:
4.02 Mб
Скачать

20.3. Упражнения и задачи

623

2.3.Учесть эффекты второго порядка: добавить в регрессию попарные произведения исходных фиктивных переменных. Значимы ли они?

Задачи

Таблица 20.3

 

 

 

 

 

 

 

1.

Что является отличительной особенностью модели диспер-

 

 

A

B

 

 

 

 

 

 

 

I

43

2

 

 

сионного анализа по сравнению с «обычными» моделями

 

 

 

регрессионного анализа?

 

II

4

53

 

 

 

 

 

2.

С помощью таблицы 20.3 задана классификация по двум

 

 

 

 

 

 

III

8

1

 

 

факторам.

 

 

 

 

 

 

 

 

 

 

 

 

Запишите матрицы фиктивных переменных для главных эффектов.

 

 

3.

Какую структуру имеет матрица ковариаций оценок в дисперсионном анализе

 

без повторений?

 

 

 

 

 

4.

Как называется в дисперсионном анализе то, что в регрессионном анализе

 

называется объясненной и остаточной дисперсией?

 

 

 

 

 

5.

При проведении дисперсионного анализа с повторениями по усредненным

 

наблюдениям используется взвешенная регрессия. С какой целью это дела-

 

ется?

 

 

 

 

 

6.

Если в дисперсионном анализе без повторений отбросить эффекты высшего

 

порядка, то как изменятся значения параметров оставшихся эффектов?

7.

В модели полного дисперсионного анализа без повторений с одним фактором,

 

имеющим три уровня, запишите матрицу нецентральных вторых моментов

 

для матрицы регрессоров Z.

 

 

 

 

 

8.

Сколько наблюдений нужно иметь для применения модели дисперсионного

 

анализа без повторений в случае четырех факторов, каждый из которых мо-

 

жет принимать три уровня, если учитывать только эффекты первого порядка?

9.

Сколько наблюдений нужно иметь для применения модели полного диспер-

 

сионного анализа без повторений в случае двух факторов, каждый из которых

 

может принимать три уровня?

 

 

 

 

 

10.

Для модели дисперсионного анализа с двумя факторами, первый из которых

 

имеет три уровня, а второй — два, рассчитать матрицу C12.

 

 

 

 

 

11.

Рассмотрим модель дисперсионного анализа с двумя факторами, первый

 

из которых принимает два уровня, а второй — три уровня. Рассчитайте мат-

 

рицы Z1 , Z2.

 

 

 

 

 

624

Глава 20. Дисперсионный анализ

12.В первой группе 20 человек, а во второй — 30 человек. Дисперсия оценок по «Эконометрии» в первой группе равна 1.5, а во второй — 1. Вычислите остаточную дисперсию в модели дисперсионного анализа.

13.В первой группе 20 человек, а во второй — 30 человек. Средняя оценка по «Эконометрии» в первой группе равна 3.5, а во второй — 4. Вычислите объясненную дисперсию в модели дисперсионного анализа.

14.В первой группе 20 человек, а во второй — 30 человек. Средняя оценка по «Философии» в первой группе равна 4.5, а во второй — 3. Вычислите коэффициенты в модели дисперсионного анализа.

15.В первой группе 20 человек, а во второй — 30 человек. Средняя оценка по «Эконометрии» в первой группе равна 3.5, а во второй — 4. Дисперсия оценок в первой группе равна 1.5, а во второй — 1. Вычислите общую дисперсию оценок двум группам.

16.Проводится дисперсионный анализ без повторений с двумя факторами, один из которых принимает три уровня, а другой — четыре. Как вычисляется статистика для проверки значимости эффектов второго порядка? Какое она имеет распределение (сколько степеней свободы)?

Рекомендуемая литература

1.Болч Б., Хуань К.Дж. Многомерные статистические методы для экономики. — М.: «Статистика», 1979. (Гл. 5)

2.Себер Дж. Линейный регрессионый анализ. — М.: «Мир», 1980.

3.Шеффе Г. Дисперсионный анализ. — М.: «Наука», 1980.

Глава 21

Модели с качественными зависимыми переменными

При изучении экономических явлений на дезагрегированном уровне (уровне отдельных экономических субъектов) возникает потребность в новых методах. Дело

втом, что стандартные эконометрические методы, такие как классическая модель регрессии, предназначены для анализа переменных, которые могут принимать любое значение на числовой прямой, причем предполагается фактически, что распределение изучаемой переменной похоже на нормальное. Модели, в которых диапазон значений зависимой переменной ограничен, называют моделями с ограниченной зависимой переменной. Среди них важную роль играют модели,

вкоторых изучаемая переменная дискретна и может принимать только некоторые значения (конечное число), либо даже имеет нечисловую природу (так называемые

модели с качественной зависимой переменной). Модели такого рода помогают,

вчастности, моделировать выбор экономических субъектов. В качестве примера можно привести выбор предприятия: внедрять какую-то новую технологию или нет. Если индивидуальный выбор исследовать методами, предназначенными для непрерывных переменных, то будет неправомерно проигнорирована информация о поведенческой структуре ситуации.

21.1.Модель дискретного выбора для двух альтернатив

Анализ дискретного выбора основывается на микроэкономической теории, которая моделирует поведение индивидуума как выбор из данного множества аль-

626

Глава 21. Модели с качественными зависимыми переменными

тернатив такой альтернативы, которая бы максимизировала его полезность. Этот выбор с точки зрения стороннего наблюдателя, однако, не полностью предопределен. Исследователь не может наблюдать все факторы, определяющие результат выбора конкретного индивидуума. Коль скоро ненаблюдаемые факторы случайны, то выбор двух индивидуумов может быть разным при том, что наблюдаемые факторы совпадают. С его точки зрения это выглядит как случайный разброс среди индивидуумов с одними и теми же наблюдаемыми характеристиками.

Предполагается, что выбор осуществляется на основе ненаблюдаемой полезности альтернатив u(x). Если u(1) > u(0), то индивидуум выбирает x = 1, если u(1) < u(0), то индивидуум выбирает x = 0. В простейшем случае полезность является линейной функцией факторов: u(1) = 1 и u(0) = 0 . Чтобы модель была вероятностной, ее дополняют отклоняющими факторами, так что

u(1) = 1 + ε1, u(0) = 0 + ε0.

Предполагается, что распределение отклонений ε1 и ε0 непрерывно.

Заметим, что для описания выбора вполне достаточно знать разность между полезностями вместо самих полезностей:

x˜ = u(1) − u(0) = z(α1 − α0) + ε1 − ε0 = + ε,

при этом оказывается, что в основе выбора лежит переменная x˜, которая представляет собой сумму линейной комбинации набора факторов z и случайного отклонения ε, имеющего некоторое непрерывное распределение:

x˜ = + ε.

Эта переменная является ненаблюдаемой. Наблюдается только дискретная величина x, которая связана с x˜ следующим образом: если x˜ больше нуля, то x = 1, если меньше, то x = 0.

Ясно, что по наблюдениям за x и z мы могли бы оценить коэффициенты α только с точностью до множителя. Умножение ненаблюдаемых величин x˜, α

иε на один и тот же коэффициент не окажет влияния на наблюдаемые величины x

иz. Таким образом, можно произвольным образом нормировать модель, например, положить дисперсию ошибки равной единице.

Кроме того, в этой модели есть дополнительный источник неоднозначности: одним и тем же коэффициентам α могут соответствовать разные пары α0 и α1 . Таким образом, можно сделать вывод, что исходная модель выбора принципиально неидентифицируема. Однако это не мешает ее использованию для предсказания результата выбора, что мы продемонстрируем в дальнейшем.

21.1 Оценивание модели с биномиальной зависимой переменной

627

Без доказательства отметим, что если в модели выбора ε1 и ε0 имеют распределение F (y) = e−e−y (распределение экстремального значения) и независимы, то ε = ε1 − ε0 имеет логистическое распределение. При этом получается модель, называемая логит.

Если ε1 и ε0 имеют нормальное распределение с параметрами 0 и 1 2 и независимы, то ε = ε1 − ε0 имеет стандартное нормальное распределение. При этом получается модель, называемая пробит.

Модели логит и пробит рассматривались в главе 9.

21.2.Оценивание модели с биномиальной зависимой переменной методом максимального правдоподобия

Предыдущие рассуждения приводят к следующей модели:

x˜ = + ε,

0, x˜ < 0,

x =

1, x˜ > 0.

Пусть Fε(·) — функция распределения отклонения ε. Выведем из распределения ε распределение x˜, а из распределения x˜ — распределение x:

Pr(x = 1) = Pr(˜x > 0) = Pr(+ ε > 0) = Pr(ε > −zα) = 1 − Fε(−zα).

Для удобства обозначим F (y) = 1−Fε(−y). (При симметричности относительно нуля распределения ε будет выполнено F (y) = 1 − Fε(−y) = Fε(y).) Таким образом,

Pr(x = 1) = F ().

Пусть имеются N наблюдений, (xi, zi), i = 1, . . . , N , которые соответствуют этой модели, так что xi имеют в основе ненаблюдаемую величину x˜i = ziα + εi . Предполагаем, что ошибки εi имеют нулевое математическое ожидание, одинаково распределены и независимы. Рассмотрим, как получить оценки коэффициентов α методом максимального правдоподобия.

Обозначим через pi = pi(α) = F (ziα). Также пусть I0 = {i| xi = 0}, I1 = {i| xi = 1}. Функция правдоподобия, то есть вероятность получения наблюдений xi при данных zi , имеет вид:

L(α) =

pi(α) (1 − pi(α)).

i I1

i I0

628

Глава 21. Модели с качественными зависимыми переменными

Вместо самой функции правдоподобия удобно использовать логарифмическую функцию правдоподобия:

ln L(α) =

ln pi(α) + ln(1 − pi(α)),

i I1

i I0

которую можно записать как

 

N

 

ln L(α) =

xi ln pi(α) + (1 − xi) ln(1 − pi(α)) .

(21.1)

 

i=1

 

В результате максимизации этой функции по α получаем оценки максимального правдоподобия. Условия первого порядка максимума (уравнения правдоподобия), т.е.

 

 

 

ln L(α)

= 0,

 

 

 

 

 

 

 

 

 

 

 

∂α

имеют простой вид:

 

 

 

 

 

 

 

N

 

 

f (ziα)

 

 

 

 

 

 

i=1 (xi pi)

 

 

zi = 0,

pi(1 − pi)

где мы учли, что

 

 

 

 

 

 

 

∂pi(α)

=

dF (ziα)

= f (ziα)zi,

 

 

 

 

∂α

 

где f — производная функции F (·). Поскольку F (·) представляет собой функцию распределения, то f (·) — плотность распределения.

Можно использовать следующий метод, который дает те же оценки, что и метод максимального правдоподобия. Пусть a0 — некоторая приближенная оценка коэффициентов модели. Аппроксимируем функцию F (·) ее касательной в точке ziα (т.е. применим линеаризацию):

F (ziα) ≈ F (zia0) + f (zia0)zi α − a0 .

Подставим затем эту аппроксимацию в исходную модель:

xi − pi(a) ≈ f (zia)zi(α − a) + ξi,

или

xi − pi(a0) + f (zia0)zia0 ≈ f (zia0)ziα + ξi.

21.2 Оценивание модели с биномиальной зависимой переменной

629

При данном a0 это линейная регрессия. Как несложно проверить, дисперсия ошибки ξi равна pi(α)(1 − pi(α)), т.е. ошибки гетероскедастичны. К этой модели можно применить взвешенную регрессию. Следует разделить левую и правую части

на корень из оценки дисперсии ошибки ξi, т.е. на

pi(a0)(1 − pi(a0)):

 

 

 

xi − pi(a0) + f (zia0)zia0

 

f (zia0)zi

 

α +

 

ξi

 

.

 

 

 

 

 

 

 

 

 

 

 

 

pi(a0)(1 − pi(a0))

 

pi(a0)(1 − pi(a0))

 

pi(a0)(1 − pi(a0))

Оценивая эту вспомогательную регрессию, мы на основе оценок a0

получим

новые оценки, скажем a1 . Повторяя эту процедуру, получим последовательность оценок {ak }. Если процедура сойдется, т.е. ak → a при k → ∞, то a будут оценками максимального правдоподобия.

В качестве оценки ковариационной матрицы оценок a можно использовать

2 ln L(a)

1

 

.

∂α∂α

 

 

 

По диагонали этой матрицы стоят оценки дисперсий коэффициентов. На их основе обычным способом можно получить аналоги t-статистик для проверки гипотезы о равенстве отдельного коэффициента нулю. Такой тест будет разновидностью теста Вальда.

Для проверки набора ограничений удобно использовать статистику отношения правдоподобия LR = 2(ln L(a) ln L(aR)), где ln L(a) — логарифмическая функция правдоподобия из 21.1, a — оценка методом максимума правдоподобия без ограничений, aR — оценка при ограничениях.

Эту же статистику можно использовать для построения показателя качества модели, аналогичного F -статистике для линейной регрессии. Она позволяет проверить гипотезу о равенстве нулю коэффициентов при всех регрессорах, кроме константы. Соответствующая статистика отношения правдоподобия равна LR0 = 2(ln L(a) ln L0), где ln L0 — максимум логарифмической функции правдоподобия для модели с одной константой. Она распределена асимптотически как χ2 с n степенями свободы, где n — количество параметров в исходной модели, не включая константу. Величина ln L0 получается следующим образом. Пусть N — общее количество наблюдений, N0 — количество наблюдений, для которых xi = 0, N1 — количество наблюдений, для которых xi = 1. Тогда предсказанная вероятность появления xi = 1 в модели с одной константой будет равна для всех наблюдений N1/N . Отсюда

ln L0 = N0 ln N0 + N1 ln N1 − N ln N.

630

Глава 21. Модели с качественными зависимыми переменными

21.2.1. Регрессия с упорядоченной зависимой переменной

Регрессия с упорядоченной зависимой переменной имеет дело с альтернативами, которые можно расположить в определенном порядке. Например, это могут быть оценки, полученные на экзамене, или качество товара, которое может характеризоваться сортом от «высшего» до «третьего». Будем предполагать, что альтернативы пронумерованы от 0 до S. Переменная x принимает значение s, если выбрана альтернатива s. Предполагается, что в основе выбора лежит ненаблюдаемая величина x˜ = + ε. При этом x = 0 выбирается, если x˜ меньше нижнего (нулевого) порогового значения, x = 1, если x˜ попадает в промежуток от нулевого до первого порогового значения и т. д.; x = S выбирается, если x˜ превышает верхнее пороговое значение:

0, x˜ < γ0,

1, γ0 < x˜ < γ1,

x =

· · ·

S, x˜ > γS−1.

Если среди регрессоров z есть константа, то невозможно однозначно идентифицировать γ. В связи с этим следует использовать какую-либо нормировку. Можно, например, положить γ0 = 0. Это оставляет S −1 неизвестных пороговых параметров.

Пусть Fε(·) — функция распределения ошибки ε. Тогда вероятность того, что x = s, где s = 1, . . . , S − 1, равна

Pr(x = s) = Pr(γs−1 < zα + ε < γs) =

= Pr(γs−1 − zα < ε < γs − zα) = Fε(γs − zα) − Fε(γs−1 − zα).

Аналогично для s = 0 и s = S получаем

Pr(x = 0) = Pr(ε < γ0 − zα) = Fε(γ0 − zα),

Pr(x = S) = Pr(γS−1 − zα < ε) = 1 − Fε(γS−1 − zα).

Пусть (xi, zi), i = 1, . . . , N — имеющиеся наблюдения. По этим наблюдениям можно получить оценки максимального правдоподобия. Обозначим

pis(α, γ) = Pr(xi = s).

21.2 Оценивание модели с биномиальной зависимой переменной

631

Соответствующая логарифмическая функция правдоподобия равна

 

 

S

ln pis(α, γ), где Is = {i| xi = s}.

 

ln L(α, γ) =

s=0

 

 

i Is

 

 

 

 

Максимизируя эту функцию по α и γ, получим требуемые оценки.

На практике обычно используют одну из двух моделей: упорядоченный пробит, то есть модель с нормально распределенным отклонением ε, или упорядоченный логит, то есть модель, основанную на логистическом распределении.

21.2.2. Мультиномиальный логит

Предположим, что принимающий решение индивидуум стоит перед выбором из S альтернатив, s = 0, . . . , S − 1. Предполагается, что выбор делается на основе функции полезности u(s). В линейной модели u(s) = zsαs, где zs — матрица факторов, αs — неизвестные параметры. Обычно есть также факторы, не отраженные в zs из-за их ненаблюдаемости, которые тоже влияют на полезность. Такие характеристики представлены случайной ошибкой u(s) = zsαs + εs . При этом x выбирается равным s, если u(s) > u(t), s = t.

В самой простой модели принимается, что ошибки εs подчинены распределению экстремального значения и независимы между собой. Распределение экстремального значения1 в стандартной форме имеет функцию распределения F (y) = e−e−y . Распределение экстремального значения обладает следующими важными для рассматриваемой модели свойствами: максимум нескольких величин, имеющих распределение экстремального значения, также имеет распределение экстремального значения, а разность двух величин, имеющих распределение экстремального значения, имеет логистическое распределение. Используя эти свойства, можно вывести, что в данной модели

ezsαs

Pr(x = s) = S−1 eztαt .

t=0

Эта модель называется мультиномиальным логитом.

Относительно функций zsαs обычно делаются какие-либо упрощающие допущения, например, что факторы для всех альтернатив одни и те же, то есть

1Это «распределение экстремального значения первого рода» (согласно теореме Гнеденко есть еще два распределения экстремального значения) или, как его еще называют, распределение Гумбеля. Данное распределение также изредка называют распределением Вейбулла. Кроме того, именем Вейбулла называют и другие распределения (в частности, «распределение экстремального значения третьего рода»), поэтому может возникнуть путаница.

632

Глава 21. Модели с качественными зависимыми переменными

u(s) = s + εs , или что функция имеет один и тот же вид, коэффициенты в зависимости от s не меняются, а меняются только факторы, определяющие выбор, то есть u(s) = zsα + εs . В первом случае z можно интерпретировать как характеристики индивидуума, принимающего решение. Это собственно мультиномиальный логит. Во втором случае zs можно интерпретировать как характеристики s-й альтернативы. Этот второй вариант называют условным логитом.

Можно предложить модель, которая включает оба указанных варианта. Обозначим через w характеристики индивидуума, а через zs характеристики s-ой альтернативы (в том числе те, которые специфичны для конкретных индивидуумов). Например, при изучении выбора покупателями супермаркета альтернативами являются имеющиеся супермаркеты, w мог бы включать информацию о доходах и т.п., а в zs следует включить информацию о супермаркетах (уровень цен, широта ассортимента и т.п.) и характеристики пары покупатель—супермаркет, такие как расстояние до супермаркета от места жительства потребителя.

В такой модели u(s) = zsα + s + εs и вероятности вычисляются по формуле

ezs α+s

Pr(x = s) = .

S−1 eztα+t t=0

Заметим, что в этой модели есть неоднозначность. В частности, если прибавить к коэффициентам δs один и тот же вектор ∆ — это все равно, что умножить числитель и знаменатель на ew ∆. Таким образом, для идентификации модели требуется какая-либо нормировка векторов δs. Можно, например, положить δ0 = 0.

Для оценивания модели используется метод максимального правдоподобия. Пусть (xi, zi0, . . . , zi,S−1, wi), i = 1, . . . , N — имеющиеся наблюдения. Обозначим

pis(α, δ) = Pr(xi = s) =

ezisα+wi δs

 

.

S−1 ezitα+wiδt

 

 

 

t=0

Тогда логарифмическая функция правдоподобия имеет вид

ln L(α, δ) =

S−1

ln pis(α, δ), где Is = {i| xi = s}.

s=0

 

i Is

 

 

 

 

 

 

На основе xi можно ввести набор фиктивных переменных dis , таких что

1, xi = s,

dis =

0, xi = s.