Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ЭКОНОМЕТРИКА и математическая экономика / Эконометрика. Учебник продвинутый (2005)

.pdf
Скачиваний:
510
Добавлен:
20.04.2015
Размер:
4.02 Mб
Скачать

18.2. Тест на существенность ограничения

573

Докажем, что распределение статистики будет именно таким, если предположить,

что ошибки имеют нормальное распределение:

 

ε N (0, σ2I).

 

Мы видели, что e1 = e0 +δ . Выразим δ через ε с учетом нулевой гипотезы = r:

δ = Z (Z Z)1 R A1 (Ra r) = Z (Z Z)1 R A1R (Z Z)1 Z ε =

 

0

= Z (Z Z)1 R R (Z Z)1 R 1 R (Z Z)1 Z ε.

Для вектора остатков e0 имеем

e0 = I − Z (Z Z)1 Z ε.

Совместное распределение векторов δ и e0 является нормальным (так как они линейно выражаются через ошибки ε). Эти вектора некоррелированы:

E (δe0) =

 

 

 

 

 

 

 

 

 

 

 

 

= Z (Z Z)1 R R (Z Z)1 R 1 R (Z Z)1 Z E (εε ) I

Z (Z Z)1 Z =

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= σ2Z (Z Z)1 R R (Z Z)1 R 1 R (Z Z)1 Z I

Z (Z Z)1 Z = 0.

 

 

 

 

 

 

 

 

 

 

 

 

 

Последнее равенство здесь следует из того, что

 

 

 

 

 

 

 

Z I

Z (Z Z)1 Z

= Z

Z Z (Z Z)1 Z

= Z

Z = 0.

 

 

 

 

 

 

 

 

 

 

 

По

свойствам многомерного

нормального распределения

это

означает, что

δ

и e0 независимы (см. Приложение

A.3.2). Кроме

 

того δ

имеет форму

Q (Q Q)1 Q ε , где

Q = Z (Z Z)1 R .

 

 

 

 

 

 

 

Для вектора же e0

матрица преобразования равна I − Z (Z Z)1 Z . Обе мат-

рицы преобразования являются симметричными и идемпотентными. Ранг матрицы преобразования (другими словами, количество степеней свободы) равен k для δ и N − n − 1 для e0 . С учетом того, что ε N (0, σ2I), это означает:

1

δ δ =

1

(e1e1 − e0e0) χk2 ,

σ2

σ2

1

e0e0

χN2 −n−1,

σ2

причем эти две величины независимы. Частное этих величин, деленных на количество степеней свободы, распределено как Fk,N −n−1 , что и доказывает утверждение.

Проверяемая нулевая гипотеза имеет вид:

H0 : = r,

574

 

 

Глава 18. Классические критерии проверки гипотез

то есть

ограничения

выполнены. Критерий заключается в следующем: если

F c > F

 

, то нулевая гипотеза отвергается, если F c < F

k, N −n−1, 1−θ

,

k, N −n−1, 1−θ

 

 

 

 

 

 

 

 

 

то она принимается.

 

 

 

 

 

 

 

 

 

Распишем статистику подробнее:

 

 

 

 

 

 

 

F c =

(Ra0

r) R (Z Z)1 R

1 (Ra0

r) /k

(18.4)

 

(X − Za0) (X − Za0) / (N − n −

1)

 

 

 

 

 

 

 

Покажем, что F -критерий базового курса — это частный случай данного критерия. С помощью F -критерия для регрессии в целом проверяется нулевая гипотеза о том, что все коэффициенты α, кроме свободного члена (последнего, (n + 1)-го коэффициента), равны нулю:

H0 : α1 = 0, . . . , αn = 0.

Запишем эти ограничения на коэффициенты в матричном виде (= r). Соответствующие матрицы будут равны

R = [In; 0n] и r = 0n.

Обозначим матрицу Z без последнего столбца (константы) через Z. В этих

обозначениях Z = [Z; 1N ]. Тогда

 

 

 

 

 

 

 

 

 

 

M + Z¯ Z¯

Z¯

 

 

 

 

Z Z = N

 

 

 

 

 

 

 

 

¯

 

 

 

1

 

 

 

 

 

 

Z

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

Z Z 1 =

1

M 1

 

 

 

−M 1Z¯

,

 

 

 

 

 

 

 

 

 

 

 

N −ZM¯ 1

 

1 + Z¯M 1Z¯

 

где Z¯ =

1

1

Z — вектор средних, а M =

1

Zˆ Zˆ — ковариационная матрица

 

 

N

 

N N

 

 

 

факторов Z . Умножение (Z Z)1 слева и справа на R выделяет из этой матрицы

 

 

 

 

 

 

 

 

 

 

левый верхний блок:

 

 

 

 

 

 

 

 

R Z Z 1 R =

1

M 1.

 

 

 

 

 

 

 

 

 

 

 

 

N

 

 

Подставим это выражение в (18.4), обозначая через a= Ra0 вектор из первых n компонент оценок a0 (все коэффициенты за исключением константы):

F c =

(a M a) /n

.

 

(X − Za0) (X − Za0) / (N (N − n − 1))

 

18.2. Тест на существенность ограничения

 

 

 

 

575

— объясненная дисперсия в регрессии, а (X

Za0) (X

Za0)/N =

Здесь a M a

 

 

 

= s2 — остаточная дисперсия (смещенная оценка). Видим, что

 

 

e

 

 

 

 

 

 

 

 

 

 

F c =

R2(N − n − 1)

,

 

 

 

 

 

 

(1 − R2)n

 

 

 

 

 

 

 

 

 

 

 

 

а это стандартная форма F -статистики.

Более простой способ получения этого результата состоит в том, чтобы возвратиться к исходной задаче условной минимизации. Ограничение, что все коэффициенты, кроме свободного члена, равны нулю, можно подставить непосредственно в целевую функцию (сумму квадратов остатков). Очевидно, что решением задачи

будет an+1 =

1

X 1N = x¯ и aj = 0, j = n + 1, т.е.

 

 

N

 

 

 

 

a1 =

0n

.

 

 

 

x¯

Отсюда получаем, что остатки равны центрированным значениям зависимой пере-

ˆ

 

 

 

 

 

 

менной: e1 = X . Следовательно, из (18.3) получим

F c =

(Xˆ Xˆ − e0e0)/n

.

 

e e0/(N

n

1)

 

 

0

 

 

 

В числителе стоит объясненная сумма квадратов, а в знаменателе — сумма квадратов остатков.

Покажем, что t-критерий также является частным случаем данного критерия. Нулевая гипотеза заключается в том, что j-й параметр регрессии равен нулю. Таким образом, в этом случае k = 1,

R = (0, . . . , 0, 1, 0, . . . , 0) и r = 0.

j

При этом R(Z Z)1R = mjj1 , где mjj1 j-й диагональный элемент мат-

рицы M 1 , а M =

1

Z Z — матрица вторых начальных моментов факторов Z.

 

 

N

В числителе F -статистики стоит несмещенная оценка остаточной дисперсии

sˆ2e = (X − Za0) (X − Za0) / (N − n − 1) .

Кроме того, Ra0 − r = a0j . Окончательно получаем

 

a2

 

F c =

 

 

0j

F1, N −n−1.

 

1

2

m

 

sˆ /N

 

 

jj

e

 

576

Глава 18. Классические критерии проверки гипотез

Здесь

mjj1sˆe2/N = sa2j — оценка дисперсии коэффициента

a0j . Видим, что

F -статистика имеет вид:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a02j

 

 

2

 

 

 

 

 

 

 

 

 

 

F c =

 

=

a0j

 

= t2,

 

 

 

 

 

 

 

s2

sa

 

 

 

 

 

 

 

 

 

 

 

 

j

 

 

 

 

 

 

 

 

aj

 

j

 

 

 

 

 

 

 

 

 

 

т.е. это

квадрат t-статистики для

коэффициента

 

a0j . Для

квантилей F -

распределения выполнено F

 

= t2

 

n

 

1, 1

 

θ

. Нулевая гипотеза H

0

:

 

1, N −n−1, 1−θ

 

N

 

 

 

αj = 0 отвергается, если F c > F1, N −n−1, 1−θ , т.е. если |tj | = F c > tN −n−1, 1−θ . Видим, что два критерия полностью эквивалентны.

Рассмотрим регрессию, в которой факторы разбиты на два блока:

X= Z1α1 + Z2α2 + ε.

Вкачестве промежуточного случая между F -критерием для регрессии в целом

иt-критерием для одного фактора рассмотрим F -критерий для группы факторов. Требуется получить ответ на вопрос о том, нужна ли в регрессии группа факторов Z2 . Для проверки гипотезы H0 : α2 = 0 мы можем воспользоваться полученными выше результатами. В этом случае k = n2 , где n2 — количество факторов во второй группе, а матрицы, задающие ограничение, равны

0 · · ·

0 1 0 · · ·

0

 

 

 

 

 

 

 

 

 

 

.

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

.

 

· · ·

 

 

 

 

 

 

 

 

 

 

 

R = .

. 0 1

0

= [0

 

; I

n2

] и r = 0

.

 

 

 

 

. . .

.

 

.

 

 

n2×n1

 

 

 

n2

 

 

 

 

 

. .

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

. .

 

 

. .

 

 

 

 

 

 

 

 

 

 

 

0 · · ·

0 0 0 · · ·

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n1

 

 

 

n2

 

 

 

 

 

 

 

 

 

 

 

 

 

Очевидно, что оценки с этими ограничениями будут равны

 

 

 

 

 

 

 

 

a =

(Z 1Z1)1 Z 1X

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0n2

 

 

 

 

 

 

 

а остатки можно найти по формуле e1 =

IN − Z1 (Z 1Z1)1 Z 1

X .

 

F -статистику можно рассчитать по общей формуле (18.3):

 

 

 

 

 

F c = (e1e1 e0e0)/n2

F

 

 

 

.

 

 

 

 

 

 

 

 

e e0/(N

n

1)

 

n2

,N −n−1

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

18.2. Тест на существенность ограничения

577

Мы неявно рассматривали здесь тест на исключение факторов. Можно рассматривать его с другой точки зрения — как тест на включение факторов, при этом формулы не поменяются. То есть мы, оценив регрессию X = Z1α1 + ε, можем проверить, следует ли включать в нее дополнительные факторы Z2.

Тест на включение факторов особенно полезен для проверки того, не нарушаются ли предположения модели регрессии. Это так называемые диагностические тесты. Все они строятся по одному и тому же принципу: если модель X = Z1α1 + ε специфицирована корректно, то любые дополнительные факторы Z2 скорее всего будут незначимы в тесте на их включение (т.е. с большой вероятностью будет принята нулевая гипотеза α2 = 0). Факторы Z2 конструируются таким образом, чтобы тест имел бо´ льшую мощность против определенного класса нарушений предположений модели регрессии. Из сказанного следует, что во всех диагностических тестах нулевой гипотезой является то, что базовая модель корректно специфицирована. Если нулевая гипотеза будет отвергнута, то естественно искать другую модель, которая бы лучше описывала имеющиеся данные. Следует понимать, что регрессия X = Z1α1 + Z2α2 + ε в этом случае будет носить обычно вспомогательный характер, то есть оценки коэффициентов в ней, вообще говоря, не призваны нести смысловой нагрузки. Она нужна только для проверки базовой модели

X= Z1α1 + ε. (Хотя здесь есть, конечно, и исключения.)

18.2.1.Тест Годфрея (на автокорреляцию ошибок)

Оценим регрессию X = Z1α1 + ε. Для проверки отсутствия автокорреляции p-го порядка попытаемся ввести такой набор факторов:

 

0

0

· · ·

0

 

 

e1

0

· · ·

0

 

 

e2

e1

· · ·

0

 

Z2 =

.

. .

.

 

.

 

.

.

 

.

.

.

.

.

 

 

.

 

.

.

 

.

 

 

 

 

.

.

 

.

 

e1

 

 

.

.

 

.

 

 

 

.

.

 

.

 

.

 

 

.

.

 

.

 

.

 

 

.

.

 

.

 

.

 

 

eN −1 · · ·

· · · eN −p

 

Столбцы матрицы Z2 состоят из лагов остатков, дополненных нулями. Если нулевая гипотеза (α2 = 0) отвергается, то делается вывод о наличии автокорреляции. При p = 1 тест Годфрея представляет собой близкий аналог теста

578

Глава 18. Классические критерии проверки гипотез

Дарбина—Уотсона, однако при p > 1 помогает обнаруживать и автокорреляцию более высоких порядков, в чем и состоит его преимущество.

18.2.2.Тест RESET Рамсея (Ramsey RESET test) на функциональную форму уравнения

Рассмотрим модель X = Z1α1 + ε, которую можно записать в виде

X= X0 + ε, где X0 = Z1α1 . Можно рассмотреть возможность наличия между

Xи X0 более сложной нелинейной зависимости, например, квадратичной. Для проверки линейности модели против подобной альтернативы служит тест Рамсея.

Оценим регрессию X = Z1α1 + ε. Попытаемся ввести фактор

 

(x1c )2

 

Z2 =

.

 

.

,

.

 

(xNc )2

 

где Xc = Z1a1 — расчетные значения из проверяемой регрессии. Если α2 = 0, то зависимость линейная, если α2 = 0, то зависимость квадратичная.

Можно тем же способом проводить тест на 3-ю, 4-ю степени и т.д. Матрица

добавляемых факторов имеет следующую общую форму:

 

 

(x1c )2

(x1c )3 · · ·

(xNc )m

 

Z2 =

.

.

.

 

.

.

.

.

.

.

.

 

(xNc )2

(xNc )3 · · ·

(xNc )m

 

18.2.3. Тест Чоу (Chow-test) на постоянство модели

Часто возникает сомнение в том, что для всех наблюдений 1, . . . , N модель неизменна, в частности, что параметры неизменны.

Пусть все наблюдения в регрессии разбиты на две группы. В первой из них — N1 наблюдений, а во второй — N2 наблюдений, так что N1 + N2 = N . Без ограничения общности можно считать, что сначала идут наблюдения из первой группы, а потом из второй. Базовую регрессию X = + ε можно представить в следующем блочном виде:

X1

=

Z1

α +

ε1 .

X2

 

Z2

 

ε2

18.2. Тест на существенность ограничения

579

Требуется проверить, действительно ли наблюдения в обеих группах подчиняются одной и той же модели x = + ε.

1-я форма теста Чоу

В качестве альтернативы базовой модели рассмотрим регрессию

X1

=

Z1

0

α1

+

ε1

.

 

 

 

 

 

X2

 

0

Z2

α2

 

ε2

 

Фактически, это две разные регрессии:

X1 = Z1α1 + ε1 и X2 = Z2α2 + ε2,

но предполагается, что дисперсия в них одинакова.

Пусть e0 — вектор остатков в регрессии на всей выборке, e1 — вектор остатков в регрессии с наблюдениями 1, . . . , N1, e2 — вектор остатков в регрессии с N1 + 1, . . . , N наблюдениями. Требуется проверить нулевую гипотезу о равенстве коэффициентов по двум частям выборки:

H0 : α1 = α2.

Для того чтобы применить здесь тест добавления переменных, обозначим α2 − α1 = δ и подставим α2 = α1 + δ в рассматриваемую модель:

X2 = Z2α1 + Z2δ + ε2,

Таким образом, можно рассматривать следующую регрессию (для упрощения обозначений пишем α вместо α1 ):

X1

Z1

0

α

+

ε1

.

(18.5)

 

=

 

 

 

X2

Z2

Z2

δ

 

ε2

 

 

Мы хотим проверить гипотезу H0 : δ = 0.

Если нулевая гипотеза принимается, то это означает, что α1 = α2 , т.е. коэффициенты постоянны.

Заметим, что в регрессии (18.5) с ограничениями остатки окажутся равными e0 ,

а в регрессии (18.5) без ограничений —

e1

. Суммы квадратов остатков равны

 

e2

 

580 Глава 18. Классические критерии проверки гипотез

e0e0 и e1e1 + e2e2 , соответственно. В регрессии с ограничениями оценивается n + 1 параметров, без ограничений — 2 (n + 1). Всего проверяется k = n + 1 ограничений. Используя общую формулу (18.2), получим

F c =

(e0e0 − e1e1 − e2e2) / (n + 1)

 

F

n+1, N −2(n+1)

.

 

(e e1

+ e e2) / (N

2 (n + 1))

 

 

1

2

 

 

 

 

 

Для того чтобы применить этот тест, нужно оценить модель по двум частям выборки. Это можно сделать, когда количество наблюдений превышает количество параметров, т.е. N1 n + 1 и N2 n + 1. Кроме того, если Nj = n + 1, то остатки ej = 0 (j = 1, 2). Таким образом, для применимости теста требуется, чтобы хотя бы в одной части количество наблюдений превышало количество параметров.

2-я форма теста Чоу

То, что модель в двух частях одна и та же, можно проверить и по-другому. Пусть сначала рассчитывается регрессия по N1 < N наблюдениям, а затем по всем N наблюдениям. Если полученные результаты существенно отличаются, то это должно означать, что во второй части модель каким-то образом поменялась.

Реализуем эту идею с помощью вспомогательной регрессии, к которой можно применить тест добавления переменных:

X1

=

Z1

0N1×N2

α

+

ε1 .

(18.6)

X2

 

Z2

IN2

δ

 

ε2

 

Эта регрессия с ограничением δ = 0 совпадает с регрессией по всем N наблюдениям по первоначальной модели, и остатки равны e0 .

Если же оценить (18.6, 18.5) без ограничений, то, как можно показать, оценки α совпадут с оценками по N1 < N наблюдениям, т.е. по регрессии X1 = Z1α1 + ε1 .

Остатки будут иметь вид

e1

.1

 

 

0n2

 

1Это связано с тем, что добавочные переменные являются фиктивными переменными, каждая из которых всюду равна нулю, за исключением одного из наблюдений второй части выборки. Такие фиктивные переменные приводят к «обнулению» остатков. Следовательно, задача минимизации суммы квадратов остатков по N наблюдениям здесь сводится к задаче минимизации суммы квадратов остатков по первым N1 наблюдениям.

18.2. Тест на существенность ограничения

 

581

Действительно, запишем модель в матричном виде. Пусть

 

Z =

Z1

0

X1

.

 

 

,

X =

 

 

Z2

I

X2

 

 

Тогда оценки коэффициентов модели

a

удовлетворяют нормальным уравнени-

 

ям:

 

d

 

 

 

 

 

 

 

 

 

Z Z

a

= Z X,

 

 

 

 

 

 

 

 

d

 

 

 

или

 

 

 

 

 

Z1Z1 + Z2Z2

Z2

a

Z1X1

+ Z2X2

.

 

 

 

=

 

Z2

I

d

 

X2

 

Получаем следующую систему уравнений для оценок коэффициентов:

Z1Z1a + Z2Z2a + Z2d = Z1X1

+ Z2X2

,

 

 

(18.7)

Z2a + d = X2.

 

 

Умножив второе уравнение системы (18.7) слева на Z2 , получим

Z2Z2a + Z2d = Z2X2.

После вычитания из первого уравнения системы (18.7) получим

Z1Z1a = Z1X1.

Таким образом, оценки коэффициентов a являются оценками МНК по первой части выборки.

Далее, остатки второй части равны

e2 = X2 − Z2a − d = 0.

Последнее равенство следует из второго уравнения системы (18.7).

582

Глава 18. Классические критерии проверки гипотез

Суммы квадратов остатков в двух моделях равны e0e0 и e1e1 , соответственно. Количество ограничений k = N2 . Таким образом, получаем следующую статистику:

F c =

(e0e0 − e1e1) /N2

 

F

N2, N1−n−1

.

 

e e1/ (N1

n

1)

 

 

 

1

 

 

 

 

 

 

Статистика имеет указанное распределение, если выполнена нулевая гипотеза

H0 : δ = 0.

Если нулевая гипотеза принимается, это означает, что модель не менялась.

Заметим, что в случае, когда наблюдений в одной из частей выборки не хватает, чтобы оценить параметры, либо их столько же, сколько параметров, например, N2 n + 1, второй тест Чоу можно рассматривать как распространение на этот вырожденный случай первого теста Чоу.

Второй тест Чоу можно интерпретировать также как тест на точность прогноза. Поскольку Z2a — прогнозы, полученные для второй части выборки на основе оценок первой части (a), то из второго уравнения системы (18.7) следует, что оценки d равны ошибкам такого прогноза:

d = X2 − Z2a.

Таким образом, проверяя гипотезу δ = 0, мы проверяем, насколько точны прогнозы. Если модель по второй части выборки отличается от модели по первой части, то ошибки прогноза будут большими и мы отклоним нулевую гипотезу.

18.3.Метод максимального правдоподобия в эконометрии

18.3.1. Оценки максимального правдоподобия

Метод максимального правдоподобия — это один из классических методов оценивания, получивший широкое распространение в эконометрии благодаря своей универсальности и концептуальной простоте.

Для получения оценок максимального правдоподобия следует записать функцию правдоподобия, а затем максимизировать ее по неизвестным параметрам модели. Предположим, что изучаемая переменная x имеет распределение с плотностью fx(x), причем эта плотность зависит от вектора неизвестных параметров θ, что можно записать как fx(x|θ). Тогда для N независимых наблюдений за переменной x, т.е. x1, . . . , xN , функция правдоподобия, по определению, есть