книги / Эконометрика. Начальный курс
.pdf10.5. Оценка максимального правдоподобия в линейной модели |
251 |
|
или ее эквивалентную форму записи: |
|
|
у ~ Щ Х 0 , с 21п). |
|
(10.17) |
Плотность распределения случайного вектора у |
равна |
|
Л(у) = (2тгст2) - п/2ехр| - 1 (y. ~ X/3^ y ~ Х/3) | . |
(10.18) |
|
Отсюда получаем логарифмическую функцию правдоподобия |
||
ш м < , ' ) — 5 ь а г - = ш ,* 4 ( у - |
- х / э ) , |
(Ю.19) |
которая является функцией параметров /3 и <т2. Частные произ водные первого порядка этой функции равны
d k lL |
1 , |
чгамчг |
|
|
||
д& |
- о ^ у |
х ® |
х |
' |
(10.20) |
|
ain ь |
п |
+ (у - Х£)'(У - Х/3) |
||||
|
||||||
да2 |
2<72 |
"г |
|
2СГ4 |
|
|
Приравнивая первые производные |
(10.20) нулю, находим оценки |
|||||
максимального правдоподобия |
|
|
|
|||
р = ( Х ’Х ) - 1Х ’у, |
|
|
(10.21) |
где е = у — Х(3 обозначает вектор^остатков. Заметим, что оцен ка максимального правдоподобия (3 совпадает с оценкой метода наименьших квадратов (3.4) для /3, в то время как оценка макси мального правдоподобия а2 неравна оценке (3.19) s2 = е'е/(п —к) для а2, обычно используемой в методе наименьших квадратов.
Частные производные второго порядка от (10.19) равны
02lnL |
Х ' Х |
|
a2in i |
(у-хрух |
д(3д(? |
а2 |
’ |
до2д& |
( 10.22) |
а4 |
||||
и |
д2ы |
= п |
(у - |
Х 0)'(у - Х/3) |
|
||||
|
(да2)2 |
2а4 |
|
(10.23) |
|
|
а6 |
252 |
Гл. 10 Метод максимального правдоподобия в моделях регрессии |
Взяв математическое ожидание (с обратным знаком) от производ ных второго порядка, получаем
- Е |
/0 2 ln L \ Х ' Х |
(10.24) |
|
о2 |
’ |
поскольку Е ((у — Х/3)'(у —Х/3)) = па2. Кроме того, математиче ское ожидание от смешанной производной равно нулю в силу того, что Е (у - Х(3) = 0. Поэтому информационная матрица равна
Г п ( Р У ) |
(1/а2) Х ’Х |
0 ] |
|
(10.25) |
|
О |
п/{2а*)\ |
• |
|||
|
|
Таким образом, асимптотическая информационная матрица име ет вид
^ ■ о 2) = „1“ и / » ) * . - [(1 /о )Q 1/(1< )] ■ |
О"-26» |
где предполагается, что существует предельная, положительно определенная матрица Q — limn—<x,(\ln)X'X. Легко вычисля ется обратная матрица
F ~ l = |
(10.27) |
и из свойств оценок максимального правдоподобия следует, что {a2/n)Q~l является оценкой асимптотической матрицы ковариа ций вектора оценок /3. На практике асимптотическая матрица ко вариаций аппроксимируется а2( Х 'Х ) ~ 1. В_самом деле, мы знаем, что тонная матрица ковариаций вектора /3 равна а2( Х ’Х ) ~ 1.
Асимптотическую дисперсию оценки а2 можно оценить вели чиной 2аА/п. Так как внедиагональные блоки матрицы Т равны нулю, оценки (3 и а2 асимптотически независимы. Такая (асим птотическая) независимость оценок средних значений и диспер сии является общей чертой теории регрессии и имеет важные по следствия для оценивания и тестирования.
10.6. Проверка гипотез в линейной модели, I |
253 |
10.6.Проверка гипотез в линейной модели, I
Рассмотрим теперь обобщенную линейную модель у = Х р + и (см. (5.3)) с матрицей ковариаций ошибок У (и) = Si, где Si — известная положительно определенная симметричная матрица. Мы ослабим это требование в следующем разделе. Пусть мы хо тим проверить гипотезу о том, что выполнена система q (q < к) независимых линейных ограничений R(3 = г. Здесь R — извест ная q х к матрица ранга q, а г — известный q х 1 вектор. В данном разделе мы расмотрим три различных теста для проверки этой гипотезы, основанные на разных подходах.
Выпишем логарифмическую функцию правдоподобия |
|
||
InЦ р ) = const + ^ ln lf T 1! - |
^(у - X p ) ' t T l {y - Х р ) , |
(10.28) |
|
ее частные производные первого порядка |
|
|
|
= Х 'П ~ 1(у - |
Х р ) |
(10.29) |
|
и информационную матрицу |
|
|
|
- - Е |
= |
Х ’П - ' Х . |
(10.30) |
ML-оценка для р в регрессии без ограничения задается уравне нием d \n L (p )/d p = 0, откуда получается GLS-оценка (см. (5.4))
3 = ( Х 'П ^ Х ^ Х 'П - У |
(10.31) |
Вектор остатков равен и = у — Х р , а соответствующее мак симальное значение логарифмической функции правдоподобия равно
In L(P) = const + -1п|П -1| — |
(10.32) |
ML-оценка для р в регрессии с ограничением (R p = г) по лучается максимизацией функции In L(P) при условии R p = г.
254 Гл 10. Метод максимального правдоподобия в моделях регрессии
Чтобы найти эту оценку, запишем функцию Лагранжа
ф{Р) = In L(/3) - l'{Rp - г), |
(10.33) |
где через I = ,lq)' обозначен вектор q множителей Лагран жа. Условия экстремума имеют вид
дф(р)/др = 0 |
и |
R p = r |
(10.34) |
или |
|
|
|
X ' S r i { y - X p ) - R ! l = 0 |
и |
R p = г. |
(10.35) |
Обозначим через /3 и I решение системы (10.35). Получаем |
|||
3 = 3 ~ (Х 'П ^ Х )" 1# / |
(10.36) |
||
и, следовательно, |
|
|
|
г = Rj3 = R P - ( R { X ' n - lX ) - lR ! )l |
(10.37) |
||
Выразив Т из (10.37): |
|
|
|
Т = { R i X ' n - ' X y ' R ' y ' i R p - г), |
(10.38) |
и, подставив это выражение в (10.36), найдем оценку Р в регрессии с ограничением*
3 = 3 - (Х /П -1Х )" 1Д ,(Я (Х ,П -1Х ) - 1Я /) " 1(Я З - г). (10.39)
Обозначим через й = у - Х р вектор остатков в регрессии с огра ничением. Тогда максимальное значение логарифмической функ ции правдоподобия InL{fl) равно
\nL(p) = const + ^ In |
(10.40) |
« |
£i |
Теперь мы готовы сформулировать три теста, о которых шла речь в начале раздела. Во всех этих тестах нулевой гипотезой Но является наличие ограничения R P = г.
10.6. Проверка гипотез в линейной модели, I |
255 |
Тест Вальда (W) ( Wald test). Тест Вальда основан на идее, что при выполнении нулевой гипотезы вектор Я/3 должен быть близок к г. Из (10.31) получаем
я З - r ~ Щ П 0 - г , Щ Х ' П - ' Х ) - 1Я'). |
(10.41) |
|
Следовательно, если имеет место нулевая гипотеза, то |
|
|
R/3 - |
г ~ N{О, Я (Х 'П -1Х ) - 1Я'). |
(10.42) |
Используя свойство |
нормального распределения (приложе |
|
ние МС, п. 4, N9), получаем |
|
|
W s (Я З - Г)/(Я(Х,П -1Х )-1Я')_1(ЯЗ - г) ~ x 2(g). |
(Ю.43) |
Отметим, что тест Вальда использует только оценки в модели без ограничения на параметры.
Тест м нож ит елей Л агранж а (LM) (Lagrange multiplier test).
Тест множителей Лагранжа основан на идее, что при выполнении нулевой гипотезы все множители Лагранжа должны быть равны нулю, поэтому и вектор I должен быть близок к нулю. Из (10.38) и (10.41) получаем, что в том случае, когда выполняется нулевая гипотеза,
l ~ N ( O t ( R { X ,n - lX ) - lR ! y l) |
(10.44) |
и, следовательно,
LM a l ' R ( X ' n - lX ) - lB f i ~ х2(д). |
(10.45) |
Поскольку в силу (10.35) X ' f l 1й = Я'Т, получаем эквивалентное представление LM статистики
LM = и П - 1Х { Х ' П - 1Х ) - 1Х 'П - 'й .
В отличие от теста Вальда тест множителей Лагранжа использует только оценки в модели с ограничением на параметры.
Тест от нош ения правдоподобия (LR) (Likelihood ratio test).
Тест отношения правдоподобия использует как регрессию с огра ничением, так и регрессию без ограничения. Он основан на том,
256 Гл 10. Метод максимального правдоподобия в моделях регрессии
что если ограничение справедливо, то отношение максимальных значений функций правдоподобия для регрессии с ограничением и без ограничения должно быть близко к 1. Таким образом, в каче стве критической статистики теста берется разница максимумов логарифмических функций правдоподобия (10.32) и (10.40):
LR = —2(1пЬ ф ) - In L 0 ) ) = u f ] _Iu - u f i - 'u . |
(10.46) |
Можно показать, что при выполнении нулевой гипотезы (10.46) имеет х2{$) распределение. Действительно, поскольку Х р = Х р — Х((3 —/3), то « = « + Х(Р —Р). Домножив на О-1/2, получаем
= П - ^ й + ( Г 1/2Х ф - р). |
(10.47) |
Взяв скалярный квадрат обеих частей (10.47) и учитывая, что Х 'П -1и = 0 (см. (10.31)), имеем
й'п~1й = й'п-'й + ф - р у х 'а ~ хх ф - р). |
(ю.48) |
Из (10.36) вытекает, что
Р - р = {X'Sl-lX ) - xR!l, |
(10.49) |
поэтому из (10.45) следует:
LR = Й'П -'Й - и'П -1и = l R ( X ' S l - lX ) - lR ! i ~ *2(д). (Ю.50)
Мы видим, что все три критические статистики имеют одно и то же х2(ч) распределение. Более того, из (10.50)) следует LR = LM. Из равенства (10.38) вытекает, что W = LM. Следовательно,
LM = LR = W. |
(10.51) |
Однако, это справедливо только в простейшем случае, когда матрица ковариаций ошибок Л полностью известна. Ситуация усложняется в том (более реальном) случае, когда матрица О неизвестна.
10.7. Проверка гипотез в линейной модели, II |
257 |
10.7.Проверка гипотез в линейной модели, II
Предположим теперь, что матрица SI неизвестна, однако извест на ее структура, т. е. ft = Q(0) является функцией неизвестного р х 1 вектора параметров в, который необходимо оценить. (Эту ситуацию мы рассматривали ранее в главе 5, п. 5.3.) Три крити ческие статистики в этом случае принимают вид:
W = |
(Я З - r)’(R (X ’n ~ 1X ) - l R !)-l {Rj3 - г), |
(10.52) |
LM = £ ^ Г 1Х (Х ,Г Г 1.Х )-1Х /СГ15, |
(10.53) |
|
LR = |
-2(1п Ь ф , в) - In Ь ф , в)) , |
(10.54) |
где П = Г2(0) и ft = П(6). Теперь мы покажем, что верно знаме нитое неравенство
LM < LR ^ W. |
(10.55) |
Доказательство основано на довольно тонком замечании, принад лежащем Бреушу (Breusch, 1979). Отметим сначала, что /3 яв ляется точкой максимума функции InL(/3, в], а /3 является точ кой условного максимума функции In L(/3,0) при ограничении R/3 = г. Введем теперь два новых_ вектора: /Зи, являющийся точкой максимума функции In L((3,6), и /Згикоторый является точкой условного максимума функции In L(/3,0) при ограничении
R/3 = г
Равенства, выведенные в предыдущем разделе (для случая, когда в известно), позволяют получить следующие выражения для статистик W и LM, представив их в виде, аналогичном ста
тистике LR: |
|
|
W = |
—2 (Ы ,(3 г ,в ) - 1 п 1 (3 ,в )), |
(10.56) |
LM = |
- 2 (in L 0 , в) - In Ь ф и, в)) . |
(10.57) |
258 |
Гл. 10. Метод максимального правдоподобия в моделях регрессии |
||||
|
Кроме того, критическая статистика теста отношения правдо- |
||||
подобий равна |
|
|
|
|
|
|
LR = |
- 2 (in Ь ф ,в) - In L(3, £)) . |
(10.58) |
||
Отсюда мы получаем, что |
|
|
|
||
|
LR - LM = 2 |
(in L(3, в) - |
In Ь ф и,5)) |
> 0, |
(10.59) |
|
W - LR = 2 |
(in L(jS, 0) - |
In L(3r, 0)) |
> 0. |
(10.60) |
Следовательно, LM < LR < W. |
|
|
|
||
|
Это неравенство справедливо при нулевой гипотезе. Для ко |
нечных выборок уровень значимости тестов, если применять од но и то же критическое значение, будет различен. Неравенство само по себе не дает никакой информации о сравнительной мощ ности W, LR и LM тестов. Подробное обсуждение этого неравен ства и его следствий содержится в работах (Evans and Savin, 1982)
и(Godfrey, 1988).
10.8.Нелинейные ограничения
Предположим, что нулевая гипотеза состоит из системы q нели нейных ограничений на вектор коэффициентов /3. Пусть дана ли нейная модель у — Х/3 + и при стандартном условии на распре деление вектора ошибок u ~ N (0,12(0)). Запишем ограничения в виде
д{р) = 0. |
(10.61) |
Таким образом, мы собираемся тестировать нулевую гипотезу HQ: д((3) = 0 против альтернативной гипотезы Hi: д{(3) ф 0.
Предположим, что все q компонент вектора д(0) являются непрерывными дважды дифференцируемыми функциями. Обо значим через G(/3) q х к матрицу первых производных и пред положим, что она имеет полный ранг в некоторой окрестности истинного значения (3.
10.8. Нелинейные ограничения |
259 |
Логарифмическая функция правдоподобия равна
In L(0,0) = const + ^ 1п|П_1(0)|
- i( y - Х р )'П - \в ){ у - X/3). |
(10.62) |
Как и ранее, обозначим оценку максимального правдоподобия без ограничения через (/3,0), а с ограничением — через (0,6). После несложных вычислений три критические статистики записывают ся в виде
W = д ф У ^ с ф Х Х 'П - 'х у 'С ф у у 'д ф ) , |
(10.63) |
LM = и '« _1Х (Х 'Й _1Х ) - 1Х 'П "1й, |
(10.64) |
LR = - 2 (in L(0,6) - 1п£(3,в))- |
(10.65) |
(Сравните эти выражения с (10.52)-(10.54).) Бреуш (Breusch, 1979) показал, что и в нелинейном случае по-прежнему верно, что LR > LM, однако второе неравенство W ^ LR, вообще говоря, не выполняется.
В заключение обратим внимание на некоторую проблему, свя занную со статистикой Вальда. Дело в том, что всегда существует множество способов записи одного и того же ограничения. Напри мер, в простой модели
У = А®1 +02X2 + « , |
и ~ Щ0,<т21), |
(10.66) |
мы собираемся тестировать условие 0\ = 02- Функцию, задаю щую это ограничение, можно записать в виде д\{0) = 0\ - 02 или эквивалентным способом д2(0) = (0\/02) - 1 . Конечно, можно за писать это же условие и многими другими способами. Функции д\ и д2 совпадают при наличии ограничения, но отличаются в других значениях аргументов. Производные функций д\ и р2 равны
(10.67)
260 |
Гл. 10. Метод максимального правдоподобия в моделях регрессии |
||||
Отсюда критические статистики тестов Вальда имеют вид |
|
||||
|
W* = |
( А - & ) 2 |
(г = 1,2), |
(10.68) |
|
|
52< ( Х 'Х ) - Ч |
||||
где |
|
|
|
|
|
|
< = |
(1,-1), |
< = (1,-(& /& )). |
(10.69) |
Мы можем заключить отсюда, что статистика теста Вальда — в отличие от LR и LM статистик — неинвариантна по отноше нию к тривиальным преобразованиям в нулевой гипотезе. При чина, по которой это происходит, состоит в том, что критическая статистика теста Вальда выводится из линейной аппроксимации вектора ограничений в точке /3, а различные способы выражения ограничения приводят к различным линеаризациям. Эти разли чия асимптотически исчезают, однако могут быть существенны в конечных выборках.
Упражнения
10.1.Рассмотрим выборку размера 10 из пуассоновского распределения
спараметром в: 1, 4, 3, 2, 3, 0, 1, 1, 0, 5.
а) Вычислите оценку максимального правдоподобия для в.
б) Покажите графически, что функция правдоподобия и ее лога рифм достигают максимума в одной и той же точке в.
10.2.Дана выборка размера п из нормального распределения N(p,o2). Запишите логарифмическую функцию правдоподобия и найдите MLоценки параметров /х и о2. Найдите смещения этих оценок.
10.3.Пусть 3/1,..., уп — выборка из распределения с плотностью
h(y, в) = 1/6, если |
0 < х ^ |
в , и h(у,в) = 0 — в остальных случаях |
__ |
„Ль |
|
(0 < 9 < оо). Покажите, что в = maxt/i является оценкой максимально го правдоподобия, и найдите ее смещение.
10.4.Выведите оценки максимального правдоподобия для параметров
ри П многомерного нормального распределения по выборке размера п.