Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Эконометрика. Начальный курс

.pdf
Скачиваний:
15
Добавлен:
20.11.2023
Размер:
21.93 Mб
Скачать

10.5. Оценка максимального правдоподобия в линейной модели

251

или ее эквивалентную форму записи:

 

 

у ~ Щ Х 0 , с 21п).

 

(10.17)

Плотность распределения случайного вектора у

равна

 

Л(у) = (2тгст2) - п/2ехр| - 1 (y. ~ X/3^ y ~ Х/3) | .

(10.18)

Отсюда получаем логарифмическую функцию правдоподобия

ш м < , ' ) — 5 ь а г - = ш ,* 4 ( у -

- х / э ) ,

(Ю.19)

которая является функцией параметров /3 и <т2. Частные произ­ водные первого порядка этой функции равны

d k lL

1 ,

чгамчг

 

 

д&

- о ^ у

х ®

х

'

(10.20)

ain ь

п

+ (у - Х£)'(У - Х/3)

 

да2

2<72

 

2СГ4

 

Приравнивая первые производные

(10.20) нулю, находим оценки

максимального правдоподобия

 

 

 

р = ( Х ’Х ) - 1Х ’у,

 

 

(10.21)

где е = у — Х(3 обозначает вектор^остатков. Заметим, что оцен­ ка максимального правдоподобия (3 совпадает с оценкой метода наименьших квадратов (3.4) для /3, в то время как оценка макси­ мального правдоподобия а2 неравна оценке (3.19) s2 = е'е/(п —к) для а2, обычно используемой в методе наименьших квадратов.

Частные производные второго порядка от (10.19) равны

02lnL

Х ' Х

 

a2in i

(у-хрух

д(3д(?

а2

до2д&

( 10.22)

а4

и

д2ы

= п

(у -

Х 0)'(у - Х/3)

 

 

(да2)2

2а4

 

(10.23)

 

 

а6

252

Гл. 10 Метод максимального правдоподобия в моделях регрессии

Взяв математическое ожидание (с обратным знаком) от производ­ ных второго порядка, получаем

- Е

/0 2 ln L \ Х ' Х

(10.24)

 

о2

поскольку Е ((у — Х/3)'(у —Х/3)) = па2. Кроме того, математиче­ ское ожидание от смешанной производной равно нулю в силу того, что Е - Х(3) = 0. Поэтому информационная матрица равна

Г п ( Р У )

(1/а2) Х ’Х

0 ]

 

(10.25)

О

п/{2а*)\

 

 

Таким образом, асимптотическая информационная матрица име­ ет вид

^ ■ о 2) = „1“ и / » ) * . - [(1 /о )Q 1/(1< )] ■

О"-26»

где предполагается, что существует предельная, положительно определенная матрица Q — limn—<x,(\ln)X'X. Легко вычисля­ ется обратная матрица

F ~ l =

(10.27)

и из свойств оценок максимального правдоподобия следует, что {a2/n)Q~l является оценкой асимптотической матрицы ковариа­ ций вектора оценок /3. На практике асимптотическая матрица ко­ вариаций аппроксимируется а2( Х 'Х ) ~ 1. В_самом деле, мы знаем, что тонная матрица ковариаций вектора /3 равна а2( Х ’Х ) ~ 1.

Асимптотическую дисперсию оценки а2 можно оценить вели­ чиной 2аА/п. Так как внедиагональные блоки матрицы Т равны нулю, оценки (3 и а2 асимптотически независимы. Такая (асим­ птотическая) независимость оценок средних значений и диспер­ сии является общей чертой теории регрессии и имеет важные по­ следствия для оценивания и тестирования.

10.6. Проверка гипотез в линейной модели, I

253

10.6.Проверка гипотез в линейной модели, I

Рассмотрим теперь обобщенную линейную модель у = Х р + и (см. (5.3)) с матрицей ковариаций ошибок У (и) = Si, где Si известная положительно определенная симметричная матрица. Мы ослабим это требование в следующем разделе. Пусть мы хо­ тим проверить гипотезу о том, что выполнена система q (q < к) независимых линейных ограничений R(3 = г. Здесь R — извест­ ная q х к матрица ранга q, а г — известный q х 1 вектор. В данном разделе мы расмотрим три различных теста для проверки этой гипотезы, основанные на разных подходах.

Выпишем логарифмическую функцию правдоподобия

 

InЦ р ) = const + ^ ln lf T 1! -

^(у - X p ) ' t T l {y - Х р ) ,

(10.28)

ее частные производные первого порядка

 

 

= Х 'П ~ 1(у -

Х р )

(10.29)

и информационную матрицу

 

 

 

- - Е

=

Х ’П - ' Х .

(10.30)

ML-оценка для р в регрессии без ограничения задается уравне­ нием d \n L (p )/d p = 0, откуда получается GLS-оценка (см. (5.4))

3 = ( Х 'П ^ Х ^ Х 'П - У

(10.31)

Вектор остатков равен и = у — Х р , а соответствующее мак­ симальное значение логарифмической функции правдоподобия равно

In L(P) = const + -1п|П -1| —

(10.32)

ML-оценка для р в регрессии с ограничением (R p = г) по­ лучается максимизацией функции In L(P) при условии R p = г.

254 Гл 10. Метод максимального правдоподобия в моделях регрессии

Чтобы найти эту оценку, запишем функцию Лагранжа

ф{Р) = In L(/3) - l'{Rp - г),

(10.33)

где через I = ,lq)' обозначен вектор q множителей Лагран­ жа. Условия экстремума имеют вид

дф(р)/др = 0

и

R p = r

(10.34)

или

 

 

 

X ' S r i { y - X p ) - R ! l = 0

и

R p = г.

(10.35)

Обозначим через /3 и I решение системы (10.35). Получаем

3 = 3 ~ (Х 'П ^ Х )" 1# /

(10.36)

и, следовательно,

 

 

 

г = Rj3 = R P - ( R { X ' n - lX ) - lR ! )l

(10.37)

Выразив Т из (10.37):

 

 

 

Т = { R i X ' n - ' X y ' R ' y ' i R p - г),

(10.38)

и, подставив это выражение в (10.36), найдем оценку Р в регрессии с ограничением*

3 = 3 - (Х /П -1Х )" 1Д ,(Я (Х ,П -1Х ) - 1Я /) " 1(Я З - г). (10.39)

Обозначим через й = у - Х р вектор остатков в регрессии с огра­ ничением. Тогда максимальное значение логарифмической функ­ ции правдоподобия InL{fl) равно

\nL(p) = const + ^ In

(10.40)

«

£i

Теперь мы готовы сформулировать три теста, о которых шла речь в начале раздела. Во всех этих тестах нулевой гипотезой Но является наличие ограничения R P = г.

10.6. Проверка гипотез в линейной модели, I

255

Тест Вальда (W) ( Wald test). Тест Вальда основан на идее, что при выполнении нулевой гипотезы вектор Я/3 должен быть близок к г. Из (10.31) получаем

я З - r ~ Щ П 0 - г , Щ Х ' П - ' Х ) - 1Я').

(10.41)

Следовательно, если имеет место нулевая гипотеза, то

 

R/3 -

г ~ N{О, Я (Х 'П -1Х ) - 1Я').

(10.42)

Используя свойство

нормального распределения (приложе­

ние МС, п. 4, N9), получаем

 

W s (Я З - Г)/(Я(Х,П -1Х )-1Я')_1(ЯЗ - г) ~ x 2(g).

(Ю.43)

Отметим, что тест Вальда использует только оценки в модели без ограничения на параметры.

Тест м нож ит елей Л агранж а (LM) (Lagrange multiplier test).

Тест множителей Лагранжа основан на идее, что при выполнении нулевой гипотезы все множители Лагранжа должны быть равны нулю, поэтому и вектор I должен быть близок к нулю. Из (10.38) и (10.41) получаем, что в том случае, когда выполняется нулевая гипотеза,

l ~ N ( O t ( R { X ,n - lX ) - lR ! y l)

(10.44)

и, следовательно,

LM a l ' R ( X ' n - lX ) - lB f i ~ х2(д).

(10.45)

Поскольку в силу (10.35) X ' f l 1й = Я'Т, получаем эквивалентное представление LM статистики

LM = и П - 1Х { Х ' П - 1Х ) - 1Х 'П - 'й .

В отличие от теста Вальда тест множителей Лагранжа использует только оценки в модели с ограничением на параметры.

Тест от нош ения правдоподобия (LR) (Likelihood ratio test).

Тест отношения правдоподобия использует как регрессию с огра­ ничением, так и регрессию без ограничения. Он основан на том,

256 Гл 10. Метод максимального правдоподобия в моделях регрессии

что если ограничение справедливо, то отношение максимальных значений функций правдоподобия для регрессии с ограничением и без ограничения должно быть близко к 1. Таким образом, в каче­ стве критической статистики теста берется разница максимумов логарифмических функций правдоподобия (10.32) и (10.40):

LR = —2(1пЬ ф ) - In L 0 ) ) = u f ] _Iu - u f i - 'u .

(10.46)

Можно показать, что при выполнении нулевой гипотезы (10.46) имеет х2{$) распределение. Действительно, поскольку Х р = Х р Х((3 /3), то « = « + Х(Р Р). Домножив на О-1/2, получаем

= П - ^ й + ( Г 1/2Х ф - р).

(10.47)

Взяв скалярный квадрат обеих частей (10.47) и учитывая, что Х 'П -1и = 0 (см. (10.31)), имеем

й'п~1й = й'п-'й + ф - р у х 'а ~ хх ф - р).

(ю.48)

Из (10.36) вытекает, что

Р - р = {X'Sl-lX ) - xR!l,

(10.49)

поэтому из (10.45) следует:

LR = Й'П -'Й - и'П -1и = l R ( X ' S l - lX ) - lR ! i ~ *2(д). (Ю.50)

Мы видим, что все три критические статистики имеют одно и то же х2(ч) распределение. Более того, из (10.50)) следует LR = LM. Из равенства (10.38) вытекает, что W = LM. Следовательно,

LM = LR = W.

(10.51)

Однако, это справедливо только в простейшем случае, когда матрица ковариаций ошибок Л полностью известна. Ситуация усложняется в том (более реальном) случае, когда матрица О неизвестна.

10.7. Проверка гипотез в линейной модели, II

257

10.7.Проверка гипотез в линейной модели, II

Предположим теперь, что матрица SI неизвестна, однако извест­ на ее структура, т. е. ft = Q(0) является функцией неизвестного р х 1 вектора параметров в, который необходимо оценить. (Эту ситуацию мы рассматривали ранее в главе 5, п. 5.3.) Три крити­ ческие статистики в этом случае принимают вид:

W =

(Я З - r)’(R (X ’n ~ 1X ) - l R !)-l {Rj3 - г),

(10.52)

LM = £ ^ Г 1Х (Х ,Г Г 1.Х )-1Х /СГ15,

(10.53)

LR =

-2(1п Ь ф , в) - In Ь ф , в)) ,

(10.54)

где П = Г2(0) и ft = П(6). Теперь мы покажем, что верно знаме­ нитое неравенство

LM < LR ^ W.

(10.55)

Доказательство основано на довольно тонком замечании, принад­ лежащем Бреушу (Breusch, 1979). Отметим сначала, что /3 яв­ ляется точкой максимума функции InL(/3, в], а /3 является точ­ кой условного максимума функции In L(/3,0) при ограничении R/3 = г. Введем теперь два новых_ вектора: /Зи, являющийся точкой максимума функции In L((3,6), и /Згикоторый является точкой условного максимума функции In L(/3,0) при ограничении

R/3 = г

Равенства, выведенные в предыдущем разделе (для случая, когда в известно), позволяют получить следующие выражения для статистик W и LM, представив их в виде, аналогичном ста­

тистике LR:

 

 

W =

—2 (Ы ,(3 г ,в ) - 1 п 1 (3 ,в )),

(10.56)

LM =

- 2 (in L 0 , в) - In Ь ф и, в)) .

(10.57)

258

Гл. 10. Метод максимального правдоподобия в моделях регрессии

 

Кроме того, критическая статистика теста отношения правдо-

подобий равна

 

 

 

 

 

LR =

- 2 (in Ь ф ,в) - In L(3, £)) .

(10.58)

Отсюда мы получаем, что

 

 

 

 

LR - LM = 2

(in L(3, в) -

In Ь ф и,5))

> 0,

(10.59)

 

W - LR = 2

(in L(jS, 0) -

In L(3r, 0))

> 0.

(10.60)

Следовательно, LM < LR < W.

 

 

 

 

Это неравенство справедливо при нулевой гипотезе. Для ко­

нечных выборок уровень значимости тестов, если применять од­ но и то же критическое значение, будет различен. Неравенство само по себе не дает никакой информации о сравнительной мощ­ ности W, LR и LM тестов. Подробное обсуждение этого неравен­ ства и его следствий содержится в работах (Evans and Savin, 1982)

и(Godfrey, 1988).

10.8.Нелинейные ограничения

Предположим, что нулевая гипотеза состоит из системы q нели­ нейных ограничений на вектор коэффициентов /3. Пусть дана ли­ нейная модель у — Х/3 + и при стандартном условии на распре­ деление вектора ошибок u ~ N (0,12(0)). Запишем ограничения в виде

д{р) = 0.

(10.61)

Таким образом, мы собираемся тестировать нулевую гипотезу HQ: д((3) = 0 против альтернативной гипотезы Hi: д{(3) ф 0.

Предположим, что все q компонент вектора д(0) являются непрерывными дважды дифференцируемыми функциями. Обо­ значим через G(/3) q х к матрицу первых производных и пред­ положим, что она имеет полный ранг в некоторой окрестности истинного значения (3.

10.8. Нелинейные ограничения

259

Логарифмическая функция правдоподобия равна

In L(0,0) = const + ^ 1п|П_1(0)|

- i( y - Х р )'П - \в ){ у - X/3).

(10.62)

Как и ранее, обозначим оценку максимального правдоподобия без ограничения через (/3,0), а с ограничением — через (0,6). После несложных вычислений три критические статистики записывают­ ся в виде

W = д ф У ^ с ф Х Х 'П - 'х у 'С ф у у 'д ф ) ,

(10.63)

LM = и '« _1Х (Х 'Й _1Х ) - 1Х 'П "1й,

(10.64)

LR = - 2 (in L(0,6) - 1п£(3,в))-

(10.65)

(Сравните эти выражения с (10.52)-(10.54).) Бреуш (Breusch, 1979) показал, что и в нелинейном случае по-прежнему верно, что LR > LM, однако второе неравенство W ^ LR, вообще говоря, не выполняется.

В заключение обратим внимание на некоторую проблему, свя­ занную со статистикой Вальда. Дело в том, что всегда существует множество способов записи одного и того же ограничения. Напри­ мер, в простой модели

У = А®1 +02X2 + « ,

и ~ Щ0,<т21),

(10.66)

мы собираемся тестировать условие 0\ = 02- Функцию, задаю­ щую это ограничение, можно записать в виде д\{0) = 0\ - 02 или эквивалентным способом д2(0) = (0\/02) - 1 . Конечно, можно за­ писать это же условие и многими другими способами. Функции д\ и д2 совпадают при наличии ограничения, но отличаются в других значениях аргументов. Производные функций д\ и р2 равны

(10.67)

260

Гл. 10. Метод максимального правдоподобия в моделях регрессии

Отсюда критические статистики тестов Вальда имеют вид

 

 

W* =

( А - & ) 2

(г = 1,2),

(10.68)

 

52< ( Х 'Х ) - Ч

где

 

 

 

 

 

 

< =

(1,-1),

< = (1,-(& /& )).

(10.69)

Мы можем заключить отсюда, что статистика теста Вальда — в отличие от LR и LM статистик — неинвариантна по отноше­ нию к тривиальным преобразованиям в нулевой гипотезе. При­ чина, по которой это происходит, состоит в том, что критическая статистика теста Вальда выводится из линейной аппроксимации вектора ограничений в точке /3, а различные способы выражения ограничения приводят к различным линеаризациям. Эти разли­ чия асимптотически исчезают, однако могут быть существенны в конечных выборках.

Упражнения

10.1.Рассмотрим выборку размера 10 из пуассоновского распределения

спараметром в: 1, 4, 3, 2, 3, 0, 1, 1, 0, 5.

а) Вычислите оценку максимального правдоподобия для в.

б) Покажите графически, что функция правдоподобия и ее лога­ рифм достигают максимума в одной и той же точке в.

10.2.Дана выборка размера п из нормального распределения N(p,o2). Запишите логарифмическую функцию правдоподобия и найдите MLоценки параметров /х и о2. Найдите смещения этих оценок.

10.3.Пусть 3/1,..., уп — выборка из распределения с плотностью

h(y, в) = 1/6, если

0 < х ^

в , и h(у,в) = 0 — в остальных случаях

__

„Ль

 

(0 < 9 < оо). Покажите, что в = maxt/i является оценкой максимально­ го правдоподобия, и найдите ее смещение.

10.4.Выведите оценки максимального правдоподобия для параметров

ри П многомерного нормального распределения по выборке размера п.