Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Эконометрика. Начальный курс

.pdf
Скачиваний:
49
Добавлен:
20.11.2023
Размер:
21.93 Mб
Скачать

14.10. Эффект «занижения». Два вспомогательных параметра

421

дователыю, в случае г = 1 и т/ —> оо мы получаем, что E(UR) стремится к 1 при всех qg. (В самом деле, среднеквадратичное отклонение pretest-оценки неограничено и пропорционально tj2, при rj —» оо.) Однако в случае процедуры «от общего к частно­ му» среднеквадратичное отклонение pretest-оценки всегда огра­ ничено, и, следовательно, E*(UR) < 1 (это следует из уравне­ ния (14.7)).

Хотя рассматриваемые функции непрерывны, у них имеют­ ся изломы. Такой вид функций является следствием существова­ ния нескольких локальных максимумов. В точках излома проис­ ходит переход с одного локального максимума на другой. Очевид­ но, что эффект «занижения» (среднеквадратичного отклонения) pretest-оценки может быть весьма значительным, даже неограни­ ченным, в зависимости от выбора процедуры предварительного тестирования.

З ави си м о сть о т т

При г = 0 в наихудшем случае мы получаем E**(UR) = 0.87 для т = 1 и E**(UR) = 0.90 для т = 2. Теперь нас инте­ ресует, как эффект «занижения» зависит от т. У нас 2ГП мо­ делей, и можно было бы предположить, что тяжесть проблемы пропорциональна 2m. С другой стороны, все t-статистики яв­ ляются функциями только m случайных величин ffi > • • •, Vm, так что, возможно, тяжесть проблемы пропорциональна толь­ ко т . Рассмотрим частный случай, когда Z 'M Z = 1т. Тогда все векторы ортогональны, и m-мерная задача распадает­ ся на т одномерных задач (см. теорему 14.3). Для этого слу­ чал график максимума E**(UR) как функции m приведен на рис. 14.6.

Из графика видно, что E**(UR) растет с ростом т , но мед­ леннее, чем линейная функция. Хотя этот результат получен для частного случая Z 'M Z = / ш, однако он позволяет предполо­ жить, что тяжесть проблемы возрастает с ростом т не так бы­ стро, капе можно было бы опасаться.

422

Гл. 14. Предварительное тестирование: введение

2

4

6

8

10

12 m 14

Рис. 14.6. Зависимость E**(UR) от m (Z 'M Z = I m)

Частный случай

На практике нам известны gjj, q и г, а т/i п 172 неизвестны. Рас­ смотрим одну из подобных ситуаций. Пусть, например, q$ = 2, q = (1/3, (2/3)\/2)' — нормированный вектор {q'q = 1) и г = 0.8.

На рис. 14.7 и 14.8 построены графики E(UR) как функции T)i и т/2, для процедур «от общего к частному» и «от частного к общему», соответственно. Значение E(UR) всегда находится меж­ ду 0 и 1, и каждый график симметричен относительно точки (7/1,7/2) = (0,0). Функциональная форма зависимости от (7/1,772) довольно сложная и существенно зависит от выбора процедуры. Для процедуры «от общего к частному» (рис. 14.7) E(UR) = 0 при (771,772) = (4, —4), но может достигать значения 0.6551 в тюч­ ке (0.4,1.6). Для процедуры «от частного к общему» (рис. 14.8) E(UR) изменяется от значения, близкого к 0 в точке (4,4), до зна­ чения 0.8798 вблизи точки (4, -4). В данном частном случае (как и в общем случае) процедура «от частного к общему» более чув­ ствительна к проблеме «занижения», чем процедура «от общего к частному». На рисунках изображены также линии уровня этой функции.

14.10. Эффект «занижения». Два вспомогательных параметра

423

E(UR) ,

- 4 - 4

Рис. 14.8. E(UR) как функция гц и

«от частного к общему»

424

Гл. 14. Предварительное тестирование: введение

Рис. 14.9. Анализ чувствительности для E(UR). Верхний ряд: «от общего к частному»; нижний ряд: «от частного к общему»

Анализ чувствительности

Рассмотрим теперь точку (771,42) = (1,-1). На рис. 14.9 показа­ ны сечения графика в 6-мерном пространстве. В каждом сечении изменяется только один из 5 параметров: 771, 772. 9о. 9i (первая компонента вектора д), г, в то время как остальные параметры остаются равными своим значениям в рассматриваемой точке.

Для обеих процедур функция E(UR) в выбранной точке воз­ растает по ?о (и 92) и убывает по 771, 772, 91, и г. Графики на рис. 14.9 еще раз подтверждают, что E(UR) существенно зави­ сит от 771 и 772. Мы уже знаем, что E(UR) является возрастаю­ щей функцией 9д, однако зависимость значительно менее сильная для процедуры «от общего к частному», чем в случае процеду­ ры «от частного к общему». Величина E(UR) зависит существен­ но также и от 4 , т.е. от 9f. Следовательно, различные линейные комбинации компонент вектора /3 в различной степени затронуты эффектом процедуры предварительного тестирования. Графики чувствительности, подобные графикам на рис. 14.9, могут быть использованы для оценки степени зависимости E(UR) от неиз­

14.11. Прогнозирование и предварительное тестирование

425

вестных параметров 771 и 772» а, также от возможных ошибок в измерении наблюдаемых величин q§, q, г.

14.11.Прогнозирование и предварительное тестирование

До сих пор мы рассматривали проблемы, связанные с оценками, получающимися в результате процедуры предварительного тести­ рования. Конечно, все рассмотренные выше проблемы возника­ ют и при прогнозировании. Рассмотрим, например, стандартную линейную модель множественной регрессии:

у= Х& + '/г + е.

Мы не уверены, следует ли включать г в уравнение. Обычная процедура такова: вычисляем t-статистику коэффициента 7 , и в зависимости от того, «большое» или «малое» полученное значе­ ние |t|, мы решаем использовать модель без ограничения или мо­ дель с ограничением. Затем мы вычисляем прогнозное значение величины г/п+1) используя выбранную модель. Этот прогноз явля­ ется, конечно, prefest-прогнозом, однако его свойства сообщают­ ся обычно (как и в рассмотренном выше оценивании параметров модели) без учета того, что оцениванию предшествовала процеду­ ра предварительного выбора модели. Конечно, это неправильно. Следовало бы сообщать истинные значения смещения и диспер­ сии прогноза, принимая во внимание то, что прогнозирование и выбор модели интегрированы в одну процедуру.

Предположим, что данные порождены моделью (14.1), воз­ можно, в ней несколько компонент вектора 7 равны 0. При огра­ ничении £ £ 7 = О прогноз, основанный на МНК-оценках, имеет вид

Уп+1 — x n + lP (i) + *n + l7 (<)

= * U i ( 3 r - Q W id ) + z'n + l( z ' м z ) ~ l / 2w id

= < +A -

= *n+i3r - < . +i

42С

Гл. 14. Предварительное тестирование: введение

где

 

 

С„+1 = Qfxn+1 - { Z 'M Z )~ ll2z n+i,

a x,l+i и zn+1 обозначают набор значений основных и вспомога> тельных регрессоров, для которого мы ищем прогнозное значение. Поскольку модель, которая выбирается, заранее не фиксирована и зависит от выбора процедуры предварительного тестирования, то прогноз может быть основан на одной из возможных моделей (или ивляться линейной комбинацией таких прогнозов). Соответ­ ственно, WALS-прогноз имеет вид

Уп+1 = 5 1 A^ + i

=

xU i А- - (TC + I W TJ.

(14.8)

Заметим, что вектор <rrj = в

и,

таким образом, является наблю­

даемым, но тем не менее yn+i зависит от а , поскольку W зависит от а, так как А* зависят от а.

Поскольку уп+1 = x(,+1/3-fz(l+17 + e n+1, ошибка прогноза (FE) равна

FE = yn+i - Уп+1

= < +i фг - 0 ) - < +1 ^ Ч - o z '^ Z 'M Z r 'V r , - £ „+ ,

= *U i Ф т - Р - аСМ - (Я'Ч - ч) - «м-i•

Можно доказать следующие свойства ошибки прогноза.

Теорема 14.4 (теорема эквивалентности для прогноза).

Математическое ожидание, дисперсия и среднеквадратичное отклонение WALS-прогноза равны

E(FE) = -<тС;+1Е(1V r j-r ,),

V(FE) = a2(x'n+l(X 'X )~ lx n+l + С +1 V ( ^ ) C n+I + 1), MSE(FE) = ffJ(x l+i(X 'X )-1xn+1 + CUI MSE(W?7)C„+1 + 1).

14.11. Прогнозирование и предварительное тестирование

427

Д о к а з а т е л ь с т в о . Существенно то, что /Зг и М у неза­ висимы, поскольку они имеют совместное нормальное распреде­ ление и некоррелированы, гак как M X = 0. Отсюда вытекает независимость /Зг и Wrj. Следовательно, величины /Зг, Wfj, еп+\ попарно независимы. Доказательство получается из этого утвер­ ждения прямым вычислением.

Подчеркнем два важных вывода из теоремы 14.4. Во-первых, она дает точные выражения для двух первых моментов ошибки прогноза, откуда видно, что эти моменты зависят только от rj и сг2 и не зависят от /3. Во-вторых, теорема помогает найти оптималь­ ный прогноз. Если мы найдем Aj, такие что Wr) является опти­ мальной оценкой *7 (в смысле наименьшей матрицы среднеквад­ ратичных отклонений), то те же А{ дадут оптимальный прогноз величины Уп+i- Это те же самые Aj, которые дают оптимальную WALS-оценку вектора (3.

Теорема 14.4 приводит истинные значения моментов ошибки прогноза, учитывая, что была произведена процедура предвари­ тельного тестирования. Однако в прикладных работах предвари­ тельное тестирование не принимается во внимание. В работах счи­ тается, что прогноз несмещенный, и приводится матрица средне­ квадратичных отклонений (ковариационная матрица), рассчитан­ ная по формуле (см. (7.8))

MSE(FE) = <г2(х ;+1(Л’,Л’) - | *п+1 + См'W <n+i + 1).

соответственно, приводится следующий 95%-ный доверительный интервал для yn+i

Уп+i ± 1-96<r j x 'n+x( X 'X ) - 'x n+x + Си" 'С и + 1,

(14.9)

где вместо а используется некоторая состоятельная оценка о. Ес­ ли же правильно учитывать эффект процедуры выбора модели, то мы получаем то же самое значение прогноза уп+ь но совсем другие моменты. Определим две функции ф\ (rj) и rfo(rj) следую­ щим образом:

*(»!) = С м Е ( И ^ - 1 ,) ,

M V ) = a C i ( ^ ) _1*»+i + С и V(WrjKn+v

428 Гл. 14. Предварительное тестирование: введение

Каждая из функций зависит также и от а, поскольку W зависит от а. Тогда по теореме 14.4 получаем

E(FE) = - o f t fo), V(FE) = a2(M v ) + !)•

Отсюда 95%-ный доверительный интервал для уп+ 1 приблизи­ тельно равен

2/„+i + а (фЛV) ± 1 М у /Ш ) + ?)

(14-10)

Интервал приближенный, поскольку распределение FE не явля­ ется нормальным (однако оно является асимптотически нормаль­ ным, что и позволяет сделать это приближение). Кроме того, в от­ личие от (14.9) доверительный интервал зависит от неизвестных параметров г) н а . Оценить интервал можно, заменив неизвестные г} и а их оценками fj н а .

Когда число наблюдений п становится большим, а сходится к а, однако rj не сходится к г), поскольку V(r)) = 1т. ТЪким обра­ зом, оценка г) несмещенная, но не состоятельная. Для того, чтобы застраховаться от «больших» отклонений rj от »/, можно рассмот­

реть более широкий интервал

 

 

Уп+1 + <rC\(v) < Уп+i < Уп+1 + оСъ(fj),

(14.11)

где

 

 

 

=

min (ф\(-п) ~ 1.96\ЛЫ»7) + l) »

 

 

ц€«(п)4

'

 

C2 (rj) =

max (ф\{г}) + 1.96W sfa ) + l) •

 

Множество H является m-мерным кубом, заданным условиями H{fj) = {rj : |щ - »7j| < am, * = 1 ,... ,m}, где dm определяются так, чтобы для стандартной нормальной величины и выполнялось условие Р(|и| < От)”1 0.95.

В работе (Danilov and Magnus, 2003) эта теория применяется на практике к предсказанию доходностей акций. Авторы показы­ вают, что в этом прикладном примере можно достаточно точно учесть эффект предварительного тестирования, и то, что э т о т

14.12. Обобщения

429

эффект существенен. Игнорирование эффекта предварительно­ го тестирования приводит к прогнозам, которые менее робастны, чем предполагается. Это и является причиной того, что в при­ кладной эконометрике прогнозы чаще, чем полагается, выходят за границы обычных доверительных интервалов.

14.12.Обобщения

Рассмотрим кратко три возможных обобщения.

Неизвестная дисперсия а2

Хотя теорема 14.1 верна независимо от того, известна дисперсия а2 или нет, в большей части данной главы предполагается, что а2 известна. Конечно, это предположение не реалистично, и сле­ дует коснуться вопроса о том, как изменяются наши результаты в случае, когда дисперсия а2 неизвестна. Рассмотрим в качестве примера случай, соответствующий рис. 14.3, где т = 1, q% = оо, с = 1.96. В случае, когда а2 известна, ожидаемые значения коэф­ фициента «занижения» E(UR) равны 0.82, 0.86, 0.79, 0.19 для 77, равного соответственно 0 ,1, 2, 4. В случае неизвестной дисперсии а2 вычисления сложнее и результат зависит от числа степеней свободы п — к — т. В таблице 14.1 приведена сводка результатов.

1 С

1 10

30

50

оо

Е

 

 

У

Таблица 14.1

0

1

4

2

0.76

0.83

0.77

0.26

0.80

0.85

0.78

0.22

0.81

0.86

0.79

0.21

0.82

0.86

0.79

0.19

Видно, что эффект того, что мы оцениваем <т2, относитель­ но невелик, особенно в области, представляющей интерес, где |т/| принимает значения около 1 или 2. Этот пример типичен для по­ ведения величины E(UR).

430

Гл. 14. Предварительное тестирование: введение

Ошибки спецификации

До сих пор мы предполагали, что модель без ограничения яв­ ляется моделью, порождающей данные. Это также может быть не очень реалистичным предположением. Рассмотрим теперь, что изменится, если модель, порождающая данные, содержит больше параметров. Пусть процесс, порождающий данные, имеет вид

у = Х(3 + Z , 7 , + Z 272 + *.

однако у нас нет данных для Z 2. Теорема эквивалентности 14.2 по-прежнему применима и в этой ситуации. Поскольку Z 2 неиз­ вестно, то процедура выбора модели происходит при ограниче­ нии 7 2 = 0. На смещение pretest-оценки (3 повлияет тип дан­ ной ошибки спецификации, но дисперсия оценки останется преж­ ней. Предположив для простоты, что Z'XM Z 2 = 0, и обозначив

Qi = (X 'X y 'X 'Z ii Z 'iM Z i Г 1/2 (г = 1,2), получим

Е(щ'/3) = ш'(3 - a (U/Q JE (W I »7| —г?,) —а/<?2»/2) .

Следовательно, влияние ошибочной спецификации на смещение и среднеквадратичное отклонение оценки ш'(3 проявляется через величину которая, конечно, неизвестна. Заметим, что аб­ солютная величина смещения оценки и ее среднеквадратичное от­ клонение в результате ошибки спецификации могут как возрасти, так и уменьшиться.

Асимптотика

Все рассмотренные в данной главе результаты верны для конеч­ ных выборок. Рассмотрим теперь асимптотическое поведение оце­ нок при п —» оо. Как обычно (ср. глава 8 ), предположим, что последовательность матриц n -1 [X Z]#[X Z] сходится к неко­ торой положительно определенной матрице. Из теоремы 14.2 сле­ дует, что

Е /3 = (3 - <T (n'/2Q ) E ( W ( n 'l/2 v ) ~ n ~ l/2 v ) ,

v(3) = ^ ((^ г )" 1+(»1/Je>v(4'4)(n,/2<?>')-