
книги / Эконометрика. Начальный курс
.pdf14.10. Эффект «занижения». Два вспомогательных параметра |
421 |
дователыю, в случае г = 1 и т/ —> оо мы получаем, что E(UR) стремится к 1 при всех qg. (В самом деле, среднеквадратичное отклонение pretest-оценки неограничено и пропорционально tj2, при rj —» оо.) Однако в случае процедуры «от общего к частно му» среднеквадратичное отклонение pretest-оценки всегда огра ничено, и, следовательно, E*(UR) < 1 (это следует из уравне ния (14.7)).
Хотя рассматриваемые функции непрерывны, у них имеют ся изломы. Такой вид функций является следствием существова ния нескольких локальных максимумов. В точках излома проис ходит переход с одного локального максимума на другой. Очевид но, что эффект «занижения» (среднеквадратичного отклонения) pretest-оценки может быть весьма значительным, даже неограни ченным, в зависимости от выбора процедуры предварительного тестирования.
З ави си м о сть о т т
При г = 0 в наихудшем случае мы получаем E**(UR) = 0.87 для т = 1 и E**(UR) = 0.90 для т = 2. Теперь нас инте ресует, как эффект «занижения» зависит от т. У нас 2ГП мо делей, и можно было бы предположить, что тяжесть проблемы пропорциональна 2m. С другой стороны, все t-статистики яв ляются функциями только m случайных величин ffi > • • •, Vm, так что, возможно, тяжесть проблемы пропорциональна толь ко т . Рассмотрим частный случай, когда Z 'M Z = 1т. Тогда все векторы ортогональны, и m-мерная задача распадает ся на т одномерных задач (см. теорему 14.3). Для этого слу чал график максимума E**(UR) как функции m приведен на рис. 14.6.
Из графика видно, что E**(UR) растет с ростом т , но мед леннее, чем линейная функция. Хотя этот результат получен для частного случая Z 'M Z = / ш, однако он позволяет предполо жить, что тяжесть проблемы возрастает с ростом т не так бы стро, капе можно было бы опасаться.
422 |
Гл. 14. Предварительное тестирование: введение |
2 |
4 |
6 |
8 |
10 |
12 m 14 |
Рис. 14.6. Зависимость E**(UR) от m (Z 'M Z = I m)
Частный случай
На практике нам известны gjj, q и г, а т/i п 172 неизвестны. Рас смотрим одну из подобных ситуаций. Пусть, например, q$ = 2, q = (1/3, (2/3)\/2)' — нормированный вектор {q'q = 1) и г = 0.8.
На рис. 14.7 и 14.8 построены графики E(UR) как функции T)i и т/2, для процедур «от общего к частному» и «от частного к общему», соответственно. Значение E(UR) всегда находится меж ду 0 и 1, и каждый график симметричен относительно точки (7/1,7/2) = (0,0). Функциональная форма зависимости от (7/1,772) довольно сложная и существенно зависит от выбора процедуры. Для процедуры «от общего к частному» (рис. 14.7) E(UR) = 0 при (771,772) = (4, —4), но может достигать значения 0.6551 в тюч ке (0.4,1.6). Для процедуры «от частного к общему» (рис. 14.8) E(UR) изменяется от значения, близкого к 0 в точке (4,4), до зна чения 0.8798 вблизи точки (4, -4). В данном частном случае (как и в общем случае) процедура «от частного к общему» более чув ствительна к проблеме «занижения», чем процедура «от общего к частному». На рисунках изображены также линии уровня этой функции.
424 |
Гл. 14. Предварительное тестирование: введение |
Рис. 14.9. Анализ чувствительности для E(UR). Верхний ряд: «от общего к частному»; нижний ряд: «от частного к общему»
Анализ чувствительности
Рассмотрим теперь точку (771,42) = (1,-1). На рис. 14.9 показа ны сечения графика в 6-мерном пространстве. В каждом сечении изменяется только один из 5 параметров: 771, 772. 9о. 9i (первая компонента вектора д), г, в то время как остальные параметры остаются равными своим значениям в рассматриваемой точке.
Для обеих процедур функция E(UR) в выбранной точке воз растает по ?о (и 92) и убывает по 771, 772, 91, и г. Графики на рис. 14.9 еще раз подтверждают, что E(UR) существенно зави сит от 771 и 772. Мы уже знаем, что E(UR) является возрастаю щей функцией 9д, однако зависимость значительно менее сильная для процедуры «от общего к частному», чем в случае процеду ры «от частного к общему». Величина E(UR) зависит существен но также и от 4 , т.е. от 9f. Следовательно, различные линейные комбинации компонент вектора /3 в различной степени затронуты эффектом процедуры предварительного тестирования. Графики чувствительности, подобные графикам на рис. 14.9, могут быть использованы для оценки степени зависимости E(UR) от неиз
42С |
Гл. 14. Предварительное тестирование: введение |
где |
|
|
С„+1 = Qfxn+1 - { Z 'M Z )~ ll2z n+i, |
a x,l+i и zn+1 обозначают набор значений основных и вспомога> тельных регрессоров, для которого мы ищем прогнозное значение. Поскольку модель, которая выбирается, заранее не фиксирована и зависит от выбора процедуры предварительного тестирования, то прогноз может быть основан на одной из 2т возможных моделей (или ивляться линейной комбинацией таких прогнозов). Соответ ственно, WALS-прогноз имеет вид
Уп+1 = 5 1 A^ + i |
= |
xU i А- - (TC + I W TJ. |
(14.8) |
Заметим, что вектор <rrj = в |
и, |
таким образом, является наблю |
даемым, но тем не менее yn+i зависит от а , поскольку W зависит от а, так как А* зависят от а.
Поскольку уп+1 = x(,+1/3-fz(l+17 + e n+1, ошибка прогноза (FE) равна
FE = yn+i - Уп+1
= < +i фг - 0 ) - < +1 ^ Ч - o z '^ Z 'M Z r 'V r , - £ „+ ,
= *U i Ф т - Р - аСМ - (Я'Ч - ч) - «м-i•
Можно доказать следующие свойства ошибки прогноза.
Теорема 14.4 (теорема эквивалентности для прогноза).
Математическое ожидание, дисперсия и среднеквадратичное отклонение WALS-прогноза равны
E(FE) = -<тС;+1Е(1V r j-r ,),
V(FE) = a2(x'n+l(X 'X )~ lx n+l + С +1 V ( ^ ) C n+I + 1), MSE(FE) = ffJ(x l+i(X 'X )-1xn+1 + CUI MSE(W?7)C„+1 + 1).
14.11. Прогнозирование и предварительное тестирование |
427 |
Д о к а з а т е л ь с т в о . Существенно то, что /Зг и М у неза висимы, поскольку они имеют совместное нормальное распреде ление и некоррелированы, гак как M X = 0. Отсюда вытекает независимость /Зг и Wrj. Следовательно, величины /Зг, Wfj, еп+\ попарно независимы. Доказательство получается из этого утвер ждения прямым вычислением.
Подчеркнем два важных вывода из теоремы 14.4. Во-первых, она дает точные выражения для двух первых моментов ошибки прогноза, откуда видно, что эти моменты зависят только от rj и сг2 и не зависят от /3. Во-вторых, теорема помогает найти оптималь ный прогноз. Если мы найдем Aj, такие что Wr) является опти мальной оценкой *7 (в смысле наименьшей матрицы среднеквад ратичных отклонений), то те же А{ дадут оптимальный прогноз величины Уп+i- Это те же самые Aj, которые дают оптимальную WALS-оценку вектора (3.
Теорема 14.4 приводит истинные значения моментов ошибки прогноза, учитывая, что была произведена процедура предвари тельного тестирования. Однако в прикладных работах предвари тельное тестирование не принимается во внимание. В работах счи тается, что прогноз несмещенный, и приводится матрица средне квадратичных отклонений (ковариационная матрица), рассчитан ная по формуле (см. (7.8))
MSE(FE) = <г2(х ;+1(Л’,Л’) - | *п+1 + См'W <n+i + 1).
соответственно, приводится следующий 95%-ный доверительный интервал для yn+i
Уп+i ± 1-96<r j x 'n+x( X 'X ) - 'x n+x + Си" 'С и + 1, |
(14.9) |
где вместо а используется некоторая состоятельная оценка о. Ес ли же правильно учитывать эффект процедуры выбора модели, то мы получаем то же самое значение прогноза уп+ь но совсем другие моменты. Определим две функции ф\ (rj) и rfo(rj) следую щим образом:
*(»!) = С м Е ( И ^ - 1 ,) ,
M V ) = a C i ( ^ ) _1*»+i + С и V(WrjKn+v
428 Гл. 14. Предварительное тестирование: введение
Каждая из функций зависит также и от а, поскольку W зависит от а. Тогда по теореме 14.4 получаем
E(FE) = - o f t fo), V(FE) = a2(M v ) + !)•
Отсюда 95%-ный доверительный интервал для уп+ 1 приблизи тельно равен
2/„+i + а (фЛV) ± 1 М у /Ш ) + ?) • |
(14-10) |
Интервал приближенный, поскольку распределение FE не явля ется нормальным (однако оно является асимптотически нормаль ным, что и позволяет сделать это приближение). Кроме того, в от личие от (14.9) доверительный интервал зависит от неизвестных параметров г) н а . Оценить интервал можно, заменив неизвестные г} и а их оценками fj н а .
Когда число наблюдений п становится большим, а сходится к а, однако rj не сходится к г), поскольку V(r)) = 1т. ТЪким обра зом, оценка г) несмещенная, но не состоятельная. Для того, чтобы застраховаться от «больших» отклонений rj от »/, можно рассмот
реть более широкий интервал |
|
|
|
Уп+1 + <rC\(v) < Уп+i < Уп+1 + оСъ(fj), |
(14.11) |
||
где |
|
|
|
= |
min (ф\(-п) ~ 1.96\ЛЫ»7) + l) » |
|
|
|
ц€«(п)4 |
' |
|
C2 (rj) = |
max (ф\{г}) + 1.96W sfa ) + l) • |
|
Множество H является m-мерным кубом, заданным условиями H{fj) = {rj : |щ - »7j| < am, * = 1 ,... ,m}, где dm определяются так, чтобы для стандартной нормальной величины и выполнялось условие Р(|и| < От)”1 —0.95.
В работе (Danilov and Magnus, 2003) эта теория применяется на практике к предсказанию доходностей акций. Авторы показы вают, что в этом прикладном примере можно достаточно точно учесть эффект предварительного тестирования, и то, что э т о т