Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ПРИКЛАДНАЯ ЭКОНОМЕТРИКА В ПРЕДПРИНИМАТЕЛЬСТВЕ.docx
Скачиваний:
17
Добавлен:
30.04.2019
Размер:
1.94 Mб
Скачать

4.5. Предсказание

Предположим, что вы оценили модель

(11.50)

на выборке из Т наблюдений временною ряда (t= 1,..., Т):

(11.51)

Имея некоторое послевыборочное значение переменной X, например ХT+р, вы можете предсказать соответствующее значение У:

(11.52)

Такие предсказания могут быть важными по двум причинам. Во-первых, вы можете быть одним из тех эконометристов, чья работа — заглядывать в экономическое будущее. Некоторые эконометристы изучают экономиче­ские закономерности с целью улучшить наше понимание того, как работает экономика, но для других это является лишь средством достижения более практичной цели — предвидеть, что может случиться. Во многих странах макроэкономическое прогнозирование имеет высокую репутацию, и кол­лективы эконометристов поддерживаются министерствами финансов или другими правительственными органами, частными финансовыми учрежде­ниями, университетами и исследовательскими институтами, и их предска­зания активно используются для формирования и обсуждения государ­ственной политики или в деловых целях. Когда подобные предсказания публикуются в печати, они, как правило, привлекают гораздо больше вни­мания, чем большинство других видов экономического анализа, в основ­ном благодаря своей сути и тому, что в отличие от большинства других ви­дов экономического анализа они легко могут быть поняты средним гражданином. Даже человек с совершенно нематематическим и нетехническим складом ума в состоянии понять, что подразумевается под оценками буду­щего уровня безработицы, инфляции и т.д.

Есть, однако, и другое применение эконометрического предсказания, которое делает его предметом заботы большинства эконометристов незави­симо от того, заняты они прогнозированием или нет. Оно дает метод оцен­ки устойчивости регрессионной модели, который имеет большую исследо­вательскую направленность, чем диагностические статистики, использо­вавшиеся до сих пор.

Прежде чем двигаться дальше, необходимо уточнить, что мы понимаем под предсказанием. К сожалению, в эконометрической литературе этот тер­мин может иметь несколько различных значений, в соответствии с понима­нием ХT+p в модели (11 52). Мы будем различать предсказания (ex post predictions) и прогнозы (forecasts). Это разделение сделано в соответствии с обычным использованием терминов, но, тем не менее, применяемая здесь терминология не вполне стандартная.

Предсказания

Мы опишем как предсказание, если значение XT+p известно. Как это возможно? В общем случае эконометристы хотят включить все имеющиеся данные в свою выборку для максимизации ее размера и, как следствие, для минимизации дисперсии оценок, поэтому XT является последним зафикси­рованным значением X на момент оценки регрессии. Тем не менее, возмож­ны две ситуации, когда ХT+p известны: когда вы ждете р или больше перио­дов после оценки регрессии или когда вы заранее ограничили период вы­борки так, чтобы у вас остались несколько последних наблюдений. Как мы увидим в следующем подразделе, весомой причиной так поступать может стать возможность без задержки оценить прогнозную точность модели.

Так, например, обращаясь снова к уравнению (3.39) модели связи общей инфляции и инфляции зарплаты, предположим, что для всего периода вы­борки мы оценили уравнение

(11.53)

где р и w — годовой уровень общей инфляции и инфляции зарплаты (в про­центах) соответственно, и что мы знаем, что в один послевыборочный год уровень инфляции зарплаты составлял 6%. Тогда мы можем утверждать, что предсказанный уровень общей инфляции равен 5,8%. Мы, конечно, долж­ны иметь возможность сразу сравнить его с действительным уровнем ин­фляции в этом году и рассчитать ошибку предсказания, которая равна разно­сти между предсказанным и действительным значением В общем случае, если YT +р — действительное значение, а - предсказываемое, то ошибка предсказания fT+p определяется как

(11.54)

Почему появляется ошибка предсказания? Это происходит по двум при­чинам. Во-первых, значение - было рассчитано с помощью оценок пара­метров b1 и b2, вместо их реальных значений. Во-вторых, - не учитывает воздействие случайного члена иT+ р, являющегося составной частью YT+p. В дальнейшем мы будем предполагать, что данные включают (T+р) наблю­дений переменных, из них первые Т наблюдений (период выборки) исполь­зуются для построения регрессии, а последние р (период, или интервал предсказания) используются для анализа точности предсказания.

Пример

Предположим, что, когда мы оценивали функцию спроса на жилье по набору данных для оценивания функций спроса, мы использовали лишь первое 41 наблюдение из выборки, т.е. данные за 1959—1999 гг., оставив по­следние четыре наблюдения для анализа предсказаний. Полученное на вы­борке 1959-1999 гг. уравнение выглядит следующим образом (в скобках приведены стандартные ошибки):

(11.55)

Значения LGHOUS для периода 2000—2003 гг., предсказанные с помощью этого уравнения, при использовании действительных значений личного располагаемого дохода и относительных цен жилья в эти годы, показаны в табл. 11.6 вместе с фактическими значениями этой переменной и ошибка­ми предсказания. Предсказания, как и исходные данные, приведены в ло­гарифмической шкале. Для удобства в табл. 11.6 показаны также абсолют­ные значения (в млрд. долл.) в ценах 2000 г., которые могут быть рассчитаны на основе логарифмических значений.

Таблица 11.6. Предсказанные и фактические расходы на жилье в 2000-2003 гг.

Логарифмы

Абсолютные значения

Год

LGHOUS

Ошибка

HOUS

Ошибка

2000

6,914

6,956

-0,042

1006

1049

-43

2001

6,941

6 963

-0,027

1034

1063

-29

2002

6,968

6 990

-0,022

1062

1086

-24

2003

6 981

7,012

-0,030

1076

1109

-33

Мы можем видеть, что в этом случае предсказанные значения расходов на жилье превосходят фактические значения на 2,2—4,2%. Может ли такое предсказание считаться удовлетворительным? Мы обсудим эго в следу­ющем разделе.

Прогнозы

Если вы хотите предсказать конкретное значение УT+p , не зная действи­тельное значение ХT+p, то считается, что вы делаете прогноз (по крайней мере, если использовать терминологию этого текста). Макроэкономичес­кие предвидения, публикуемые в прессе, обычно являются в этом смысле прогнозами. Политиков, а в особенности широкую публику, мало интере­суют «двусторонние» экономисты, рассуждения которых имеют вид «с од­ной стороны..., но если нет, то с другой стороны...». Обычно все желают точных однозначных оценок, дополненных, может быть, границами воз­можной ошибки, но часто даже и без этого. Прогнозы менее точны, чем предсказания, поскольку они подвержены воздействию дополнительного источника ошибки — предсказания значения ХT+p . Очевидно, что делаю­щий прогноз эконометрист пытается, как правило, минимизировать эту дополнительную ошибку, моделируя как можно более точно поведение пере­менной X. Иногда для нее строят отдельную модель, иногда совмещают в одну модель уравнение для Y и уравнение для X, дополняя их множеством других соотношений и оценивая получающуюся систему одновременных уравнений (что рассматривалось в гл. 9).

Свойства предсказаний, полученных с помощью МНК

В последующих рассуждениях мы сосредоточимся в основном на пред­сказаниях, а не на прогнозах, и обсудим свойства коэффициентов уравнения регрессии и свойства случайного члена, а не переменной X в случае, когда ее значения неизвестны. И в этом есть положительные моменты. Если значение YT+p порождается тем же процессом, что и выборочные значения переменной Y (т.е. в соответствии с уравнением (11.50), где uT+p удовлетворяет предпосылкам регрессионной модели, и если мы строим наше пред­сказание YT+p с помощью уравнения (11.52), то ошибка предсказания fT+p будет иметь нулевое математическое ожидание и минимальную дисперсию. Первое свойство легко продемонстрировать:­

(11.56)

поскольку Е(b1) = β1, Е(b2)= β2 и Е(иT+р) = 0. Мы не будем доказывать свой­ство минимума дисперсии. Доказательство можно найти у Дж. Джонстона и Дж. Динардо (Jonston, Dinardo. 1997). Оба эти свойства сохраняются и для общего случая множественного регрессионного анализа.

В случае уравнения парной регрессии теоретическая дисперсия fT+p опре­деляется как

(11.57)

где и – соответственно выборочное среднее значение и сумма квадратов отклонений переменной X. Из формулы следует, и это неудиви­тельно, что чем больше значение X отклоняется от выборочного среднего, тем больше теоретическая дисперсия ошибки предсказания. Из формулы так же следует, и это вновь неудивительно, что чем больше объем выборки, тем меньше теоретическая дисперсия ошибки предсказания с нижним пре­делом, равным . С ростом объема выборки оценки b1, и b2 стремятся к ис­тинным значениям соответствующих коэффициентов (в случае выполне­ния предпосылок модели), и единственным источником ошибки при пред­сказании будет случайный член uT, а он по определению имеет дисперсию .

Доверительные интервалы для предсказаний

Мы можем получить значение стандартного отклонения для ошибки предсказания, если заменим в уравнении (11.57) на и извлечем квад­ратный корень. Тогда отношение величины (YT+p - ) к стандартной ошибке при оценивании уравнения для периода выборки будет подчинять­ся t-распределению с числом степеней свободы (Т- к). Отсюда мы можем получить доверительный интервал для действительного значения YT+p:

(11.58)

где tкрит — критическое значение t при заданных уровне значимости и числе степеней свободе, а с.о. — стандартная ошибка предсказания. На рис. 11.3 в общем виде показано соотношение между доверительным интервалом для предсказания и значением объясняющей переменной.

В уравнении множественной регрессии выражение, соответствующее (11.57), имеет гораздо более сложный вид, и оно лучше может быть представлено с помощью аппарата матричной алгебры. К счастью, имеется простой прием, который можно использовать для расчета значений стан­дартных ошибок при помощи компьютера. Обозначим период выборки как 1,..., Т, а период предсказания как T+1,..., T+Р. Вы оцениваете уравнение регрессии на выборке, совмещающей выборочный и прогнозный периоды, добавив (различные) фиктивные переменные для каждого из наблюдений периода предсказания. Это означает включение в модель набора фиктив­ных переменных DT+1, DT +2,..., DT+p где значение DT+p, равно нулю для всех наблюдений, кроме наблюдения Т + р, для которого оно равно единице. Как может быть показано, оценки коэффициентов при нефиктивных пере­менных и их стандартные отклонения будут в точности такими же, как и в уравнении регрессии, оцененном только на периоде выборки (см. работы Д. Салкевера (Salkever, 1976) и Ж.-М. Дюфора (Dufour, 1980)). Компьютер использует фиктивные переменные для получения точного соответствия в каждом наблюдении периода предсказания, и он делает это путем прирав­нивания коэффициента при фиктивной переменной к ошибке предсказа­ния, определенной выше. Стандартная ошибка этого коэффициента равна стандартной ошибке предсказания.

Пример

В табл. 11.7 представлены результаты оценивания логарифмической ре­грессии расходов на жилье на показатели дохода и относительных цен,

Таблица 11.7

Dependent Variable LGHOUS

Method: Least Squares

Sample: 1959 2003

Included observations 45

Variable

Coefficient

Std. Error

t-Statistic

Prob.

С

-0.298460

0.194922

-1.531173

0.1340

LGDPI

1.036576

0.006497

159. 5366

0.0000

LGPRHOUS

-0.423765

0.045451

-9.323628

0.0000

D00

-0.041629

0.017210

-2.418867

0.0205

D01

-0.027473

0.017436

-1.575655

0.1234

D02

-0.022256

0.017788

-1.251167

0.2185

D03

-0.030428

0.017893

-1.700556

0.0072

R-squared

0. 998852

Mean dependent var

6. 359334

Adjusted R-squared

0 .998670

S.D. dependent var

0.437527

S.E of regression

0. 015955

Akaike info enter

-5.296084

Sum squared resid

0. 0096 73

Schwarz criterion

-5.015048

Log likelihood

12 6.1619

F-statistic

5508. 485

Durbin-Watson stat

0 802456

Prob(F-statistic)

0.000000

с фиктивными переменными D00—D03 для 2000—2003 гг. Коэффициенты при фиктивных переменных показывают ошибки предсказания, указанные в табл. 11.6. Предсказанный логарифм расходов на жилье в 2000 г в табл. 11.6 равняется 6,956. Из распечатки регрессии видно, что стандартная ошибка предсказания для этого года составляет 0,017. Для 38 степеней свободы кри­тическое значение t-статистики при 5%-ном уровне значимости равно 2,024, и мы получаем следующий 95%-ный доверительный интервал пред­сказания для данного года:

6,956 - 2,024 х 0,017 < Y< 6,956 + 2,024 х 0,017, (11.59)

то есть

6,922 < Y< 6,990. (11.60)

Доверительный интервал не включает фактическое значение (6,914), и, таким образом, по крайней мере, для этого года предсказание оказалось не­удовлетворительным. Очевидное объяснение этому состоит в том, что мы использовали очень простую статическую модель для оценки расходов на жилье. Как мы убедимся в следующей главе, динамическая модель является более предпочтительной.