эконометрика для очно-заочного 4 курс 2024-2025 год / 04-УП Базовый курс эконометрики (Писарева О.М., Черников Г.В.) 2024
.pdf
Рисунок 4.7 - Графическая иллюстрация задачи построения доверительных интервалов прогноза на основе факторной регрессионной модели.
Оценим дисперсию модельного прогноза, определяемую вероятностным характером построенной модели, то есть оценим Dyˆ = Dy(x P ) . Для этого используем вектор Zp, представляемый как
|
|
1 |
|
Z |
p |
|
|
|
|
p . |
|
|
|
x |
|
Воспользовавшись соотношением (2.17), можем записать:
Dyˆ(x p ) D |
|
|
|
|
a |
0 |
|
|
|||||||
|
(Z p )T |
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
a |
|
|
|
|||
(Z |
p |
) |
T |
|
a |
0 |
|
p |
|
|
|
2 |
(Z |
||
|
|
|
|
s |
|||||||||||
|
|
cov |
|
|
Z |
|
|
||||||||
|
|
|
|
|
a |
|
|
|
|
|
|
|
|
|
|
M (Z
p )T (Z
|
|
a |
0 |
|
0 |
a |
0 |
|
0 |
T |
|
|
|
|
p |
) |
T |
|
|
|
|
Z |
p |
|
|
||||
|
|
a0 |
|
|
a0 |
|
|
|
||||||
|
|
a |
|
a |
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
. |
|
T Z ) 1 Z p
Отсюда получаем общую оценку дисперсии прогноза, построенного на
факторной регрессионной модели: |
|
Dy(xP ) s2[1 (Z p )T (ZT Z) 1 Z p ] . |
(4.54) |
Таким образом, стандартная ошибка прогноза: |
|
s f s |
1 (Z p )T (Z T Z) 1 Z p , |
(4.55) |
где s - стандартная ошибка оценивания (SEE, RSE).
Окончательно, доверительный интервал прогноза у(хр) с надежностью 100(1- )% можно определить условием:
y(x p ) [ yˆ(x p ) t / 2 s f ; yˆ(x p ) t / 2 s f ] , |
(4.56) |
где t / 2 - табличное значение распределения Стьюдента с =n-m-1 степенями свободы и уровнем значимости , при наличии в уравнении регрессии свободного члена.
Полученная оценка ширины доверительного интервала позволяет комплексно решать задачу определения заданных требований к качеству прогноза. Как известно, с увеличением значение t - статистики уменьшается, поэтому при увеличении числа наблюдений n доверительный интервал сужается. На ширину интервала влияют и величины значений вектора хр. При этом лишь качественно можно утверждать, что при удалении хр от X интервал увеличивается. Конкретное утверждение возможно сформулировать, имея точный вид множественной регрессионной модели.
Зная общий вид величины доверительного интервала прогноза (4.53) в рамках ЛММР, не трудно вывести формулу оценки доверительного интервала
ошибки прогноза, однофакторной |
регрессионной |
модели, |
например, |
вида |
|
y a0 (x )T a . |
|
|
|
|
|
Пусть |
матрица экзогенных |
переменных |
модели |
принимает |
вид: |
1 |
1 |
|
|
|
|
|
|
|
|
|
|
Z ... |
... . |
|
|
|
|
|
|
|
|
|
|
1 |
n |
|
|
|
|
Сделав вместо матрицы Z соответствующую подстановку в соотношение (4.55), и записав его для случая центрированных координат, не трудно получить соотношение
s f s |
1 |
1 |
|
x p x 2 |
. |
(4.57) |
n |
n |
|||||
|
|
|
xi x 2 |
|
|
|
|
|
|
|
i 1 |
|
|
Очевидно, что величина ошибки прогноза (4.57) связана с количеством наблюдений в оценочной выборке n, а также с тем, на сколько близко объясняющий фактор x p лежит относительно своего среднего уровня x .
2.5.2. Характеристики прогностической пригодности эконометрической модели
Оценка прогностической пригодности модели-генератора прогноза любого явления осуществляется априорно, то есть до момента наступления прогнозного события. Это объясняет особенности процедуры его оценивания. На практике наибольшее распространение нашли две методики: метод ретроспективной оценки точности прогноза (ex post forecasting) и метод скользящей выборки («jackknife method»).
Процедура ретроспективной оценки состоит в следующем. Весь исходный статистический набор данных делиться на две подвыборки. Первая - носит название обучающей выборки, вторая – тестирующей (экзаменующей). Модель-генератор прогноза строиться на обучающей выборке, на ней же оцениваются информационные характеристики качества. Далее на моделях, допустимых с точки зрения информационной пригодности, осуществляется моделирование событий, совпадающих по состоянию экзогенных переменных с условиями тестирующего набора. Таким образом, тестовый набор представляет собой своеобразную модель будущих событий, а вся совокупность показателей прогностической пригодности эконометрической модели характеризует способность модели, оцененной на обучающей выборке, предсказывать события из тестового набора. Прогноз, осуществляемый на тестовой выборке, носит название ex post-прогноза – прогноз уже известных фактов (в отличие от
ex ante-прогноза на периоде упреждения). Соотношения между введенными понятиями поясняются на рисунке 4.8.
|
|
|
|
|
yˆ |
t 1 |
ˆ |
yˆt m |
|
|
|
|
|
|
yt 2 |
||
период оценки |
Ex post-прогноз |
Ex ante-прогноз |
|
|||||
yˆt n 1 |
|
yˆt l |
yˆt 2 |
yˆt 1 |
yˆt |
|
|
|
обучающая выборка |
тестовая выборка |
реализация прогноза |
|
|||||
( |
) |
( |
|
) |
(период упреждения) |
|
||
yt n 1 |
|
yt l |
yt 2 |
yt 1 |
yt |
|
|
|
|
ретроспективная |
|
|
|
t , |
|
|
наблюдения |
|
|
|
текущее состояние |
|
(время) |
|||
|
выборка |
|
|
|
||||
|
|
|
( |
) |
|
|
|
|
|
|
|
|
|
|
|
||
Рисунок 4.8 - Основные понятия тактики прогнозного исследования на основе процедуры ретроспективной оценки
Процедура метода скользящей выборки (иногда именуют «скользящего экзамена») предполагает разбиение всей доступной статистики (например, в n
наблюдений, i 1, n ) на обучающую и экзаменующую выборки. Сделать это предлагается n способами. Причём i -й вариант обучающей выборки содержит все наблюдения за эндогенной и экзогенными переменными, кроме i -го.
Соответствующая экзаменующая выборка состоит из единственного i -го картежа. Далее осуществляется n-кратная реализация расчетов параметров и оценок точности прогноза, предусматриваемых процедурой ретроспективной оценки точности прогноза. Выбор окончательной спецификации прогностической модели производится на основании выбранного интегрального показателя их прогностической пригодности.
Для оценки точности прогнозов на основе методов и моделей эконометрического моделирования используется множество измерителей
априорного (до свершения ожидаемого события) и апостериорного (по факту свершения события, процесса) качества прогноза.
Для пояснения методов численной оценки качества прогноза введем следующие обозначения к ранее используемым и контекстно понятным, пусть yt - фактическое значение показателя для t-го наблюдения;
yˆt - прогнозное значение показателя для t-го наблюдения;
n – размер тестовой выборки, при тестировании моделей временных рядов – тестовый период упреждения прогноза.
Различают следующие три группы показателей оценивания точности прогнозов чаще всего применяемых на практике: абсолютные и относительные ошибки прогноза, а также группа коэффициентов несоответствия.
Абсолютные показатели ошибки прогноза
Эта группа оценок применяется для отслеживания, как индивидуальных мер точности, так и усредненных по группе.
1) Характеристики индивидуального рассогласования фиксируют меру расхождения фактической и прогнозной информации на выборке тестового набора в единицах измеряемого фактора. Различают:
et yt yˆt - фактическая ошибка (отклонение) прогноза по t-у наблюдению;
t уt уˆt - абсолютная ошибка прогноза (AE) для t-го наблюдения.
2)Кумулятивные характеристики точности прогноза характеризуют
суммарное значение расхождений значений прогноза на ex post-выборке.
|
|
|
|
|
|
|
n |
Рассчитываться они могут, |
например, |
следующими способами et , |
|||||
|
|
|
|
|
|
|
t 1 |
n |
n |
|
|
||||
|
|
yt yˆt |
|
, |
( yt yˆt )2 и |
др., которые |
далее служат для вычисления |
|
|
||||||
t 1 |
t 1 |
|
|
||||
усредненных показателей рассогласования.
3) Усредненные (обобщающие) показатели рассогласования характеризуют усредненную меру расхождения фактической и прогнозной информации на выборке тестового набора. Различают:
e 1 n et - средняя ошибка прогноза (ME); n t 1
|
|
|
|
n |
|
|
|
|
|
|||
|
|
|
|
|
|
yt |
yˆt |
|
- средняя абсолютная ошибка прогноза (MAE); |
|||
|
|
|
|
|
|
|||||||
|
|
|
|
t 1 |
|
|
|
|||||
|
|
|
|
|||||||||
|
|
|
|
|
n |
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
s2p |
|
1 et2 |
|
|
- средний квадрат ошибки прогноза (MSE) или |
||||||
|
|
|
|
n t 1 |
|
|
|
|
|
|||
среднеквадратическая ошибка прогноза; |
||||||||||||
|
|
|
|
|
n |
|
|
|
|
|
||
|
sp |
|
|
(yt |
yˆt )2 |
|||||||
|
|
|
t 1 |
|
|
|
|
- стандартная (стандартизированная) ошибка прогноза |
||||
|
|
|
|
|
n |
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
||
(SE), другое наименование - корень из среднего квадрата ошибки прогноза
(RMS).
Очевидно, что прогностические качества модели тем лучше, чем ниже значения оценок ошибок прогноза на ex post-выборке. Стоит заметить, что при существенном отклонении ME-характеристики от нуля у исследователя могут быть основания для констатации тенденций систематических завышений или занижений прогнозов, генерируемых моделью.
По причине зависимости абсолютных характеристик точности прогноза от масштаба измерений для такого диагностирования чаще предпочтительнее оказываются обобщающие относительные показатели оценки точности прогнозов.
Относительные показатели измерения ошибки прогноза
Данная группа показателей используется в двух целях:
выбор лучшей модели прогноза среди множества альтернатив;
сравнение прогнозных возможностей выбранного метода с эталоном.
Относительные ошибки прогноза позволяют не только констатировать наличие расхождений между прогнозными и фактическими данными измеряемых величин на ex post-выборке, но и рассчитывать долевое либо процентное значение ошибки к текущему уровню предсказываемой величины. Они не привязаны к масштабу измерений объекта исследования, что делает их более привлекательными при решении проблем сопоставления эффективности различных методов и моделей выработки прогнозов.
1) К индивидуальным мерам относительных ошибок относятся:
фактическая относительная ошибка прогноза для t-го наблюдения:
t yt yt yˆt ;
процентная ошибка прогноза для t-го наблюдения (PE):
~t |
|
|
|
yt yˆt |
|
|
100% . |
|
|
|
|
||||
|
|
||||||
|
|
yt |
|
|
|||
|
|
|
|
|
|
|
2) К усредненным мерам относительных ошибок прогноза на ex post-наборе наблюдений относятся:
средняя относительная ошибка прогноза (MPE):
|
n |
yt |
ˆ |
|
|
1n t 1 |
y |
yt ; |
|
|
|
|
t |
|
средняя абсолютного значения относительной ошибки прогноза (MAPE) (иногда называемая средняя абсолютная процентная ошибка):
|
~ |
|
|
1 |
n |
|
yt yˆt |
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
100% . |
|||||
n |
|
|
y |
|
||||||
|
|
|
|
t 1 |
|
|
|
|||
|
|
|
|
|
|
|
|
t |
|
|
Очевидно, что в ходе оценки качества прогноза в целом, исследователем анализируются характеристики и MPE, и MAPE. Значение MPE предпочтительнее для отслеживания систематических погрешностей моделигенератора (метода прогнозирования). Если данный критерий положительный, то модель постоянно выдает заниженные результаты; если наоборот – отрицательный, то модель переоценивает изучаемый показатель. Однако
заметим, что по близости значения MPE к нулю невозможно однозначно судить о качестве прогноза, можно лишь говорить о том, что выбранный метод прогноза является систематически смещенным либо несмещенным. В свою очередь MAPE критерий позволяет судить именно о величине относительной доли ошибки к уровню значений исходного ряда. Чем меньше значение MAPE, тем выше прогностические свойства соответствующей модели-генератора прогноза, по крайней мере, на ex post-выборке.
3) Среди относительных показателей качества прогноза особо выделяют так называемые коэффициенты несоответствия Тейла (Theil’s inequality coefficient, U-statistic) или просто коэффициенты Тейла. В литературе, посвященной вопросам оценки качества (точности) научных предсказаний можно найти несколько их модификаций. Приведем наиболее распространенные формы [10, с. 80-82].
|
|
|
|
|
n |
|
|
|
|
|
|
KT1 |
( yt yˆt )2 |
|
|
|
|||||
1). |
|
t 1 |
|
|
; |
|
||||
|
|
n |
|
|||||||
|
|
|
|
|
|
yt2 |
|
|
|
|
|
|
|
|
|
|
t 1 |
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
K 2 |
|
|
( yt yˆt )2 |
||||||
2). |
|
t 1 |
|
|
|
|
||||
|
yt2 |
yˆt2 ; |
||||||||
T |
|
|
|
|||||||
|
|
|
|
n |
|
n |
|
|
|
|
|
|
|
|
|
t 1 |
|
t 1 |
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
1 ( yt yˆt )2 |
||||
3). |
UT 3 |
|
|
|
|
n t 1 |
|
|
|
|
|
|
|
n |
|
|
n |
||||
|
|
|
|
1 yt2 |
|
1 yˆt2 . |
||||
|
|
|
|
|
n t 1 |
|
n t 1 |
|||
Все модификации коэффициентов несоответствия в основу расчета закладывают стандартизированную ошибку прогноза – SE (явно это видно на примере модификации 3), взвешивая ее различными способами.
При использовании любого из методов расчета коэффициента Тейла, чем он меньше и ближе к нулю, тем лучше прогноз и предсказательные характеристики модели, на которой он получен.
Общим в трактовке значений коэффициентов 1-3 являются следующее моменты:
они строятся на абсолютных значениях исследуемой величины;
они не могут принимать отрицательные значения;
близость или равенство 0 коэффициента означает близость или совпадения прогнозных значений с «идеальным» прогнозом, т.е. когда
yt yˆt , t 1,n .
Заметим, что значения 1 и 2-го коэффициентов не ограничены, в то время как построение 3-го предполагает разброс его оценок в интервале от 0 до 1. Очевидно, что близость последнего коэффициента к 1 соответствует ухудшению предсказательных свойств метода или модели прогноза.
Полезным на этапе подбора инструмента прогноза может оказаться расчет коэффициента Тейла в приростных характеристиках изучаемой величины. Поясним его конструкцию.
Пусть xt - фактический цепной темп прироста величины y на t-м
наблюдении, а xˆt - его оцененное прогнозное значение, таким образом:
xt 1 yt 1yt yt и xˆt 1 yˆt 1yt yt .
В этом случае величину U – статистики Тейла принято рассчитывать по формуле:
|
n 1 |
|
|
|
UT 2 |
(xˆt 1 xt 1 )2 |
|
|
|
t 1 |
|
. |
(4.58) |
|
|
n 1 |
|||
|
|
xt2 1 |
|
|
|
|
t 1 |
|
|
Особенность этого подхода становиться более очевидной при замене в формуле (4.58) приростных характеристик величины y на абсолютные значения ряда, то есть:
|
n 1 |
yˆ |
|
y y |
|
|
y 2 |
|
n 1 yˆ |
|
y |
|
|
2 |
||||||||||
|
|
|
t 1 |
|
t |
|
t 1 |
|
|
t |
|
|
|
t 1 |
|
t 1 |
|
|||||||
|
|
|
|
|
|
|
yt |
|
|
|
|
|
|
|
|
|
|
|
yt |
|
|
|
||
UT 2 |
t 1 |
|
|
|
|
|
|
|
|
|
|
|
|
t 1 |
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
. |
||
|
|
n 1 |
yt 1 yt |
|
2 |
|
|
n 1 |
|
|
|
|
2 |
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
yt 1 yt |
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
yt |
|
|
|
|
|
|
|
|
yt |
|
|
|
|
||||||
|
|
|
|
t 1 |
|
|
|
|
|
|
|
|
t 1 |
|
|
|
|
|
||||||
Отметим, что также как и в первых трех модификациях коэффициента несоответствия, в случае идеального прогноза значение U T 2 стремиться к 0.
Кроме того, заметим, что значение U – статистики станет равно 1, если
xˆt 1 0 , то есть |
xˆt 1 |
yˆt 1 yt |
0 , а, следовательно, прогнозируемое |
|
yt |
||||
|
|
|
||
значение величины |
y в точности совпадет с ее предыдущим уровнем. Такого |
|||
рода утверждение носит название «наивной» гипотезы прогноза.
Наивным, будем называть простейшее предположение относительно будущего состояния прогнозируемой величины у вида yˆt yt 1 или yˆt 1 yt .
Не трудно заметить, что критерий Тейла оцененный на формуле (4.58) не только позволяет ранжировать модели-генераторы прогноза по их априорной точности предсказания, но и дает простейшие советы относительно целесообразности предпочтения выбранных методов простейшему «наивному». В последнем случае суждения выносятся на основе следующих соображений:
если UT 1 - наивный прогноз не хуже более технически сложного;
если UT 1 - используемый метод прогнозирования дает результаты лучшие, чем наивный прогноз, чем меньше величина критерия, тем более качественно работает соответствующий метод;
