Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

эконометрика для очно-заочного 4 курс 2024-2025 год / 04-УП Базовый курс эконометрики (Писарева О.М., Черников Г.В.) 2024

.pdf
Скачиваний:
10
Добавлен:
19.01.2025
Размер:
1.65 Mб
Скачать

падает надежность таких обобщающих показателей качества модели, как F-статистика и значение коэффициента R2 .

Выявление АК в остатках модели, то есть в ряду e ( et yt yˆt , t , где t- индекс текущего наблюдения), укрупненно можно разделить на методы графического анализа и аналитические. Последние представляют собой тестирование статистических гипотез.

Величину автокорреляции можно оценить при помощи коэффициента автокорреляции первого порядка, который обозначим Ra . Это обычный коэффициент корреляции между двумя переменными: для первой t-е наблюдение есть et , а для второй - et 1 . По определению можем записать:

 

 

n

 

 

 

Ra

 

et et 1

,

(4.45)

n

n

 

 

t

2

 

 

 

 

et 2 et 12

 

 

 

 

t 2

t 2

 

 

Известно, что при большом числе наблюдений можно воспользоваться очевидным приближением формулы (4.45), а именно:

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

et

et 1

 

 

 

 

 

 

 

Ra

 

t 2

 

 

.

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

et

2

 

 

 

 

 

 

 

 

 

 

t 2

 

 

 

 

 

 

 

 

 

 

Тогда

при

отсутствии

автокорреляции -

Ra 0 ,

при

наличии полной

положительной

 

автокорреляции -

Ra

1,

при

полной

отрицательной

автокорреляции

- Ra 1.

Обычно

на

практике

Ra

принимает некоторое

промежуточное значение между -1 и 1, интерпретировать которое исследователь может в соответствии со своими представлениями. Однако дополнительно полезно проверить коэффициент на значимость.

Другим способом оценки автокорреляции служит критерий ДарбинаУотсона (Durbin-Watson test). Соответствующая статистика, обозначаемая DW , имеет вид:

 

n

 

 

 

 

 

 

(et

et 1 )2

 

DW

t 2

 

 

 

.

(4.46)

 

n

 

 

 

 

et

2

 

 

 

 

t 1

 

 

 

 

Проведем преобразование формулы (4.46), учитывая, что поскольку

n

 

n

 

et 1

2

et

2 en2 e12 ,

t 2

 

t 2

 

то при большом количестве наблюдений n можно предположить, что:

n

et 1

t 2

n

2 et 2 . t 2

Итак, получаем:

 

n

 

 

n

 

 

 

 

 

 

2 et 2

2 et

et 1

 

 

 

DW

t 2

 

t 2

 

2(1 Rа ).

(4.47)

 

n

 

 

 

 

 

et

2

 

 

 

 

 

 

 

t 1

 

 

 

 

 

 

 

Учитывая ограничения, накладываемые на возможные значения Ra,

можно сделать вывод о том, что, во-первых,

DW [0; 4].

Во-вторых, при

отсутствии

автокорреляции

DW 2 , при

полной

положительной

автокорреляцииDW 0 , а при полной отрицательной DW 4 .

 

В целом для статистики

DW существуют таблицы критических границ

(см. Приложение 5), позволяющие принять или отвергнуть гипотезу об отсутствии автокорреляции в ряду остатков.

Для заданного уровня значимости (q%), числа наблюдений n и известного числа параметров модели m в таблице DW -статистики приводятся значения

двух параметров: dL и dU.

 

 

 

 

 

 

Итак,

если 0 DW dL ,

то

принимается

гипотеза

о

положительной

автокорреляции остатков;

 

 

 

 

 

 

если

dU DW 4 dU ,

то

принимается

гипотеза

об отсутствии

автокорреляции остатков;

 

 

 

 

 

 

если

4 dL DW 4 ,

то

принимается гипотеза

об

отрицательной

автокорреляции остатков;

 

 

 

 

 

 

если dL DW dU или 4 dU DW 4 dL , то не существует статистических оснований принять или отвергнуть гипотезу об отсутствии автокорреляции.

В поледнем случае рекомендуется проверить попадание парного

коэффициента корреляции остатков в интервал 0 2

n .

Если коэффициент не превышает установленных границ, можно говорить

о его несущественности.

 

Иллюстрация интерпретации расчетного

значения DW -критерия

приводится на рисунке 4.6.

 

Положительная Не определена Автокорреляция отсутствует Не определена Отрицательная

0 dL dU 2 4-dU 4-dL 4

Рисунок 4.6 - Графическая иллюстрация граничных условий статистики Дарбина-Уотсона

Следует отметить некоторые особенности корректного использования DW-статистики.

Она позволяет тестировать в ряду остатков e наличие АК только 1-го порядка, то есть процесса типа AR(1): t t 1 t , где t - случайная составляющая, полностью отвечающая условиям Гаусса-Маркова. Исходная модель, генерирующая остатки e, должна содержать свободный член. Недопустимо применение DW -статистики в ситуациях, когда среди предикторов модели содержатся лаговые значения зависимой переменной.

В последнем случае рекомендуется использовать другие методы тестирования АК, например, h-статистику Дарбина. Ее значение может оцениваться с помощью формулы

sa2( y )

 

h ˆ

 

 

n

,

 

1

nsa2( y )

 

 

 

где ˆ

- оценка параметра в модели AR(1);

n - число наблюдений;

- оценка выборочной дисперсии коэффициента при соответствующей лаговой переменной в исходной регрессионной модели.

Доказано, что при больших объемах выборок h-статистика имеет распределение близкое к нормальному, то есть N(0, 1) .

Достоинство этого тестирования заключается в том, что расчетное значение h-статистики легко вычисляется на основе результатов исходного оценивания регрессии и с учетом того, что как следует из соотношения (4.47)

ˆ 1 0,5DW .

Очевидная проблема в использовании данного подхода связана с тем, что вычисление h-статистики не всегда возможно.

Для обнаружения в ряду остатков автокорреляционных связей более высоких порядков могут использоваться специальные тесты «пакетного» тестирования (portmanteau tests). Поробнеее эти критерии представленны в работе [].

При обнаружении значительной автокорреляции в первую очередь следует уточнить спецификацию модели и исключить наличие эрзацавтокорреляции. Возможно, из числа независимых переменных выпал какой-то существенный фактор или принят неправильный вид функции f(x). Можно в случае обнаружения сильной автокорреляции остатков в число независимых переменных попытаться включить переменную времени. Если изменения в спецификации модели не приносят ожидаемых эффектов, вероятно исследователь имеет дело с эффектом чистой АК. В этой ситуации рекомендуется воспользоваться специально разработанными в эконометрике поправочными процедурами и методами, например, ОМНК, методы КокранаОркатта, Хилдрета-Лу, Дарбина и др. [1, 2, 11, 12-16].

Проблематичность эффективного использования МНК в случае наличия у остатков модели эффектов автокоррелированности (аналогично их гетероскедастичности) обусловлена «нарушениями» требований на структуру матрицы ковариаций случайных компонент. В этой связи, как и в случае наличия в остатках эффекта гетероскедастичности в ситуации АК, также уместно применение обобщенный метод наименьших квадратов (GLS).

Поясним практические приёмы его использования.

m

Допустим, что в модели yt a0 xtj aj et (4.48) в остаточной

j 1

компоненте e тестируется АК первого порядка, причём t 1, T .

Покажем, что путём допустимых преобразований уравнение (4.48) можно получить уравнение, допускающее для оценивания его параметров МНК (OLS). Для этого введём новые переменные, полученные на основе исходного статистического материала:

yt

yt

yt 1

 

xtj

xtj xt 1 j

(4.49)

a0

a0

a0

 

t

et

et 1

 

где - коэффициент автокорреляции первого порядка (параметр линейной модели (4.44)).

Тогда на основе (4.48) можем записать квазиразностное уравнение вида (GLS-уравнение):

 

 

m

 

yt

a0

xtj aj t ,

(4.50)

j 1

где t - случайная составляющая, отвечающая условиям Гаусса-Маркова. Уравнение (4.50) может быть идентифицировано с помощью МНК.

Однако прежде, чем воспользоваться предложенной схемой стоит обратить внимание на следующие факты.

1). За счёт перехода к новым переменным формально для оцифровки параметров уравнения (4.50) по сравнению с (4.48) потеряно одно уравнение (t 2, T ). Таким образом, при небольшом числе наблюдений этот подход следует использовать осмотрительно. Для нивелировки этой проблемы рекомендуется добавлять в систему, соответствующую (4.50), первое уравнение релевантное первому уравнению системы (4.48), умножив его левую и правую

части на так

называемую поправку Прейса-Уинстена

(Prais, Winsten) –

( 1 2

) [4].

 

 

 

В

этом

случае

«потерянное» наблюдение будет

восстановлено как:

y1 y1

1 2 ; x1 j x1 j

1 2 .

 

2). Работа в новых переменных требует знание коэффициент автокорреляции -, который обычно не известен. Его рекомендуется оценить, исходя их ранее полученного равенства (4.47), т.е. ˆ 1 0,5DW .

Как показывает практика довольно точная оценка коэффициент автокорреляции, а следовательно, параметров модели может достигаться на основе итеративного метода Кокрана-Оркатта (Cochran-Orcutt iterative method).

Здесь в качестве примера приведем процедуру преобразований Кокрана-

Оркатта для простейшей зависимости вида:

 

y a0 ax .

(4.51)

Предположим, в остатках модели имеет место АК первого порядка. Для начала сделаем предварительные преобразования.

Пусть соседние значения нашей модели формируются следующим образом:

yt a0 axt t ,

yt 1 a0 axt 1 t 1 .

Вычтем из первого соотношения второе, предварительно умножив его на. Получим следующее соотношение:

yt yt 1 a0 (1 ) a(xt xt 1 ) t t 1 .

Введем новые обозначения, пусть

~

yt yt 1 ,

yt

~

xt xt xt 1

~

a0 (1 ) , тогда

~ ~

~

a

yt a0

axt t t 1 .

Наличие в остатках процесса типа AK(1) означает:

(4.52)

t t 1 t ,

где t - случайная составляющая, полностью отвечающая условиям Гаусса-

~ ~ ~

Маркова. Тогда, верно, следующее соотношение yt a0 xt t .

В этом случае оценку параметров a0 и a можно провести с помощью итеративной процедуры Кокрана-Оркатта, которая включает следующие шаги.

1) На исходной статистике оцениваем параметры модели (4.51).

2) Вычисляем остатки модели, то есть вектор с компонентами et yt yˆt , t.

3)На полученной статистике оцениваем параметр ρ уравнения регрессии

t t 1 t .

4)С учетом соотношений (4.52) преобразуем исходные статистики и

корректируем параметры a0 и a , принимая во внимание полученное на шаге 3

значение ˆ .

5)Вычисляем остатки модели (4.51).

6)Возврат к шагу 3 процедуры.

Процедура продолжается до достижения, заданной допустимой величины расхождений величин на соседних итерациях.

4.5. ПРОГНОЗИРОВАНИЕ И ОЦЕНКА ТОЧНОСТИ ПРЕДСКАЗАНИЙ НА МОДЕЛИ

МНОГОФАКТОРНОЙ РЕГРЕССИИ

Важнейшая задача эконометрики – разработка надёжного инструментария для проведения прогностических исследований в экономике и бизнесе. Подробно с методологией и понятийной базой современного социально-экономического и бизнес-прогнозирования можно ознакомиться в работах [9, 13, 16]. Прогноз – это научно обоснованное вероятностное суждение

осостоянии системы или процесса в новых условиях функционирования и/или

опутях и методах достижения этих новых координат. Специфика эконометрического прогноза заключается в том, что прогнозная информация генерируется на основе эконометрических методов или моделей, исходя из фактической информационной базы и предположения о наличии свойства инерционности у изучаемых процессов и явлений.

2.5.1.Построение интервальных прогнозов на основе факторных моделей

Основные этапы в построении безусловных ex ante-прогнозов (новых)

зависимой переменной y на основе факторной регрессионной модели могут быть представлены стандартной последовательностью шагов. Она состоит в следующих действиях.

а) Вне рамок модели получают прогноз значений всех предопределенных переменных. В дальнейшем вектор прогнозных значений предопределенных переменных обозначим как хр..

б) Исходя из результатов оценки уравнения регрессии (4.4), осуществляется точечный прогноз вероятного ожидаемого значения зависимой переменной y при подаче на вход факторной модели детерминированных значений вектора хр, следовательно:

y(x P ) a0 (x P )T a .

в) С заданной надежностью на полученной регрессионной модели строится доверительный интервал прогноза зависимой переменной yˆ(x p ) .

Остановимся подробнее на проблеме количественного оценивания доверительного интервала прогноза. Его построение существенно зависит и

определяется свойствами распределения случайных отклонений ряда y, то есть условиями Гаусса-Маркова, а также свойствами оценок коэффициентов уравнения регрессии.

Величина фактической ошибки прогноза, то есть eˆ y yˆ(x p ) , в любой точке упреждения x p ( x p (t) ) имеет нормальный или близкий к нормальному закон распределения. Используя условия Гаусса-Маркова, нетрудно показать, что ожидаемое значение ошибки прогноза составит:

M [eˆ] 0 ,

а дисперсия ошибки прогноза:

D f [eˆ] Dy Dyˆ(x p ) 2 Dyˆ(x p ) ,

где x p – прогноз факторов модели, в том числе может быть зависимых от времени.

Следовательно, для получения удовлетворительного интервального прогноза искомой величины y для ex ante-условий, необходимо рассчитать дисперсию ошибки прогноза D f , которая будет складываться из дисперсии случайной - D (или Dy 2 ) и дисперсии Dyˆ (или Dyˆ(x p ) ), привносимой моделью регрессии. Последняя является следствием того, что параметры эконометрической модели носят статистически случайный характер.

Таким образом, D f Dy

D , т.е.

разброс ошибок прогноза

будет

определяться двумя случайными величинами:

 

разбросом модельного

значения

yˆ(xP ) из-за ошибок

оценок

коэффициентов регрессии по отношению к ее истинным значениям;

 

отклонением i , присущим ряду величины y .

Исходя из этого, можно записать значение стандартной ошибки прогноза, которая является мерой оценки разброса ожидаемых будущих значений

величины y относительно ЛММР, которая составит s f s y2ˆ s 2 .

Напомним, что величина среднеквадратической ошибки ряда оценивается по формуле:

 

 

n

yˆi 2

 

s

yi

 

i 1

 

,

 

 

 

 

 

 

 

где

yˆ i - модельное значение переменной величины y ;

yi

- фактическое значение величины y ;

n – объем выборки оценивания;

- число степеней свободы33, исходящее из величины выборки (n) оценивания

иобщего количества факторов регрессионной модели (m).

Окончательно, искомый интервальный прогноз ( y) можно определить как

 

ˆ

p

) ) плюс-минус среднеквадратическая ошибка прогноза

точечный прогноз ( y(x

 

( s f

), умноженная на t-статистику Стьюдента с заданным уровнем значимости

( )

и соответствующим числом степеней свободы ( ) . Иллюстрация

оцениваемых интервалов для = 0.05 приводится на рисунке 4.7.

Таким образом,

 

y yˆ(x p ) t / 2 ( )s f .

(4.53)

33 Напомним, что число степеней свободы определяется разницей между количеством наблюдений, на основе которых проводится вычисление соответствующей статистической оценки, и количеством параметров, оцениваемых в ходе в вычислений. Так для вышеупомянутого случая вычисления стандартной ошибки число степеней свободы составит = (N-m).