
- •Компьютерные технологии решения эконометрических задач
- •Оглавление
- •Глава V. Временные ряды ……………………..……………………………….. 84
- •Предисловие
- •Глава I парная линейная регрессия
- •1.1. Основные теоретические сведения
- •Реализация задания на компьютере с помощью ппп Ехсеl
- •Контрольные задания
- •Вариант 1.1
- •Вариант 1.2
- •Вариант 1.3
- •Вариант 1.4
- •Вариант 1.5
- •Вариант 2.1
- •Вариант 2.2
- •Вариант 2.3
- •Вариант 2.4
- •Вариант 2.5
- •Вариант 3.1
- •Вариант 3.2
- •Вариант 3.3
- •Вариант 3.4
- •Вариант 3.5
- •Вариант 4.1 (Центральный регион)
- •Вариант 4.2 (Волго-Вятский регион)
- •Вариант 4.3 (Поволжский регион)
- •Вариант 4.4 (Северный и Северозападный регионы)
- •Вариант 4.5 (Дальневосточный регион)
- •Вариант 5.1 (Центральный регион)
- •Вариант 5.2 (Волго-Вятский регион)
- •Вариант 5.3 (Поволжский регион)
- •Вариант 5.4 (Северный и Северозападный регионы)
- •Вариант 5.5 (Дальневосточный регион)
- •Вариант 6.1 (Центральный регион)
- •Вариант 6.2 (Волго-Вятский регион)
- •Вариант 6.3 (Поволжский регион)
- •Вариант 6.4 (Северный и Северозападный регионы)
- •Вариант 6.5 (Дальневосточный регион)
- •Вариант 7.1 (Центральный регион)
- •Вариант 7.2 (Волго-Вятский регион)
- •Вариант 7.3 (Поволжский регион)
- •Вариант 7.4 (Северный и Северозападный регионы)
- •Вариант 7.5 (Дальневосточный регион)
- •Вопросы для подготовки к защите индивидуального задания
- •Глава II множественная линейная регрессии
- •2.1. Основные теоретические сведения
- •Для проверки статистической значимости коэффициентов регрессии используется случайная величина
- •2.2. Реализация задания на компьютере с помощью ппп Ехсеl
- •Контрольные задания
- •Вариант 1.1
- •Вариант 1.2
- •Вариант 1.3
- •Вариант 1.4
- •Вариант 1.5
- •Вопросы для подготовки к защите индивидуального задания
- •Глава III нелинейная регрессия
- •3.1. Основные теоретические сведения
- •3.2. Реализация задания на компьютере с помощью ппп Excel
- •Вопросы для подготовки к защите индивидуального задания
- •Глава IV нарушение предпосылок мнк и их корректировка
- •4.1. Основные теоретические сведения
- •Гетероскедастичность
- •Автокорреляция.
- •Мультиколлинеарность.
- •4.2. Реализация задания на компьютере с помощью ппп Ехсеl
- •4.2.1. Проверка наличия гетероскедастичности
- •4.2.2. Проверка наличия мультиколлинеарности
- •4.2.3. Проверка наличия автокорреляции
- •Вопросы для подготовки к защите индивидуального задания
- •Глава V временные ряды
- •5.1. Основные теоретические сведения
- •5.1.1. Основные понятия и определения
- •Этапы построения прогноза по временным рядам
- •5.2. Реализация задания на компьютере с помощью ппп Ехсеl
- •Контрольные задания
- •Вопросы для подготовки к защите индивидуального задания
- •Литература
- •Приложения
- •Ссылки и массивы
Этапы построения прогноза по временным рядам
Основные этапы:
- предварительный анализ данных;
- построение моделей временных рядов;
- оценка качества моделей;
- построение точечного и интервального прогнозов.
Кратко рассмотрим основные особенности выполнения этих этапов.
Предварительный анализ данных.
К процедурам предварительного анализа данных относятся:
- выявление аномальных наблюдений;
- проверка наличия тренда;
- сглаживание временных рядов;
- расчет показателей динамики экономических процессов.
Выявление аномальных наблюдений.
Так как наличие аномальных наблюдений приводит к искажению результатов моделирования, то необходимо убедиться в отсутствии аномальных данных. Для выявления аномальных уровней можно использовать метод Ирвина.
Для
всех или только для подозреваемых в
аномальности наблюдений вычисляется
величина
:
,
(5.3)
где
.
Если расчетная величина превышает табличное значение (см. Приложение 3), то уровень yt считается аномальным. После выявления аномальных уровней необходимо определить причины их возникновения. Если они вызваны ошибками технического порядка, то они заменяются расчетными значениями (самый простой способ: среднее значение двух соседних уровней).
Ошибки, возникающие из-за воздействия факторов, имеющих объективный характер, например скачек курса доллара, падение курса ценных бумаг на фондовом рынке или значительные изменения сезонной составляющей и др., устранению не подлежат.
Проверка наличия тренда.
Тенденцию среднего визуально можно определить из графика исходных данных. Но это не всегда очевидно.
Для выявления наличия тенденции разработано множество достаточно простых критериев, основанных на корреляции рангов, поворотных точках и т.д., однако наиболее надежные результаты получаются в результате проверки разности средних уровней ряда.
Сравнение средних уровней ряда.
Алгоритм метода разности средних уровней имеет следующую последовательность:
Временной ряд разбивается на две примерно равные по числу уровней части n1 и n2 , каждая из которых рассматривается как самостоятельная выборка:
,
, где n = n1 + n2 .
По каждой из частных выборок выполняется оценка средних:
,
.
(5.4)
Проверяется гипотеза о равенстве средних:
Н0
:
=
,
Н1
:
.
В рамках гипотезы нормального распределения разности - проверка ее статистической значимости для малого объема выборки выполняется при помощи t-статистики Стьюдента:
(5.5)
где
,
(5.6)
.
(5.7)
Если
,
то нулевая гипотеза отвергается в пользу
альтернативной гипотезы, т.е. тренд
присутствует. Здесь tкр–
критическое значение, полученное по
распределению Стьюдента при количестве
степеней свободы
=
n
– 2 и заданной вероятности
/2.
Следует
заметить, что соотношение (5.5) справедливо,
если выполняется предположение о
несущественном различии дисперсий
частных выборок, т.е.
.
Поэтому предварительно
необходимо проверить это предположение
с помощью F-критерия
Фишера. Для вычисления F-критерия
большую дисперсию делим на меньшую
(пусть, например,
):
,
(5.8)
и
сравниваем с Fкр(
.
Если Fнабл
> Fкр,
то гипотеза о несущественном различии
значений дисперсий уровней ряда в
частных выборках отвергается, и метод
разности средних уровней не может быть
применен. В этом случае можно воспользоваться
автокорреляционной функцией, которая
будет описана ниже.
3. Сглаживание временных рядов.
Сглаживание – замена фактических уровней расчетными значениями, что способствует более четкому проявлению тенденции ряда. Методы сглаживания позволяют устранить аномальные явления и выявить тенденцию развития (тренд).
Методы сглаживания (фильтрации) делятся на две группы:
- аналитические методы;
- методы механического сглаживания.
Аналитические методы.
Сглаживание (выравнивание) уровней временного ряда выполняется при помощи специально подобранных функций (тренда), описывающих закономерности развития во времени исследуемых экономических явлений. Выбор той или иной функции в качестве тренда является наиболее важным этапом анализа временного ряда, так как ошибка на данном этапе приводит к очень серьезным последствиям, особенно при прогнозировании уровней ряда.
Для построения трендов чаще всего применяются следующие функции:
-
линейный тренд
;
-
гипербола
;
-
экспоненциальный тренд
;
-
тренд в форме степенной функции
;
-
парабола второго и более высоких порядков
.
Параметры каждого тренда определяются с помощью обычного МНК. Для нелинейных трендов предварительно проводят стандартную процедуру их линеаризации.
Выбор
наилучшего уравнения тренда можно
осуществить путем перебора основных
форм тренда, расчета по каждому уравнению
скорректированного коэффициента
детерминации
и
отбора уравнения с его максимальным
значением.
Методы механического сглаживания.
Сглаживается каждый отдельный уровень ряда с использованием фактических значений соседних с ним уровней. Для сглаживания часто используют методы простой и взвешенной скользящей средней.
Метод простой скользящей средней. Для каждого текущего значения yt можно рассчитать среднее значение по некоторому интервалу (интервал сглаживания), включающему m < n последовательных членов ряда:
,
(5.9)
где m – количество наблюдений, входящих в интервал сглаживания; р - количество наблюдений, стоящих по разные стороны от сглаживаемого.
При нечетном m значение параметра р вычисляется следующим образом:
.
Первым
сглаженным будет наблюдение
t
, где t
= p+1.
Интервал сглаживания сдвигается на один член вправо, и по формуле (5.9) находится сглаженное значение для (t + 1)-го наблюдения. Затем снова производится сдвиг и т.д.
Обычно при практических расчетах длина интервала сглаживания принимается равной 3, 5, 7. При наличии сезонной компоненты во временном ряду длина интервала должна быть согласована с периодом колебаний, который, как правило, является четным (4, 12). В этом случае добавляется один ряд, но крайние уровни используются с коэффициентами 1/2, т.е. весовые коэффициенты при этом будут:
(1/2, 1, 1, 1, 1/2) для квартальных данных;
(1/2, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1/2) для месячных данных.
Метод взвешенной скользящей средней. Метод простой скользящей средней можно использовать, если тенденция напоминает прямую линию. Однако когда тренд выравниваемого ряда имеет изгибы и к тому же желательно сохранить мелкие волны предпочтительнее использовать метод взвешенной скользящей средней. В этом методе каждому уровню ряда в пределах интервала сглаживания приписывается вес, зависящий от расстояний от члена ряда до середины интервала сглаживания.
Если сглаживания осуществляется полиномами второго или третьего порядка, то их весовые коэффициенты будут следующими:
Таблица 5.1
Длина интервала сглаживания (m) |
Весовые коэффициенты |
m=5 |
1/35(-3, 12, 17, 12, -3) |
m=7 |
1/21(-2, 3, 6, 7, 6, 3, -2) |
m=9 |
1/231(-21, 14, 39, 54, 59, 54, 39, 14, -21) |
4. Расчет показателей динамики экономических процессов.
Для характеристики динамики изменения экономических показателей используется автокорреляционная функция.
Степень
тесноты статистической связи между
уровнями временного ряда, сдвинутыми
на
единиц
времени, определяется величиной
коэффициента автокорреляции
.
При этом
-
длину временного смещения называют
обычно лагом.
Коэффициент автокорреляции вычисляется
по формуле:
,
(5.10)
где
yt
– исходный временной ряд;
- исходный ряд,
сдвинутый на
шагов
по времени;
-
стандартные ошибки этих рядов.
Пример.
Имеются условные данные о средних
расходах на конечное потребление yt
(д.е.) за 8 лет. Необходимо определить
коэффициент автокорреляции
.
Исходный и сдвинутый на 2 лага ряды
представлены в таблице 5.2.
Таблица 5.2
t |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
yt |
7 |
8 |
8 |
10 |
11 |
12 |
14 |
16 |
yt-2 |
- |
- |
7 |
8 |
8 |
10 |
11 |
12 |
Коэффициент вычисляется по формуле (5.10) для рядов, выделенных в таблице: = 0,973.
Следует заметить, что с увеличением лага число пар уровней уменьшается. Для обеспечения статистической достоверности коэффициентов автокорреляции рекомендуется максимальный лаг не больше n/4.
Последовательность коэффициентов автокорреляции уровней первого, второго и т.д. порядков называется автокорреляционной функцией временного ряда. График зависимости ее значений от величины лага, называется коррелограммой.
Если наиболее высоким оказался коэффициент первого порядка, то исследуемый ряд содержит только тенденцию. Если наиболее высоким оказался коэффициент порядка , то ряд содержит циклические колебания с периодичностью в моментов времени. Если ни один из коэффициентов не является значимым, то можно сделать предположение относительно структуры этого ряда: либо ряд не содержит тенденции и циклических колебаний, либо ряд содержит сильную нелинейную тенденцию, для выявления которой необходимо провести дополнительный анализ.
Построение моделей временных рядов.
Если временной ряд не содержит сезонной компоненты, то модель тренда практически уже сформирована на предварительном этапе анализа исходной информации. Аналитическая модель процесса выбирается путем выбора наилучшей формы тренда, в смысле ее статистических характеристик. Параметры модели определяются с помощью МНК.
Здесь рассмотрим моделирование экономических процессов, подверженных сезонным колебаниям.
1 Подход. Расчет значений сезонной компоненты методом скользящей средней.
Как было отмечено ранее, эти модели могут быть представлены в аддитивной форме:
Y = F + S + E (5.11)
и мультипликативной форме:
(5.12)
Процесс построения модели включает следующие шаги:
Шаг 1. Выравнивание исходного ряда методом скользящей средней.
Шаг 2. Расчет значений сезонной компоненты S.
Шаг
3. Устранение
сезонной компоненты из исходных уровней
ряда и получение выровненных значений
(F
+ E)
– в аддитивной модели, или (
)
- в мультипликативной модели.
Шаг 4. Аналитическое выравнивание уровней (F + E) или ( ) и расчет значений F с использованием полученного уравнения тренда.
Шаг
5. Расчет
полученных по модели значений (F
+ S)
или (
).
Шаг 6. Расчет ошибок.
2 Подход. Применение фиктивных переменных для моделирования сезонных колебаний.
Для моделирования сезонных колебаний могут быть использованы фиктивные переменные. Количество фиктивных переменных должно быть на единицу меньше, чем число моментов времени внутри одного цикла колебаний. Например число кварталов внутри одного года k = 4, значит фиктивных переменных должно быть три: х1, х2, х3, и модель будет:
,
(5.13)
где
тренд – линейный:
.
Если тренд нелинейный, например парабола, то уравнение модели будет следующим:
(5.14)
Следует напомнить, что фиктивные переменные могут принимать значения 0 или 1.
Оценка качества моделей.
Основным критерием, характеризующим адекватность модели, является коэффициент детерминации R2. Кроме того, в статистическом анализе известно большое число характеристик точности. Наиболее часто, кроме среднеквадратического отклонения, используются:
максимальная по абсолютной величине ошибка
;
относительная максимальная ошибка
;
средняя по модулю ошибка
;
средняя по модулю относительная ошибка
.
Эти показатели дают представление об абсолютной величине ошибки модели и о доле ошибки в процентном отношении к среднему значению результативного признака. Лучшей по точности считается та модель, у которой все перечисленные характеристики имеют меньшую величину.
Построение точечного и интервального прогнозов.
Точечный прогноз для временных моделей получается подстановкой в модель соответствующего фактора времени, т.е. t = n+1, n+2, …, n+k, где k – период упреждения.
Точное совпадение фактических данных и прогностических точечных оценок, полученных путем экстраполяции, имеет малую вероятность.
Интервальный прогноз строится на основе точечного прогноза. При построении доверительного интервала используется ошибка прогноза, вычисляемая по формуле:
,
(5.15)
,
(5.16)
где
S
– стандартная ошибка; n
- p
– число степеней свободы; р
– количество коэффициентов тренда;
-
критическая точка распределения
Стьюдента.
Доверительный интервал прогноза будет иметь следующие границы:
упрогн(n+k) + U(k) (верхняя граница);
упрогн(n+k) - U(k) (нижняя граница).
Если
построенная модель адекватна, то с
выбранной пользователем вероятностью
(
)
можно утверждать, что при сохранении
сложившихся закономерностей развития
прогнозируемая величина попадет в этот
интервал.