- •Раздел I Анализ невременных данных
- •Характеристики случайной величины
- •Математическое ожидание с.В. X.
- •Дисперсия
- •Корреляция.
- •Медиана
- •Модель парной линейной регрессии
- •Теорема Гаусса-Маркова
- •Ковариационная матрица
- •Дисперсионный анализ
- •Модель множественной регрессии
- •Спецификация модели
- •Включение в модель несущественных параметров.
- •Dummy – переменные, фиктивные переменные
- •Интерпретация коэффициентов:
- •Прогнозирование
- •Выбор параметров линейной регрессии (процедура пошагового отбора)
- •Работа с процедурными значениями
- •Общая методика построения регрессионного уравнения
- •Раздел II
- •Коэффициент взаимной сопряженности Чупрова
- •Биссериальный коэффициент корреляции
- •Ранговые коэффициенты корреляции
- •Коэффициент корреляции Спирмена
- •Общая схема проверки гипотез
- •Структура международных маркетинговых исследований
- •Временные ряды
- •Временной или динамический ряд
- •Классификация временных рядов
- •Анализ трендовой составляющей
- •Метод, основанный на медиане или медианный критерий
- •Корреляция во времени
- •Анализ сезонности во временных рядах
- •Анализ автокорреляции
- •Выбросы и структурные изменения
- •Дискретные зависимые переменные
- •Решение проблемы
Корреляция во времени
При моделировании временных рядов часто приходится учитывать корреляцию во времени, т.е.зависимость от прошлых значений. При моделировании временного ряда с автокорреляцией случайные остатки не будут близки к нормальным. Т.е.не выполнится основное требование теоремы Гаусса-Маркова, т.е.для такой модели полученные оценки коэффициентов не будут стремится к истинным значениям, т.е.прогноз, полученный по такой модели будет слишком оптимистичным.
Для учета зависимости
от прошлых значений используют оператор
сдвига
Для того, чтобы найти зависимость между текущим значением и значением на 1 шаг назад по времени, рассматривают коэффициент корреляции между исходным рядом и . Например: ряд выглядит следующим образом:
=
=
Если необходимо
определить связь между текущим значением
и значением 2 шага во времени назад, то
рассматривается коэффициент корреляции
между
и
По аналогии
находится зависимость от более дальних
шагов по времени.
Анализ сезонности во временных рядах
Существует несколько основных методов выделения сезонных и циклических колебаний. К ним относятся:
1.Рассчет сезонной компоненты и построение аддитивной или мультипликативной модели временного ряда. Рассчитывается либо сезонная средняя либо индекс сезонности.
аддитивная модель
коммуникативная модель
2.Анализ сезонности с помощью автокорреляционной функции.
Уt |
7 |
30 |
|
|
|
Y1 |
. |
|
Y2 |
. |
|
Y3 |
. |
|
Y4 |
. |
|
Y5 |
. |
|
Y6 |
. |
|
Y7 |
. |
|
Y8 |
Y1 |
|
Y9 |
Y2 |
|
3.Моделирование с помощью рядов Фурье.
При этом подходе строится зависимость (т.е.регрессионная модель), в которой в качестве характеристик сезонности включается пара sin и cos, характеризующая свои определенные периоды. В данном случае сезонная составляющая представляет собой:
- период сезонности.
Например. Если Тк=30 дням, то выявлена ежемесячная сезонность
- случайная ошибка
В этой модели
неизвестными являются параметры, которые
находятся с помощью МНК, но для того,
чтобы оценки были близки к истинным
значениям, необходимо выполнение тех
же условий, что и для модели линейной
регрессии, а именно
N – нормальное распределены.
Пример. По выборке о динамике урожайности зерновых культур, в одном из частных хозяйств была построена следующая трендовая модель
остатки
оказались не близки к нормальным и их
средняя была далеко от 0. Поскольку
график остатков явно содержал сезонные
составляющие, то для остатков была
построена модель сезонных составляющих
с помощью ряда Фурье (Microsoft
Excel)
После построения модели оказалось близко к нормальному распределению, а их МО стало близко к 0.
Замечание. Так как большое количество параметров усложняет модель, делает ее сложно применимой и требует большого количества наблюдений, то при анализе сезонности необходимо выбрать основные значимые составляющие, т.е.выбрать только основные периоды сезонности (не больше 4-х периодов). Если вы выбрали 4 периода, то в модель включаются 4 пары sin и cos по одной паре на каждый период.
Пример. На основании данных «Сибнефть» был получен ряд котировок.
03.01.02 – 09.07.03
Но проводя анализ остатков было выяснено, что они не близки к нормальным, а их графический (визуальный) анализ позволил получить наличие сезонности. Дальнейший анализ выявил следующую сезонность. Оценки коэффициентов получены в Excel путем построения многомерной регрессии на соответствующие пары sin и cos.
из всех периодов сезонности были выбраны 2 самых значимых (162 и 109)
Т.к.оценивание производится с помощью Excel – Пакет анализ Регрессия, то по таблице итогов было видно, что все коэффициенты значимы, R2 – высокий, а сами выбранные периоды имели экономический смысл:
1-ый период:
=109
дней 4 месяца
1/3 года
2-ой период:
=162
дня полгода.
Замечание 1. Если после построения регрессии на sin и cos из пары синуса и косинуса значима только одна составляющая, то в модель все равно включают пару.
Замечание 2. Основная сложность этого метода состоит в определении значимых периодов. Существует множество различных критериев для определения значимых периодов. Один из самых простых критериев состоит в следующем: выписываются все логически значимые периоды, исходя из сущности…
Т.е.строится множество пар синусов и косинусов (порядка 10-15), а дальше, строя на них регрессию, исходя из значимости коэффициентов, максимизации R2 и R2 нормированных, устраняют лишние (незначимые) пары синусов и косинусов.
Использование сезонных фиктивных компонент при моделировании сезонных колебаний
При этом подходе строится регрессионная модель, в которую помимо факторов времени включают сезонные фиктивные переменные. Каждому из сезонов соответствует определенное сочетание фиктивных переменных, а 1 из сезонов за базовый.
Например. Если имеются поквартальные данные, то вводятся 3 новые фиктивные переменные. 1-ый квартал считается за базовый.
N |
Yt |
D2 |
D3 |
D4 |
1 |
Y1 |
0 |
0 |
0 |
2 |
Y2 |
1 |
0 |
0 |
3 |
Y3 |
0 |
1 |
0 |
4 |
Y4 |
0 |
0 |
0 |
5 |
Y5 |
0 |
0 |
1 |
6 |
Y6 |
1 |
0 |
0 |
a0,a1,a2,b1,b2,b3 – коэффициенты, полученные МНК
a0+b1 – коэффициент, характеризующий изменение 2-го квартала по сравнению с 1-м.
a0+b2 - коэффициент, характеризующий изменение 3-го квартала по сравнению с 1-м.
a0+b3 - коэффициент, характеризующий изменение 3-го квартала по сравнению с 1-м.
Если коэффициент перед сезонной фиктивной переменной больше 0, то по сравнению с 1-ым кварталом был прирост.
Если же bi <0, то был спад по сравнению с 1-ым кварталом.
b1,b2,b3 могут иметь разные знаки.
Этот метод удобен для выявления явных простых сезонностей (квартальная, годовая зависимость), но с помощью него не удастся выявить сложную зависимость.
