Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
BBA_Информатика 1+2.docx
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
2.56 Mб
Скачать

Расчет регрессии для одной переменной

Сделаем с помощью функции =ЛИНЕЙН(...) расчет коэффициентов регрессии для каждой из переменных по отдельности.

Обратите внимание на качество прогноза (коэффициент детерминированности R2).

Наибольший он у переменной Х2:  R2=0.413.

Построим для каждой переменной график Y(Xn)  и добавим линию тренда с уравнением и коэффициентом детерминированности R2.

Проверьте соответствие результатов, выданных функцией =ЛИНЕЙН(...) и параметров тренда.

Как соотносятся коэффициенты детерминированности R2 для прогнозов по одной и по трем переменным?

Общий результат: качество прогноза ухудшилось!

Авторегрессионная модель сезонных колебаний.

В этой модели для описания сезонных колебаний с трендом используется множественная регрессия с двумя переменными. В качестве переменных используется время t и сами значения временного ряда Yi, сдвинутые на L временных отрезков вперед (L – период повторения ситуации). Смысл такого сдвига состоит в том, что значения Y1 в первом временном отрезке определяют значения YL+1 в первом отрезке следующего года, Y2 определяет Y L+2 и т.д. То есть значения показателя в некотором временном отрезке следующего года сильнее всего связано со значением показателя в соответствующем отрезке прошлого года.

В этом случае прогноз можно представить следующей математической моделью

F= my*Yt-L + mt *t + b0

В этом случае часть mt *t + b0 описывает некоторую базовую линию тренда, если тренд есть, а коэффициент my управляет дополнительными изменениями, вызванными влиянием самого показателя Yi в соответствующие моменты в прошлом на его значения в данный момент времени.

Величина сдвига (в данном случае L отрезков) определяется величиной периода сезхонных колебаний. Например, для ежемесячных данных (годовой цикл), это может быть сдвиг на 12 месяцев или на 4 квартала, а для ежедневных – на семь дней (недельный цикл).

Миникейс: Розничные продажи сша

В файле US Retail.xls приведены статистические данные сайта www.census.gov о розничных продажах в США с 1967 по 2009 годы1. Нетрудно видеть, что в этой 50-летней истории были периоды спокойного роста, обычно не превышающие 5-7 лет. Были и переломные годы, которые несложно сопоставить с известными экономическими кризисами.

Выберем спокойный предкризисный участок 1992-98 годы.

Розничные продажи США – анализ: Авторегрессионная модель.

Повторяющиеся резкие изменения уровня продаж свидетельствуют о существенной сезонности в данных, поэтому требуется использовать такую модель прогноза, в которой хорошо отражено влияние сезонного фактора. Постоянство сезонного фактора не вполне ясно, поэтому можно использовать и авторегрессионую модель и модель с ранговыми переменными и постфактум выбрать лучшую.

Лист «АРМ 92-98».

Высокий уровень коэффициента детерминированности (0.978) говорит о неплохом качестве прогноза.

Проверим результат по графику.

Стандартное отклонение для ряда остатков s=3.94. Отметим это число для сравнения с результатом модели с ранговыми переменными.

Заметим, что эта очень простая модель дает весьма неплохой результат.

Аддитивная модель сезонных колебаний с трендом

(Модель множественной регрессии с ранговыми переменными)

Если имеющиеся данные демонстрируют сезонные колебания с примерно одинаковой амплитудой на фоне линейного тренда - применима аддитивная модель декомпозиции временного ряда. Тогда для прогноза на следующий год можно использовать модель множественной регрессии с ранговыми переменными.

Введем переменные S1, S2, … SL-1 так, что

  • S1 равна 1 в 1-ом временном отрезке каждого года и нулю во всех остальных;

  • S2 равна 1 во 2-ом отрезке каждого года и нулю во всех остальных;

  • SL-1 равна 1 в L-1-ом отрезке каждого года и нулю во всех остальных.

Тогда прогноз можно представить следующей математической моделью

F= b1*S1 + b2*S2 + …. + bL-1*SL-1 + bt*t + b0

В этом случае часть bt*t + b0 описывает базовую линию тренда (данные L-го временного отрезка), а коэффициенты bL-1, …, b3, b2, b1 дают скачки показателя в соответствующие моменты относительно этой базовой линии.

Розничные продажи США – анализ: Ранговые переменные.

Для начала заполним таблицу ранговых переменных, начав с ячеек B5:L16.

Лист «MРП 92-98».

Уровень коэффициента детерминированности (0.989) говорит об еще лучшем качестве прогноза.

Проверим и этот результат по графику.

Стандартное отклонение для ряда остатков s=3.07. Модель с ранговыми переменными существенно сложнее, чем авторегрессионная, но и результат существенно лучше.

На странице «МХВ 92-98» для сравнения приведен прогноз для тех же данных в модели Хольта-Винтерса.

Видно, что в данном случае качество прогноза в этой модели соответствует авторегрессионной модели и значительно хуже модели с ранговыми переменными.

1

см. например http://www.census.gov/marts/www/timeseries.html

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]