
- •Цель и последовательность проводимого в работе исследования
- •Методы построения доверительных интервалов прогноза
- •Методика исследования корректности применения доверительных интервалов и формат представления результатов для каждого из этапов
- •Аналитическая часть, выполняемая до проведения моделирования
- •Исследования, проводимые на этапе моделирования
- •Введение дополнительного метода построения доверительного интервала в случае распределения наблюдений по нормальному закону (1 бонусный балл).
- •Рассмотрение несимметричного закона, описанного в пункте b задания каждого варианта (1 бонусный балл)
- •Рассмотрение ситуации, описанной в пункте c задания каждого варианта (1 бонусный балл)
- •Метод на основе mape исследован не только для нормального закона, но и для всех остальных случаев (1 бонусный балл)
- •Содержание отчёта
Методы построения доверительных интервалов прогноза
Метод, опирающийся на правило двух сигм.
В предположении нормальности и
гомоскедастичности (одинаковой дисперсии
в разные моменты времени
)
,
самый простой (и часто используемый)
способ построить доверительные интервалы
для предсказания
основано на правиле двух сигм. Правило
«двух сигм»заключается в том, что с
вероятностью, равной 0,9544 можно утверждать,
что значения нормально распределенной
случайной величины лежат в интервале
.
Из этого правила следует, что если
выполняются предположения, формулированные
относительно случайной величины
,
то её значения с вероятностью 0,9544 не
превышают значения
,
поэтому предсказание должно (с вероятностью
0,9544) лежать в интервале
.
Правда, истинного значения
никто обычно не знает, поэтому пользуются
оценкой
.
Однако нужно учитывать, что подразумевается,
что ошибка для всех наблюдений (то есть
для всех точек во всех сезонах) одинакова.
Если бы мы вычисляли оценку дисперсии
по исходным данным, то она бы совпала
со средним арифметическим оценок
дисперсий
.
И именно эта усреднённая дисперсия
используется, когда применяется правило
«двух сигм».
Метод, опирающийся на правило двух сигм, с использованием МАРЕ.
Однако у предыдущего способа есть несколько особенностей, например, большая чувствительность к большим отклонениям прогнозируемого значения от реального. Пусть построенная модель в целом довольно хорошо повторяет реальные данные о продажах, но имеются несколько точек, где отклонение от реальных данных большое. Это приводит к увеличению ширины доверительного интервала и для всех остальных сезонов. Существует мнение, что для устранения этого недостатка необходимо компенсировать величину ошибки значимостью этой ошибки. В таком случае возможность перевеса множества мелких ошибок одной крупной удастся избежать. На этой идее основан метод построения доверительного интервала с использованием MAPE. Он основан на показателе абсолютной относительной ошибки – APE:
, где
-
данные,
-
прогноз.
Среднее значение ошибки APE собственно и обозначается как MAPE:
и имеет ясную интерпретацию – типичная
ошибка прогноза равна
*MAPE.
Если мы прогнозируем, например, необходимое
с точки зрения логистики количество
единиц продукции, то чтобы не возникло
дефицита, на складе должно быть кол-во
продукции согласно прогнозу ПЛЮС
величина средней ошибки. Кроме ясности,
по мнению некоторых специалистов в
области логистики, MAPE обладает большей
устойчивостью к выбросам по сравнению
со средней квадратичной ошибкой. В
предположении нормального закона
распределения ошибки, границы 95%-ных
доверительных интервалов прогноза
лежат в
2-х стандартных отклонений, равных MAPE.
Методика исследования корректности применения доверительных интервалов и формат представления результатов для каждого из этапов
Базовая часть РГЗ
Аналитическая часть, выполняемая до проведения моделирования
На основании информации о математических
ожиданиях
,
приведенных в задании, формируем вектор
дисперсий
.
На основании этой информации строим,
используя метод, опирающийся на правило
двух сигм, доверительные интервалы для
каждого сезона. При этом вначале мы
используем максимальную информацию о
данных (пункт Б), и полученные доверительные
интервалы при моделировании будут
использоваться для проверки корректности
моделирования, а потом используем общий
подход, предполагая, что распределение
ошибок для всех наблюдений (то есть для
всех точек во всех сезонах) одинаково
(пункт В).
На едином графике отображаем
А) математические ожидания
,
приведенные в задании, для всех сезонов
(
);
Б) доверительные интервалы, полученные по правилу двух сигм, но при использовании в качестве оценки дисперсии для каждого сезона с которой моделировались псевдо реальные значения показателей;
В) построение доверительных интервалов
по классическому правилу двух сигм.
Если бы мы вычисляли оценку дисперсии
по исходным данным, то она бы совпала
со средним арифметическим оценок
дисперсий
.
И именно эта усредненная дисперсия
используется, когда применяется правило
«двух сигм» в данном, классическом,
варианте.
Полученный график используется для визуализации доверительных интервалов, построенных разными методами.