
- •1. Общие положения
- •1.1. Цель и задачи кп
- •1.2. Содержание и объём кп
- •1.3. Этапы выполнения кп
- •2. Теоретические основы методов, применяемых в кп
- •2.1. Предварительная обработка статистических данных
- •2.2. Вейвлет анализ временного ряда
- •2.3. Сингулярный спектральный анализ временного ряда
- •2.4. Методы ssa-прогнозирования
- •2.4.1. Рекуррентное ssa-прогнозирование
- •2.4.2. Векторное ssa-прогнозирование
- •2.4.3. Формирование доверительных интервалов
- •2.5. Основы аналитического подхода к оценке риска спектральными методами
- •2.5.1. Относительные меры риска
- •Спектральная плотность Fu(ω) распределения дисперсии ущерба
- •Энергетические спектры ущерба Fu(ω) и гармонического сигнала Fг
- •2.5.2. Расчет прогностической меры риска
- •Ряд прогноза y[n]
- •3. Этапы выполнения основной части кп
- •4. Пример анализа временного ряда предложенными методами
- •4.1. Статистика количества почтовых писем, классифицированных как спам
- •4.1.1. Предварительная обработка статистических данных
- •4.1.2. Вейвлет анализ временного ряда
- •4.1.3. Сингулярный спектральный анализ временного ряда
- •4.1.4. Расчет прогностической меры риска
- •Исходный ряд и ряд прогноза
- •Ряд прогноза
- •4.2. Статистика случаев мошенничества с кредитными картами
- •4.2.1. Предварительная обработка статистических данных
- •4.2.2. Вейвлет анализ временного ряда
- •4.2.3. Сингулярный спектральный анализ временного ряда
- •4.2.4. Расчет прогностической меры риска
- •Восстановленный ряд и ряд прогноза
- •Прогноз ущерба от мошеннических операций с распределенными платежными системами на 2012 год
- •Распределения вероятностей нанесения ущербов
- •5. Требования к оформлению и объему кп
- •5.1. Общие требования
- •5.2. Правила оформления текстовых документов
- •5.3. Правила нумерации страниц
- •5.4. Правила оформления иллюстраций
- •5.5. Оформление таблиц
- •5.6. Приложение
- •5.7. Типичные ошибки при выполнении кп
- •5.8. Дополнительные рекомендации по выполнению кп
- •6. Порядок оценки работы
- •Библиографический список Основная литература
- •Дополнительная литература
- •Оглавление
- •394026 Воронеж, Московский просп., 14
2.4.3. Формирование доверительных интервалов
Согласно основным
предположениям для SSA-прогнозирования,
аддитивная компонента
ряда Fn
должна управляться ЛРФ относительно
небольшой размерности и при этом ряд
остатков
должен приближенно сильно разделяться
с
для некоторой дайны окна L.
В частности, предполагается, что ряд
— это конечный подряд бесконечного
ряда F(1)
который является рекуррентным
продолжением ряда
.
Эти предположения не могут быть
проигнорированы, но, к счастью, они
справедливы для достаточно широкого
класса практических задач.
Чтобы ввести
доверительные границы для точек прогноза,
мы должны еще более усилить наши
предположения, причем не только по
отношению к
,
но также и для ряда
.
Во-первых, будем рассматривать ряд
остатков
как конечный подряд некоторого
бесконечного случайного (шумового) ряда
F(2) который
«портит» сигнал F(1).
Другие предположения связаны главным
образом с рядом остатков
где
— восстановленная компонента ряда
Fn.
Так как
≈
то
свойства ряда
сильно связаны со свойствами
.
Более точная формулировка дополнительных
предположений зависит от решаемой
задачи и применяемого метода.
В этой связи, рассмотрим следующие две задачи, связанные с построением доверительных границ для прогноза. Первая задача связана с построением доверительных интервалов для прогнозирования значения всего ряда F = F(1) + F(2) целиком в некоторый будущий момент времени N + М, Вторая задача формулируется как построение доверительных границ для прогноза значения сигнала F(1) также в некоторый будущий момент времени. Эти две задачи решаются различными способами. Первый из них использует информацию, непосредственно полученную в процессе обработки временного ряда. Этот вариант будем называть эмпирическим. Второй требует дополнительной информации о модели ряда для того, чтобы можно было выполнить бутстреп-моделирование ряда Fn.
Опишем коротко обе задачи построения доверительных границ для R-SSA-прогнозирования. Для V-прогнозирования все построения полностью аналогичны.
Предположим, что
мы уже получили значение М-й точки
прогноза
т. е. мы уже выполнили М шагов
процедуры R-SSA-прогнозирования.
По определению, мы используем
как прогноз будущего значения
сигнала F(1).
Как уже упоминалось, нашей задачей
является построение доверительного
интервала для (будущего) значения
FN+M-1
всего ряда F.
Рассмотрим процедуру
мультистартового М-шагового
рекуррентного продолжения. Возьмем
относительно небольшое целое М и
проведем М шагов рекуррентного
продолжения с помощью прогнозирующей
ЛРФ, беря в качестве начальных данных
скользящие отрезки восстановленного
ряда длины L — 1
от
до
,
K=N-L+1.
Значения последних точек gj+M+L-1 этих продолжений можно сравнить со значениями fj+M+L-1 исходного ряда FN. Таким образом, мы получаем ряд мультистартовых М-шаговых остатков HK-M+1 с
Если мы предположим,
что восстановленный ряд
совпадает с рядом
,
который управляется ЛРФ, то мы получим,
что
и ряд мультистартовых M-шаговых
остатков совпадает с последними К —
М + 1 значениями стационарного шумового
ряда
.
Если эти предположения
не верны, то
не совпадают с
.
Но даже если совпадения нет,
предположим, что ряд мультистартовых
M-шаговых остатков является
стационарным и эргодическим в том
смысле, что его эмпирическая функция
распределения сходится к некоторой
теоретической при
.
Тогда, имея в распоряжении ряд HK-M+1
мы можем оценить квантили теоретического
распределения (например, верхнюю и
нижнюю 2.5% квантили).
Заметим, что значения gj+M+L-2 получены за то же число шагов с помощью той же ЛРФ, что и точки прогноза при этом начальные значения взяты из одного и того же восстановленного ряда. Так как прогнозирование требует предположения о сохранении структуры ряда в будущем, то полученная эмпирическая функция распределения ряда мультистартовых M-шаговых остатков может быть использована для построения доверительного интервала для значения FN+M-1.
Для построения
доверительных интервалов фиксируется
некоторый доверительный уровень
.
и
– нижняя и верхняя α/2 -квантили,
вычисленные на основе эмпирической
функции распределения ряда остатков.
Таким образом, строится эмпирический
доверительный интервал
который содержит
с
вероятностью, близкой к
.
Если ряд мультистартовых M-шаговых остатков можно рассматривать как белый шум, то можно предложить другую модификацию эмпирического доверительного интервала. Предполагая, что справедлива гипотеза о гауссовском белом шуме, можно построить стандартный симметричный доверительный интервал для FN+M-1 с помощью выборочных среднего и дисперсии ряда мультистартовых M-шаговых остатков. Конечно, гипотеза о белом шуме должна быть проверена с помощью стандартных статистических процедур[12].
Бутстреп-доверительные интервалы для прогноза сигнала. Рассмотрим метод построения доверительных границ для сигнала F(1) в момент времени N+M–1. В нереализуемой на практике ситуации, когда известны как сам сигнал, так и истинная модель шума, с помощью моделирования и метода Монте-Карло можно определять статистические свойства значения прогноза по отношению к истинному значению.
Действительно,
предположим, что правило выбора набора
собственных троек фиксировано. Тогда
мы можем промоделировать S
независимых реализаций
процесса
и
затем применить процедуру прогноза к
S независимым рядам FN,j
+
.
Результаты прогноза
образуют выборку
,
которая и дает информацию о
.
Таким образом могут быть построены
доверительные интервалы по методу
Монте-Карло.
Так как на практике мы не знаем вид и значения сигнала , то мы не можем применить такую процедуру. Опишем бутстреп-вариант моделирования для построения доверительных интервалов для точек прогноза.
При подходящем
выборе длины окна L
и набора собственных троек,
соответствующих сигналу, мы получаем
представление FN=
+
, где
(восстановленный ряд) аппроксимирует
сигнал
, a
— ряд остатков. Предположим теперь,
что (стохастическая) модель остатков
известна. Например, мы постулируем
некоторую модель для
и, так как
≈
,
применяем ту же самую модель для
с оцениваемыми параметрами.
Тогда, моделируя
S независимых реализаций
ряда
,
мы получаем S временных
рядов FN,j
+
и S раз проводим
прогнозирование, получая
так же как в варианте метода
Монте-Карло.
Более точно, каждый
временной ряд
порождает свой восстановленный
ряд
и свою линейную рекуррентную формулу
при выборе одной и той же длины окна L
и одного и того же набора собственных
троек. Поэтому для каждого ряда на основе
последних L — 1
точек ряда
в качестве начальных значений для
рекуррентного прогноза по соответствующей
ЛРФ, выполняется М шагов прогноза,
результатом чего являются значения
.
Как только выборка из спрогнозированных значений получена, мы можем вычислить (эмпирические) нижнюю и верхнюю квантили по заданному доверительному уровню и получить соответствующий доверительный интервал для прогноза сигнала. Этот интервал называется бутстреп-доверительным интервалом.
Простейшей моделью для является модель гауссовского белого шума. Соответствующая гипотеза может быть проверена с помощью стандартных тестов на случайность и нормальность.