
книги / Математические методы принятия решений
..pdfпрогноза, либо умножаются на него. Значения этих поправочных коэффициентов можно определить по результатам наблюдений в со ответствующие моменты времени в прошлых циклах.
Весь ряд поправочных членов или коэффициентов может быть назван сезонным сечением. Во многих случаях оказывается, что существует небольшое семейство сечений, и тогда прогнозы для отдельных временных рядов могут быть получены путем выбора наиболее подходящего представления этого семейства.
Сечения играют важную роль в методике прогнозирования, так как их сущность легко объяснить, а эффективность их использова ния легко оценить на практике. Однако существенным недостатком применения сечений является связанная с ними нестабильность прогнозов. Если случайная величина х имеет дисперсию о2(х), то дисперсия обратной величины (у = l/х) будет порядка о4(ж). В большинстве методов, использующих сезонные или циклические сечения, в процессе проведения вычислений необходимо деление значений членов ряда на случайную переменную (или ее оценку, имеющую отличную от нуля дисперсию). Если при этом делитель имеет тот же порядок величины, что и величина помехи, то от носительно малые колебания исходных данных могут привести к большим изменениям прогноза. Подобная нестабильность обычно проявляется как раз тогда, когда принимаемые решения могут иметь самые серьезные последствия (т. е. перед началом следующего цикла). Для уменьшения этой нестабильности используется предположе ние, согласно которому дисперсия помехи является функцией толь ко среднего значения по всем наблюдениям за цикл и не зависит от сезонных изменений. При этом чувствительность метода к коле баниям данных в точках наивысших и наинизших значений прогно зируемых переменных соответственно повышается и понижается.
Другой подход заключается в представлении циклических изме нений прогнозируемой переменной рядами Фурье:
|
x t = 2 Ak cos(cùkt) + 2 |
Вк sin(o>kt). |
|
|
к |
к |
|
Здесь Ак и |
— коэффициенты, полученные по исходным данным |
||
с помощью |
соответствующей регрессии; to = 2к/р —основная ча |
||
стота; р —число наблюдений |
в одном |
сезонном цикле; t —время, |
за которое должен быть вычислен прогноз; к = 1,2,..., N и сум мирование ведется по всем частотам вплоть до частоты Найквиста (наивысшей частоты гармонического разложения дискретного ряда, которая определяется половиной интервала между наблюдениями).
Достоинство такой модели состоит в том, что она обеспечи вает стабильность прогноза даже в точках цикла с наименьшими значениями прогнозируемой переменной, так как коэффициенты вычисляются путем усреднения всего набора имеющихся данных, а не только результатов наблюдений в пределах одного цикла. Ес ли для составления прогноза используются только первые члены разложения Фурье, то сезонное сечение представляет собой про стую синусоиду с некоторыми амплитудой и фазой, зависящими от коэффициентов А\ и В \. При увеличении числа членов разложе ния форма сечения может измениться. В соответствии с теоремой Фурье, если в дискретных рядах величина переменной повторяется через каждые т наблюдений, такие ряды могут быть представлены членами гармонического разложения.
Амплитуда j- й гармоники Cj, включенной в модель, равна (квадрат амплитуды иногда называют мощностью дан
ной гармоники). Пусть а 2 —дисперсия остаточных разностей меж ду исходными данными и результатами расчетов по модели, вклю чающей гармоники вплоть до j - й. Тогда модель будет соответство вать предыстории, охватывающей от трех до шести предыдущих циклов, если выполнено соотношение C jA j > а /2. Проверка на со ответствие предыстории обычно проводится по критерию наи меньших квадратов. Отметим, что при вычислении дисперсии а 2 необходимо учесть потерю степеней свободы некоторым числом пе ременных в модели. Это означает, что можно достичь минимальной дисперсии, используя модель с числом переменных, меньшим р. Однако такая модель будет неверной, если мощность включенной в нее высшей гармоники не будет достаточно большой по сравне нию с остаточной дисперсией.
Пусть сезонные волны описываются бесконечным рядом си нусоидальных и косинусоидальных функций (рядом Фурье). Ес ли в качестве переменной вместо оikt взять (2к/р)й, г = 1, 2,
где р — полный исследуемый период, то значение yt ряда в момент t
Прогноз [yt+z] = M[yt+i 10, 0 , y u y t- i,- ..] является условным математическим ожиданием значений yt+i в момент t + l. В этом выражении параметры предполагают известными точно, и ряд чи сел уи y t - 1, • •. — известными достаточно далеко в прошлое, 0 и 0 — разные величины (параметры).
Практическое применение модели зависит от следующих фактов: а) обратимые модели после подгонок к реальным рядам дают прогнозы, существенно зависящие только от сравнительно недав
них значений (последних членов) ряда; б) прогнозы не чувствительны к малым изменениям значений
параметров, вносимым, например, ошибками оценивания. |
|
||||
Имеем |
|
|
|
|
|
|
Vt+j |
при |
j |
^ О, |
|
|
[yt+jl = |
при |
j |
> О, |
|
|
Vt(j) |
|
|||
|
at+j |
при |
j |
^ О, |
|
|
[a t+ j] — |
при |
j |
> 0. |
|
|
О |
|
|||
Теперь, чтобы получать прогнозы, заменяем неизвестные зна |
|||||
чения у |
прогнозами, а неизвестные а —нулями. Известные |
at — |
|||
это уже |
вычисленные ошибки прогноза на шаг вперед, т. е. |
at = |
= У( - y t - i( l ) .
Пример. Для получения прогноза на три месяца вперед при 0 = 0,4, 0 = 0,6 имеем
yt+з Vt+ 2 + y t- 9 + y t- io + at+3 —0,4at+3— 0,6ot_9+ 0,24at_io.
Взяв условные математические ожидания в момент t, получим
ytO) = yt(2) —yt~9 —yt-ю — 0,6at-9 + 0,24a(_m,
где at- 9 = yt- 9 —yf_ 10(l), а(_ю = y t - io —î/t-iiO )- В результате имеем
У*(3) = yt(2) + 0,4yt_ 9 - 0,76yt_ 10 + 0,6yt_io(l) - 0,24yÉ_ n (l).
Чтобы определить формулы коррекции и получить дисперсию ошибки прогноза et(l), необходимо знать значения весов в выраже нии для модели вида [6]
ОО
3=0
Общая формула для коррекции прогноза имеет вид
yt+i(l) = yt+i(l + 1) + ф*а4+1.
Зная веса <\>j, можем вычислить дисперсию ошибок прогноза для любого упреждения I:
D(e) = (1 + ф? + • • • + Ф?-1)<72(а)-
Для вычисления весов ф^- можно использовать оператор скользяще го среднего.
§10.10. Диагностическая проверка моделей и ошибка прогноза
Диагностическая проверка моделей может быть начата с оценки параметров моделей. Оценку параметров моделей по результатам наблюдений будем проводить по алгоритмам, описанным в гл. 7. В общем случае перед применением формальной процедуры полу чения оценок желательно исследовать поведение функции правдо подобия. В каждом случае функция правдоподобия содержит необ ходимую нам информацию. Так, существование двух максимумов функции правдоподобия приблизительно равной высоты указывает на то, что имеются две группы значений параметров, с помощью которых можно объяснить смысл исходных данные.
Необходимо соблюдать осторожность при интерпретации функ ции правдоподобия. В общем случае предположение, что лога рифмическая функция правдоподобия вблизи ее максимума близка к квадратичной функции, не всегда применимо. Однако такие слу чаи редки.
Особая осторожность необходима, когда максимум функции правдоподобия лежит на границе измеренных значений или око ло нее. Первая производная функции правдоподобия в этом случае
априорную плотность распределения величин Ф, 0 и оа в виде
р(ф> 0, аа)*|«/(Ф, е) \ х / 2о ~ х
Отсюда следует, что апостериорная плотность распределения вероятностей имеет вид
р(Ф, е, а а I у) « оа- (п+1У (Ф , 0)|'/2/(Ф , 0) е х р { - ^ М | .
Интегрируя плотность распределения р(Ф, 0, оа | у) от нуля до бесконечности по оа, получим точную совместную апостериорную плотность распределения параметров Ф и 0:
р(Ф, 0 1у) % 17(Ф, 0)|1/2/(Ф , 0)(5(Ф, 0))"п/2.
Если у( —процесс АРПСС |
с параметрами (р, d, 0), |
то <ot = |
= A dyt —процесс авторегрессии |
порядка р. Для такого |
процесса |
множители |«/(Ф, 0)!1/2 и /(Ф , 0), которые во всех случаях являются существенно менее важными, чем множитель 5(Ф, 0), практически взаимно сокращаются. При данных предположениях параметры Ф процесса АР (р) для заданного со имеют апостериорную плотность распределения
р(Ф |у )* (5 (Ф , 0)Г "/2.
Вэтом случае поверхность, уравнение которой определено функционалом для суммы квадратов отклонений, приближенно сов падающая с поверхностью, описанной функцией правдоподобия при отсутствии априорной информации, совпадает также с по верхностью, описанной функцией плотности апостериорной веро ятности.
После того как модель идентифицирована и параметры оцене ны, подгоняемая модель подвергается диагностической проверке. Один из полезных методов проверки модели состоит в использо вании избыточного числа параметров, т. е. в оценивании парамет ров для несколько более общей модели, чем предполагаемая. Этот метод основан на том, что мы можем заранее предсказать неадек ватные свойства модели. Следовательно, полезно дополнить этот
подход более общими способами проверки, основанными на оста точных ошибках после подгонки модели. Остаточные ошибки поз воляют найти в данных указание, какие изменения модели необхо димы. Проверку можно провести, используя:
1)автокорреляционную функцию остаточных ошибок;
2)кумулятивную периодограмму остаточных ошибок.
Если анализ не выявил, какие добавления новых параметров нужны, это, конечно, не означает, что используемая модель вер на. Модель может лишь выдержать испытание. Если будут обна ружены свидетельства неадекватности модели, возникнет необхо димость узнать, как изменить модель на следующем итеративном цикле. Необходимо обнаружить, что именно неадекватно в модели, для того чтобы узнать, как ее изменить.
При недостаточном объеме данных статистическое испытание может отвергнуть модель, которая, тем не менее, вполне адекватна решаемой задаче. Напротив, испытания могут не выявить серьез ных отклонений от сделанных предположений, потому что эти ис пытания нечувствительны к некоторым видам отклонений.
Методы введения избыточных параметров путем обобщения мо дели применимы в том случае, если мы знаем, какого рода от клонения следует ожидать. Методики, менее зависящие от таких представлений, основываются на анализе остаточных ошибок. Хо тя некоторые представления о том, что искать, полезны и в данном случае, эти методы создают больше возможностей находить способ изменения моделей непосредственно из данных.
Рассмотрим диагностическую проверку, используя автокорреля ционную функцию. Пусть исследуется модель вида
Ф(B )ût = Q(B)at,
где £>i = A dyt, и были получены оценки ММП параметров (Ф, 9), откуда имеем
Величины at будем называть остаточными ошибками. Можно доказать, что для адекватной модели выполнено соотношение
По мере увеличения длины ряда остаточной ошибки величи на at становится все ближе к белому шуму at. Следовательно, мож но ожидать, что изучение at даст возможность выявить и указать природу неадекватности модели. В частности, некоторый характер ный вид выборочной автокорреляционной функции для at выявля ют определенные изменения модели.
Предположим, что модель верна и известны точные значения параметров Ф и 0. Тогда выборочные автокорреляции р&(а) элемен тов ряда а должны быть некоррелированы и распределены прибли женно нормально относительно нулевого среднего значения с дис персией, пропорциональной п _ |, и, следовательно, со стандартной ошибкой, пропорциональной п -1/2. Эти факты можно использовать для оценки статистической значимости кажущихся отклонений вы борочных автокорреляционных функций от нуля.
На практике не известны истинные значения параметров, мы располагаем только выборочными оценками Ф, 6, по которым нель зя вычислить элементы a, a только их оценки а. Автокорреля ции pk(â) ряда а могут дать ценную информацию о недостаточно хорошей подгонке и возможной природе неадекватности моде ли. Однако может оказаться рискованно придавать статистическую значимость кажущимся отклонениям автокорреляций р*(а) от их
теоретических нулевых значений исходя из |
стандартной ошиб |
ки « п -1/2, соответствующей pjk(3). Показано |
[6], например, что |
для процесса АР(1) с параметром Ф дисперсия оценки pfc(3) рав на Ф2п -1 , что может оказаться существенно меньше, чем п -1 . Хотя во всех случаях для малых задержек возможны уменьшение дис персии и сильная корреляция рк(а), при больших задержках эти отличия быстро исчезают. Поэтому использование величины п -1/2 в качестве стандартной ошибки для рк(а) будет приводить к недо оценке статистической значимости кажущегося отклонения от нуля для автокорреляций при малых задержках, но обычно вполне оправ дано для средних и больших задержек.
При небольших задержках можно рассматривать величину п -1/2 как верхнюю границу стандартных ошибок pfc(a), а не как сами стандартные ошибки. Если пользоваться п -1/2 как стандартной ошибкой рк(а) при малых задержках, то можно недооценить значи мость кажущихся расхождений. Во многих случаях предпочтительно
не исследовать отдельные оценки р^(а), a оценить неадекватность модели по нескольким автокорреляциям, рассматриваемым как еди ное целое.
В других случаях, особенно при корректировке сезонных рядов, кумулятивная периодограмма является эффективным средством обнаружения периодического отклонения от случайного процес са [6, 41].
Нормированная кумулятивная периодограмма C(pj) элементов
ряда at определяется по формуле |
|
|
|
|
|
|
S |
« и ) |
|
|
|
где |
|
|
|
|
|
« Pi) = - I 2 |
О* cos(2npit) j |
+ ( |
2 |
°* sin(2rcpi<) j |
, |
- 't= l |
' |
4=1 |
' |
- |
Pi = i/n — частота, s2— оценка дисперсии о2(a).
В любом из методов прогнозирования рядов собственно прогноз представляет собой, по существу, оценку ожидаемого распределе ния результатов наблюдений в будущем. Для того чтобы на основе полученного прогноза можно было принимать решение, в боль шинстве случаев необходимо знать функцию исходного распреде ления. Если это распределение описывается стандартной функцией, то, определив один или два его параметра, оценим вероятности воз можных значений будущих наблюдений.
При формальном анализе часто удобно принять предположение о том, что помеха (ошибка) в исходных данных подчиняется нор мальному закону распределения. Однако это предположение нельзя считать обоснованным для всех наблюдений.
Прогнозируемая выходная переменная характеризуется распре делением, дисперсия которого зависит от дисперсии шума в исход ных данных. Однако, поскольку прогнозы вычисляются на основе результатов многих наблюдений, часто предполагают, что входная переменная описывается нормальным законом распределения неза висимо от того, каков вид распределения, описывающего шум в ис ходных данных.
Распределение ошибок при прогнозировании зависит как от рас пределения самой выходной переменной, так и от распределения