книги / Математические методы принятия решений
..pdfслучайными. Для стохастических (вероятностных) динамических систем текущее состояние x(t\) в момент t\ и входное воздействие (Ù = cù(ti, £2) определяют в момент £2 не состояние х(£г), а лишь его вероятностное распределение.
Модели временных рядов и исследуемых процессов, необходи мые для получения оптимального прогнозирования, в действитель ности являются стохастическими, поскольку на изучаемый про цесс действует большое число неизвестных факторов и нельзя предложить детерминированную модель, допускающую точное вы числение поведения объекта в будущем. Можно лишь вычислить вероятность того, что некоторое будущее значение принадлежит определенному интервалу. В дальнейшем будем различать веро ятностную модель, или стохастический процесс, и наблюдаемый временной (вариационный) ряд z\,Z 2, ■■■,Z N , который рассматри вается как выборочная реализация стохастического процесса.
Важным классом стохастических процессов, рассматриваемых в практических задачах, является класс стационарных процессов. Системы называют стационарными, если их динамические свой ства не изменяются с течением времени; если такое изменение имеет место, то системы называют нестационарными. Стацио нарность означает, что процесс преобразования системой вход ных возмущений обладает свойством инвариантности относительно сдвига по времени входных возмущений. Стационарный процесс остается в равновесии относительно постоянного среднего уров ня, а нестационарный не имеет естественного среднего значения. Например, стохастическая модель, для которой прогнозирование экспоненциально взвешенным скользящим средним является опти мальным, относится к классу нестационарных процессов, называе мых процессами авторегрессии—проинтегрированного скользящего среднего (АРПСС). Этот класс процессов обеспечивает множе ство как стационарных, так и нестационарных моделей, которые адекватно описывают многие встречающиеся на практике ряды на блюдений.
Полезным инструментом для описания поведения стационар ных процессов является автокорреляционная функция. При гипоте зе, что автокорреляция равна нулю, отношение оценки р* к стан дартной ошибке будет распределено примерно по нормальному
закону с единичной дисперсией. То же справедливо и для частных автокорреляций. Эти факты можно использовать для получения нестрогих правил проверки того, являются ли теоретические ав токорреляции и частные автокорреляции при задержках, больших некоторой, практически нулевыми.
Необходимо иметь в виду следующее:
1)по рядам наблюдений ограниченной длины не удается дока зать, что корень оператора авторегрессии, определяющий скорость стремления автокорреляций к нулю, точно равен единице;
2)не существует, конечно, резкого перехода от стационарного поведения необходимого ряда к нестационарному.
Всложных случаях некоторым преимуществом может обладать использование нестационарных моделей в задачах прогнозирова ния. Если использовать нестационарную модель, которая не содер жит среднего значения р, то прогнозы будущего поведения системы не будут зависеть от выборочного среднего, найденного по преды
дущему периоду, которое может не иметь никакого отношения к будущему среднему уровню ряда.
Как было указано выше, этапу прогнозирования предшествует итеративная процедура построения математической модели, состоя щая из этапов идентификации, оценивания и диагностической про верки.
При идентификации используется любая информация о том, как были получены рассматриваемые числовые значения (как был ге нерирован ряд наблюдений), с целью нахождения набора эконо мичных моделей, заслуживающих проверки. Экономичные модели должны обладать максимальной простотой и минимальным чис лом параметров, но при этом адекватно описывать наблюдения. Методы идентификации определяют класс пробных моделей, для которых применяются более формальные и эффективные методы оценивания.
Оценивание—это процедура получения оценок параметров моделей. Оценки определяют адекватность моделей. Неадекват ность выбранной модели может быть вызвана неэффективностью процедуры оценки параметров модели, а не тем, что неадекватен вид модели. Процедуры получения оценок моделей рассмотрены в гл. 7.
Диагностическая проверка —это проверка согласования подо бранной модели с исходными данными для того, чтобы обнаружить недостатки модели и улучшить ее. В частности, диагностическая проверка модели может базироваться на введении избыточного чис ла параметров, т. е. на оценивании параметров для несколько более общей модели, чем ожидаемая. Идея этого способа состоит в том, что можно предсказать неадекватные свойства модели и проводить исследования остаточных ошибок после подгонки модели, что поз воляет определить, какие необходимы изменения в модели.
При проведении процедуры прогнозирования необходимо иметь в виду, что все факторы, влияющие на поведение системы в ба зовом (исследуемом) и прогнозируемом периодах, должны быть постоянны или изменяться по известному закону. Первый случай реализуется в однофакторном прогнозировании, второй — при мно гофакторном.
Можно выделить два вида прогнозируемых характеристик си стемы, зависящих от времени: переменные состояния и перемен ные интенсивности. Переменная состояния определяется перио дически, и ее значение в течение небольшого интервала времени не зависит от времени, прошедшего с момента начала наблюде ния. Переменная интенсивности также определяется периодически, но ее значение пропорционально времени, прошедшему с момента предыдущего наблюдения. Если переменная состояния характе ризует количество, то переменная интенсивности — скорость его изменения.
Величина промежутков времени между измерениями входных переменных системы с целью проверки и уточнения ранее сде ланных прогнозов о выходных переменных зависит главным об разом от длительности времени упреждения и наибольшей частоты циклических изменений в системе, которые должна отражать мо дель. Поэтому временные интервалы пересмотров прогнозов могут изменяться в широких пределах. Однако эти интервалы должны быть достаточно велики, чтобы обеспечивалась вероятность осу ществления ожидаемых изменений системы. Когда имеют место какие-то периодические процессы, то частота наблюдений должна быть по крайней мере вдвое больше частоты изучаемого процес са. Если случайная ошибка при определении входных переменных
велика по сравнению с измеряемой величиной, интервал уточнения прогноза для переменной интенсивности целесообразно уве личить, усредняя таким образом случайную ошибку. Однако для переменной состояния в аналогичном случае интервал уточнения прогноза лучше уменьшить, что позволяет для выделения полезной информации использовать соответствующие методы фильтрации. Использование доступных к моменту t наблюдений динамического ряда для прогнозирования его значений в некоторый момент t + 1 в будущем является основой для управления и оптимизации про мышленных процессов, экономических систем и т.д. Интервал I называют временем упреждения. Функция yt(l), позволяющая по лучить в момент t прогнозы будущих времен упреждения I, назы вается прогнозирующей функцией в момент t.
Прогнозирующая функция определяется заданной априори це лью. Например, находится такая прогнозирующая функция yt(l), у которой среднее значение квадрата отклонения (yt+i — yt(l))2 ис тинного значения yt+i от прогнозируемого значения является наи меньшим для каждого упреждения I.
Вычисление наилучшего прогноза должно сопровождаться ука занием его точности, например, чтобы можно было оценить риск, связанный с принятием решения по данному прогнозу. Точность прогноза может быть выражена вероятностными пределами (интер вальными оценками).
Динамический ряд рассматривается как сумма детерминирован ной и случайной компонент. Детерминированная компонента выра жается некоторой аппроксимирующей функцией, отражающей зако номерность развития исследуемого явления. Появление случайной компоненты определяется сложным взаимным влиянием парамет ров системы, влиянием на их величину большого числа неизвест ных факторов, действующих в разных направлениях, что находит свое выражение в отклонении значений показателей системы от ап проксимирующей функции. Дополнительный вклад в величину слу чайного компонента вносит и аппроксимирующая модель, с по мощью которой невозможно описать все особенности системы.
Наиболее часто отклонения наблюдаемых величин от аппрок симирующей функции, описывающей развитие события, рас сматриваются как стационарный случайный процесс, к которому
применимы методы прогнозирования стационарных случайных про цессов. Если случайная компонента не является стационарной, то производят определенные преобразования, чтобы сделать слу чайную компоненту стационарной хотя бы в определенных усло виях.
В прогнозировании важное значение имеет предварительный анализ характера изучаемого явления для определения вида его описания: процесс хорошо описывается основной тенденцией (трен дом) или процесс зависит от изменения некоторого набора пока зателей, отражающих структуру процесса. Выбор вида описания предопределяет точность прогноза на будущее.
Методы прогнозирования иногда разделяют на три группы: статистические (описательные), причинно-следственные и их ком бинаций. Для изучения исследуемого процесса необходимо задать закон изменения входных переменных по времени. Выходные пе ременные системы могут быть описаны с помощью некоторой модели, значения коэффициентов которой определяются подбором. При этом различные наблюдения учитываются с различными ве совыми множителями. По таким моделям, включающим описание предыстории системы, прогноз можно составить путем расчета со стояния системы для некоторого будущего момента времени.
Если удается построить модель окружающей среды, позволяю щую выявить причины изменений в системе (вторая группа мето дов), то прогноз, полученный с помощью такой модели, объясняет будущее системы. Подобные методы охватывают широкий круг мо делей.
Между двумя любыми автокоррелированными временными рядами всегда существует статистическая корреляция. Следова тельно, существует опасность бессмысленного использования мно жественной регрессии в поисках «хорошего» коэффициента кор реляции между прогнозируемыми (выходными) переменными и различными потенциально информативными входными перемен ными. Известная предыстория представляет собой только часть полного временного ряда. При длинных рядах наблюдаемых ве личин связь между переменными в любом случае будет найдена. Если с увеличением объема информации коэффициенты модели становятся равными нулю, то модель не пригодна для принятия
правильного решения. Наилучшие результаты получаются при ис пользовании комбинации статистических и причинно-следственных методов прогнозирования. Исходные данные обычно представляют собой результаты выборочных наблюдений либо переменной ин тенсивности, либо переменной состояния. Результаты наблюдений регистрируются с ошибками, которые возникают как при наблю дениях, так и при регистрации данных. Кроме того, изучаемый процесс может иметь стохастическую природу. Результаты наблю дений могут содержать и аномальные эффекты. Поэтому не каждую совокупность зарегистрированных по мере поступления реальных данных следует считать подходящим рядом значений, на основа нии которого можно составлять прогноз. Перед тем как подбирать коэффициенты модели по исходным данным, из последних долж ны быть исключены выбросы, т. е. результаты наблюдений, которые не характеризуют прогнозируемый процесс.
Для описания стохастических элементов рядов и их прогноза используются три различных понятия: помехи, остатки и ошиб ки. Понятие помехи связано с собственной изменчивостью про цесса и неопределенностью, вносимой при наблюдении за этим процессом. Следовательно, помеха является составной частью ис пользуемых данных. Под остатками понимается разность между результатами наблюдений и соответствующими значениями, вычис ленными с помощью прогнозирующей их модели. Таким образом, остатки связаны с прошлыми данными и моделью, которая исполь зовалась для их оценок. Ошибки прогноза представляют собой разность между прогнозом, сделанным в настоящее время, и тем прогнозом, что будет наблюдаться позднее, в момент времени, для которого составлен прогноз.
Любой процесс, представленный рядом результатов наблюде ний, можно описать системой разностных уравнений (когда процесс дискретен) или дифференциальных уравнений (когда он непреры вен). Если в этих уравнениях коэффициенты не зависят от времени, процесс называется стационарным, если же зависят, то — неста ционарным. Эта зависимость может носить вероятностный или регулярный характер. Известное регулярное изменение коэффици ентов во времени может быть описано дополнительными уравне ниями.
Для достаточно больших интервалов времени многие из про гнозируемых рядов являются нестационарными. Однако их все же можно считать квазистационарными, если прогноз составлять для какого-то одного момента времени.
Ни в одном из статистических методов прогнозирования не мо жет быть заранее предусмотрено изменение модели прогнозируемо го процесса. Существуют методы быстрого обнаружения изменений в последующих процессах с соответствующей реакцией на эти из менения. Модель прогноза может все более усложняться, когда это экономически оправдано, что позволяет глубже проникнуть в меха низм наблюдаемых явлений.
Во многих случаях изменения изучаемого процесса можно пред видеть заранее, но в модель прогноза они не включаются, так как последствия таких изменений не могут быть точно рассчитаны. Тем не менее, на основе тщательного анализа различных вариан тов можно предсказать характер изменений. В любой отдельный период времени существует, очевидно, несколько серий прогнозов, отличных от простого описательного прогноза. Это позволяет ми нимизировать время, затрачиваемое на внесение изменений.
§ 10.2. Модели для получения прогнозов
Для построения прогнозов необходимо в базисном периоде получить результаты наблюдений над прогнозируемой величиной (фактором). Эти наблюдения могут быть представлены в различ ных видах: мгновенные значения, проинтегрированные величины, конечные разности. Вид полученных результатов наблюдений опре деляет последующий выбор модели для получения прогноза.
Построение прогнозов по векторной модели
Пусть в момент времени Т задана последовательность резуль татов наблюдений у* для некоторых моментов времени i ^ Т. Про гнозирующая модель задает множество выходных переменных yt+u I > 0, которые могут быть выражены в векторной форме. В общем виде выражение для модели записывается в виде ут+i =
где вектор а представляет собой коэффициенты модели, получа емые по результатам наблюдений до момента Т включительно,
сглаживания можно представить в виде h = # - 1/(0). Величины L и h необходимо вычислить только один раз, так как при дальнейшем пересмотре прогнозов они не изменяются. Если прогнозы состав ляются для переменных интенсивности и результаты наблюдений получены в нерегулярные интервалы времени, то исходные данные преобразуются к величинам, характеризующим скорость их изме нения на равномерных интервалах времени. Получаемые в резуль тате прогнозы могут быть приведены в соответствие с величиной будущих интервалов времени. Заметим, что подобное использова ние сечения какой-либо входной переменной одинаково пригодно для любых рядов и не приводит к увеличению дисперсии, какое имело бы место в случае получения сечения из данных предысто рии. Поскольку решение линейного дифференциального уравнения может быть представлено в виде полинома, то различные матема тические описания моделей означают лишь возможность выбора удобного метода анализа, а не фактическое различие в математи ческих свойствах таких моделей. Тем не менее, точность прогноза будет зависеть от способа математического описания явления.
Математические методы позволяют представить прогнозирую щую модель в виде полинома любого порядка. Применение поли номов второго порядка для описания прогнозируемых рядов часто оказывается достаточным.
В процессе прогнозирования, как правило, нельзя предложить детерминированную модель, допускающую точное вычисление бу дущего поведения объекта, так как в ней может участвовать ряд неизвестных факторов. Однако можно предложить модель, позво ляющую вычислять вероятность того, что некоторое будущее зна чение будет лежать в определенном интервале, — стохастическую вероятностную модель (или стохастический процесс).
Чтобы исследовать возможности прогнозирования по выбран ной модели, ряд наблюдаемых значений разбивают на две части. Первую часть ряда рассматривают как предысторию, а вторую — как прогноз. Получив прогнозирующую функцию по базисному пе риоду, по второй части ряда можно оценить реальные ошибки про гноза. Изменяя число элементов рядов предыстории и прогноза, получим зависимость точности прогноза от периода предыстории и величины прогнозируемого периода.