Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Математические методы принятия решений

..pdf
Скачиваний:
7
Добавлен:
13.11.2023
Размер:
22.94 Mб
Скачать

случайными. Для стохастических (вероятностных) динамических систем текущее состояние x(t\) в момент t\ и входное воздействие (Ù = cù(ti, £2) определяют в момент £2 не состояние х(£г), а лишь его вероятностное распределение.

Модели временных рядов и исследуемых процессов, необходи­ мые для получения оптимального прогнозирования, в действитель­ ности являются стохастическими, поскольку на изучаемый про­ цесс действует большое число неизвестных факторов и нельзя предложить детерминированную модель, допускающую точное вы­ числение поведения объекта в будущем. Можно лишь вычислить вероятность того, что некоторое будущее значение принадлежит определенному интервалу. В дальнейшем будем различать веро­ ятностную модель, или стохастический процесс, и наблюдаемый временной (вариационный) ряд z\,Z 2, ■■■,Z N , который рассматри­ вается как выборочная реализация стохастического процесса.

Важным классом стохастических процессов, рассматриваемых в практических задачах, является класс стационарных процессов. Системы называют стационарными, если их динамические свой­ ства не изменяются с течением времени; если такое изменение имеет место, то системы называют нестационарными. Стацио­ нарность означает, что процесс преобразования системой вход­ ных возмущений обладает свойством инвариантности относительно сдвига по времени входных возмущений. Стационарный процесс остается в равновесии относительно постоянного среднего уров­ ня, а нестационарный не имеет естественного среднего значения. Например, стохастическая модель, для которой прогнозирование экспоненциально взвешенным скользящим средним является опти­ мальным, относится к классу нестационарных процессов, называе­ мых процессами авторегрессии—проинтегрированного скользящего среднего (АРПСС). Этот класс процессов обеспечивает множе­ ство как стационарных, так и нестационарных моделей, которые адекватно описывают многие встречающиеся на практике ряды на­ блюдений.

Полезным инструментом для описания поведения стационар­ ных процессов является автокорреляционная функция. При гипоте­ зе, что автокорреляция равна нулю, отношение оценки р* к стан­ дартной ошибке будет распределено примерно по нормальному

закону с единичной дисперсией. То же справедливо и для частных автокорреляций. Эти факты можно использовать для получения нестрогих правил проверки того, являются ли теоретические ав­ токорреляции и частные автокорреляции при задержках, больших некоторой, практически нулевыми.

Необходимо иметь в виду следующее:

1)по рядам наблюдений ограниченной длины не удается дока­ зать, что корень оператора авторегрессии, определяющий скорость стремления автокорреляций к нулю, точно равен единице;

2)не существует, конечно, резкого перехода от стационарного поведения необходимого ряда к нестационарному.

Всложных случаях некоторым преимуществом может обладать использование нестационарных моделей в задачах прогнозирова­ ния. Если использовать нестационарную модель, которая не содер­ жит среднего значения р, то прогнозы будущего поведения системы не будут зависеть от выборочного среднего, найденного по преды­

дущему периоду, которое может не иметь никакого отношения к будущему среднему уровню ряда.

Как было указано выше, этапу прогнозирования предшествует итеративная процедура построения математической модели, состоя­ щая из этапов идентификации, оценивания и диагностической про­ верки.

При идентификации используется любая информация о том, как были получены рассматриваемые числовые значения (как был ге­ нерирован ряд наблюдений), с целью нахождения набора эконо­ мичных моделей, заслуживающих проверки. Экономичные модели должны обладать максимальной простотой и минимальным чис­ лом параметров, но при этом адекватно описывать наблюдения. Методы идентификации определяют класс пробных моделей, для которых применяются более формальные и эффективные методы оценивания.

Оценивание—это процедура получения оценок параметров моделей. Оценки определяют адекватность моделей. Неадекват­ ность выбранной модели может быть вызвана неэффективностью процедуры оценки параметров модели, а не тем, что неадекватен вид модели. Процедуры получения оценок моделей рассмотрены в гл. 7.

Диагностическая проверка —это проверка согласования подо­ бранной модели с исходными данными для того, чтобы обнаружить недостатки модели и улучшить ее. В частности, диагностическая проверка модели может базироваться на введении избыточного чис­ ла параметров, т. е. на оценивании параметров для несколько более общей модели, чем ожидаемая. Идея этого способа состоит в том, что можно предсказать неадекватные свойства модели и проводить исследования остаточных ошибок после подгонки модели, что поз­ воляет определить, какие необходимы изменения в модели.

При проведении процедуры прогнозирования необходимо иметь в виду, что все факторы, влияющие на поведение системы в ба­ зовом (исследуемом) и прогнозируемом периодах, должны быть постоянны или изменяться по известному закону. Первый случай реализуется в однофакторном прогнозировании, второй — при мно­ гофакторном.

Можно выделить два вида прогнозируемых характеристик си­ стемы, зависящих от времени: переменные состояния и перемен­ ные интенсивности. Переменная состояния определяется перио­ дически, и ее значение в течение небольшого интервала времени не зависит от времени, прошедшего с момента начала наблюде­ ния. Переменная интенсивности также определяется периодически, но ее значение пропорционально времени, прошедшему с момента предыдущего наблюдения. Если переменная состояния характе­ ризует количество, то переменная интенсивности — скорость его изменения.

Величина промежутков времени между измерениями входных переменных системы с целью проверки и уточнения ранее сде­ ланных прогнозов о выходных переменных зависит главным об­ разом от длительности времени упреждения и наибольшей частоты циклических изменений в системе, которые должна отражать мо­ дель. Поэтому временные интервалы пересмотров прогнозов могут изменяться в широких пределах. Однако эти интервалы должны быть достаточно велики, чтобы обеспечивалась вероятность осу­ ществления ожидаемых изменений системы. Когда имеют место какие-то периодические процессы, то частота наблюдений должна быть по крайней мере вдвое больше частоты изучаемого процес­ са. Если случайная ошибка при определении входных переменных

велика по сравнению с измеряемой величиной, интервал уточнения прогноза для переменной интенсивности целесообразно уве­ личить, усредняя таким образом случайную ошибку. Однако для переменной состояния в аналогичном случае интервал уточнения прогноза лучше уменьшить, что позволяет для выделения полезной информации использовать соответствующие методы фильтрации. Использование доступных к моменту t наблюдений динамического ряда для прогнозирования его значений в некоторый момент t + 1 в будущем является основой для управления и оптимизации про­ мышленных процессов, экономических систем и т.д. Интервал I называют временем упреждения. Функция yt(l), позволяющая по­ лучить в момент t прогнозы будущих времен упреждения I, назы­ вается прогнозирующей функцией в момент t.

Прогнозирующая функция определяется заданной априори це­ лью. Например, находится такая прогнозирующая функция yt(l), у которой среднее значение квадрата отклонения (yt+i — yt(l))2 ис­ тинного значения yt+i от прогнозируемого значения является наи­ меньшим для каждого упреждения I.

Вычисление наилучшего прогноза должно сопровождаться ука­ занием его точности, например, чтобы можно было оценить риск, связанный с принятием решения по данному прогнозу. Точность прогноза может быть выражена вероятностными пределами (интер­ вальными оценками).

Динамический ряд рассматривается как сумма детерминирован­ ной и случайной компонент. Детерминированная компонента выра­ жается некоторой аппроксимирующей функцией, отражающей зако­ номерность развития исследуемого явления. Появление случайной компоненты определяется сложным взаимным влиянием парамет­ ров системы, влиянием на их величину большого числа неизвест­ ных факторов, действующих в разных направлениях, что находит свое выражение в отклонении значений показателей системы от ап­ проксимирующей функции. Дополнительный вклад в величину слу­ чайного компонента вносит и аппроксимирующая модель, с по­ мощью которой невозможно описать все особенности системы.

Наиболее часто отклонения наблюдаемых величин от аппрок­ симирующей функции, описывающей развитие события, рас­ сматриваются как стационарный случайный процесс, к которому

применимы методы прогнозирования стационарных случайных про­ цессов. Если случайная компонента не является стационарной, то производят определенные преобразования, чтобы сделать слу­ чайную компоненту стационарной хотя бы в определенных усло­ виях.

В прогнозировании важное значение имеет предварительный анализ характера изучаемого явления для определения вида его описания: процесс хорошо описывается основной тенденцией (трен­ дом) или процесс зависит от изменения некоторого набора пока­ зателей, отражающих структуру процесса. Выбор вида описания предопределяет точность прогноза на будущее.

Методы прогнозирования иногда разделяют на три группы: статистические (описательные), причинно-следственные и их ком­ бинаций. Для изучения исследуемого процесса необходимо задать закон изменения входных переменных по времени. Выходные пе­ ременные системы могут быть описаны с помощью некоторой модели, значения коэффициентов которой определяются подбором. При этом различные наблюдения учитываются с различными ве­ совыми множителями. По таким моделям, включающим описание предыстории системы, прогноз можно составить путем расчета со­ стояния системы для некоторого будущего момента времени.

Если удается построить модель окружающей среды, позволяю­ щую выявить причины изменений в системе (вторая группа мето­ дов), то прогноз, полученный с помощью такой модели, объясняет будущее системы. Подобные методы охватывают широкий круг мо­ делей.

Между двумя любыми автокоррелированными временными рядами всегда существует статистическая корреляция. Следова­ тельно, существует опасность бессмысленного использования мно­ жественной регрессии в поисках «хорошего» коэффициента кор­ реляции между прогнозируемыми (выходными) переменными и различными потенциально информативными входными перемен­ ными. Известная предыстория представляет собой только часть полного временного ряда. При длинных рядах наблюдаемых ве­ личин связь между переменными в любом случае будет найдена. Если с увеличением объема информации коэффициенты модели становятся равными нулю, то модель не пригодна для принятия

правильного решения. Наилучшие результаты получаются при ис­ пользовании комбинации статистических и причинно-следственных методов прогнозирования. Исходные данные обычно представляют собой результаты выборочных наблюдений либо переменной ин­ тенсивности, либо переменной состояния. Результаты наблюдений регистрируются с ошибками, которые возникают как при наблю­ дениях, так и при регистрации данных. Кроме того, изучаемый процесс может иметь стохастическую природу. Результаты наблю­ дений могут содержать и аномальные эффекты. Поэтому не каждую совокупность зарегистрированных по мере поступления реальных данных следует считать подходящим рядом значений, на основа­ нии которого можно составлять прогноз. Перед тем как подбирать коэффициенты модели по исходным данным, из последних долж­ ны быть исключены выбросы, т. е. результаты наблюдений, которые не характеризуют прогнозируемый процесс.

Для описания стохастических элементов рядов и их прогноза используются три различных понятия: помехи, остатки и ошиб­ ки. Понятие помехи связано с собственной изменчивостью про­ цесса и неопределенностью, вносимой при наблюдении за этим процессом. Следовательно, помеха является составной частью ис­ пользуемых данных. Под остатками понимается разность между результатами наблюдений и соответствующими значениями, вычис­ ленными с помощью прогнозирующей их модели. Таким образом, остатки связаны с прошлыми данными и моделью, которая исполь­ зовалась для их оценок. Ошибки прогноза представляют собой разность между прогнозом, сделанным в настоящее время, и тем прогнозом, что будет наблюдаться позднее, в момент времени, для которого составлен прогноз.

Любой процесс, представленный рядом результатов наблюде­ ний, можно описать системой разностных уравнений (когда процесс дискретен) или дифференциальных уравнений (когда он непреры­ вен). Если в этих уравнениях коэффициенты не зависят от времени, процесс называется стационарным, если же зависят, то — неста­ ционарным. Эта зависимость может носить вероятностный или регулярный характер. Известное регулярное изменение коэффици­ ентов во времени может быть описано дополнительными уравне­ ниями.

Для достаточно больших интервалов времени многие из про­ гнозируемых рядов являются нестационарными. Однако их все же можно считать квазистационарными, если прогноз составлять для какого-то одного момента времени.

Ни в одном из статистических методов прогнозирования не мо­ жет быть заранее предусмотрено изменение модели прогнозируемо­ го процесса. Существуют методы быстрого обнаружения изменений в последующих процессах с соответствующей реакцией на эти из­ менения. Модель прогноза может все более усложняться, когда это экономически оправдано, что позволяет глубже проникнуть в меха­ низм наблюдаемых явлений.

Во многих случаях изменения изучаемого процесса можно пред­ видеть заранее, но в модель прогноза они не включаются, так как последствия таких изменений не могут быть точно рассчитаны. Тем не менее, на основе тщательного анализа различных вариан­ тов можно предсказать характер изменений. В любой отдельный период времени существует, очевидно, несколько серий прогнозов, отличных от простого описательного прогноза. Это позволяет ми­ нимизировать время, затрачиваемое на внесение изменений.

§ 10.2. Модели для получения прогнозов

Для построения прогнозов необходимо в базисном периоде получить результаты наблюдений над прогнозируемой величиной (фактором). Эти наблюдения могут быть представлены в различ­ ных видах: мгновенные значения, проинтегрированные величины, конечные разности. Вид полученных результатов наблюдений опре­ деляет последующий выбор модели для получения прогноза.

Построение прогнозов по векторной модели

Пусть в момент времени Т задана последовательность резуль­ татов наблюдений у* для некоторых моментов времени i ^ Т. Про­ гнозирующая модель задает множество выходных переменных yt+u I > 0, которые могут быть выражены в векторной форме. В общем виде выражение для модели записывается в виде ут+i =

где вектор а представляет собой коэффициенты модели, получа­ емые по результатам наблюдений до момента Т включительно,

а матрица F размерностью т х Т является набором аппроксими­ рующих функций, строки которой соответствуют каждому из тп членов модели и столбцы — каждому из интервалов прогнозиро­ вания до момента Т. Компоненты вектора у представляют собой прогнозируемые значения для каждого из интервалов на момент I. В большинстве практических задач из интервалов на момент I эле­ менты матрицы F определяют время относительно момента самого последнего наблюдения, а значения коэффициентов ат зависят от выбора начала отсчета времени. Широкий класс составляют модели, которые могут быть представлены с помощью полино­ мов Fi : F\(t)= 1, F2(t) = t, Fi(t) = t(t — l)/2 и т.д. Применение различных методов прогнозирования позволяет получить различ­ ные модели, например, за счет использования разностей или сумм функций Fi.

Коэффициенты ат вычисляют сначала по методу наименьших квадратов в соответствии с N исходными данными (m х N )-матри­ цы F . Гармоники включаются в модель вплоть до той частоты, при которой квадрат амплитуды составляет по крайней мере четвертую часть от величины дисперсии остатков, получаемых при подгонке этой модели с учетом имеющихся степеней свободы для ошибок.

С каждым новым наблюдением вектор ат заменяется вектором

ат = 1?ат- 1 + he,

где L — матрица перехода размерностью N х тп, которая определя­ ется с помощью выражения f( t ) = L f(t —1) и переводит значения соответствующих функций из одного периода времени в следую­ щий. Столбец матрицы F, имеющий номер t, обозначается как /(£), и е представляет собой ошибку (скаляр) самого последнего прогно­ за, сделанного на предыдущем интервале: е = ут — ут■Вектор h, характеризующий m постоянных сглаживания, определяется следу­ ющим образом. Используя z-преобразования и некоторые элемен­ тарные тригонометрические соотношения, вводится матрица

я = Х У / ( - : / ) / т( - .7).

3

Поскольку параметр а выбирается согласно неравенству а < 1, то значимость более старых данных снижается и увеличивается вес, приписываемый более поздним данным. Следовательно, вектор

сглаживания можно представить в виде h = # - 1/(0). Величины L и h необходимо вычислить только один раз, так как при дальнейшем пересмотре прогнозов они не изменяются. Если прогнозы состав­ ляются для переменных интенсивности и результаты наблюдений получены в нерегулярные интервалы времени, то исходные данные преобразуются к величинам, характеризующим скорость их изме­ нения на равномерных интервалах времени. Получаемые в резуль­ тате прогнозы могут быть приведены в соответствие с величиной будущих интервалов времени. Заметим, что подобное использова­ ние сечения какой-либо входной переменной одинаково пригодно для любых рядов и не приводит к увеличению дисперсии, какое имело бы место в случае получения сечения из данных предысто­ рии. Поскольку решение линейного дифференциального уравнения может быть представлено в виде полинома, то различные матема­ тические описания моделей означают лишь возможность выбора удобного метода анализа, а не фактическое различие в математи­ ческих свойствах таких моделей. Тем не менее, точность прогноза будет зависеть от способа математического описания явления.

Математические методы позволяют представить прогнозирую­ щую модель в виде полинома любого порядка. Применение поли­ номов второго порядка для описания прогнозируемых рядов часто оказывается достаточным.

В процессе прогнозирования, как правило, нельзя предложить детерминированную модель, допускающую точное вычисление бу­ дущего поведения объекта, так как в ней может участвовать ряд неизвестных факторов. Однако можно предложить модель, позво­ ляющую вычислять вероятность того, что некоторое будущее зна­ чение будет лежать в определенном интервале, — стохастическую вероятностную модель (или стохастический процесс).

Чтобы исследовать возможности прогнозирования по выбран­ ной модели, ряд наблюдаемых значений разбивают на две части. Первую часть ряда рассматривают как предысторию, а вторую — как прогноз. Получив прогнозирующую функцию по базисному пе­ риоду, по второй части ряда можно оценить реальные ошибки про­ гноза. Изменяя число элементов рядов предыстории и прогноза, получим зависимость точности прогноза от периода предыстории и величины прогнозируемого периода.

Основные разностные модели

Для построения моделей будем использовать некоторые опера­ торы:

оператор сдвига назад В , Byt = y t- ь B myt = yt-m\

— оператор сдвига вперед F = В ~ \ F yt = yt+ F myt = Уг+т\

разностный оператор со сдвигом назад Д: A Vt = V t~ Vt- 1= (1 - B )yt-,

— оператор суммирования S = Д -1 :

Syt = A ~ lyt = yt + yt- 1+ Ш-2 + .. • = (1 + В + В 2 + .. .)yt =

= (1 - B ) ~ 'y t.

1. М о д е л ь а в т о р е г р е с с и и . Рассмотрим основные разност­ ные модели для построения прогнозов. Здесь текущее значение процесса выражается как конечная линейная совокупность преды­ дущих значений процесса и независимого импульса at, который является реализацией случайной величины с фиксированным рас­ пределением, часто полагаемым нормальным с нулевым средним и дисперсией о2(о) (белый шум), т. е.

 

yt = И + Фцй- i + $ 2î/t-2 +

+ % y t- P + <Н,

где

р —параметр, определяющий уровень процесса (тренд); Ф*,

г =

1,2,..., п, неизвестные параметры. Пусть ÿt, y t - 1, Ш-2, ■■■—

отклонения от р, например ÿt = yt Ц- Тогда значения yt находят по формуле

Ш= $ \ÿ t-i + Ф2&-2 + + Фpÿt-p + at,

которая называется процессом авторегрессии (АР) порядка р.

Введем оператор авторегрессии порядка р:

Ф(В) = 1 - Ф- Ф2-В2 -

- ФРВ Р;

тогда модель авторегрессии имеет вид

Ф(B)yt = at. Она содер­

жит р + 2 неизвестных параметров р, Фь Ф2, ..., Фр, а 2(о), которые необходимо оценить перед вычислением прогноза по наблюдениям. Применяя линейный оператор

ф ( В ) = 1 + ф 1Я + ф2В 2 + . . . = ф - 10В ),

Соседние файлы в папке книги