
- •Содержание и предмет “Теории оптимального управления”
- •Экономическая задача решается в трёх измерениях:
- •Тема 1. Характерные особенности теории и практики оптимального управления.
- •1. Управление – наука и искусство.
- •2. Сложность и актуальность теории эффективного управления.
- •Тема 2. Управление как система.
- •Тема 7. Основы моделирования экономических процессов.
- •Система, модель, моделирование.
- •Системные признаки:
- •Таким образом, для выделения системы требуется наличие:
- •Управление. Обратная связь. Замкнутая система.
- •В структуре системы управления можно выделить:
- •Экономическая система как объект управления.
- •В целом можно представить себе одну из двух альтернатив:
- •Тема 8. Оптимизационные модели экономической динамики.
- •Однопродуктовая динамическая макроэкономическая модель.
- •Р ис.1. Принципиальная схема производства и распределения продукции
- •Однопродуктовая оптимизационная динамическая макроэкономическая модель.
- •Модель примет следующий вид:
- •Тема 9. Исследование однопродуктовой макромодели оптимального развития экономики.
- •1. Моделирование производства на макроуровне.
- •2. Модель развития экономики.
- •Тема 10. Задача управления.
- •1. Задача управления и её формулировка.
- •Переменные величины – управляющие параметры. Множество функций – множество управления времени.
- •2. Виды управления. Управление по разомкнутому контуру.
- •Управление по замкнутому контуру (с обратной связью)
- •Тема 11. Достаточные условия оптимальности.
- •Тема 12. Метод Лагранжа – Понтрягина для непрерывных управляемых процессов.
- •1. Уравнение метода.
- •2. Принцип максимума Понтрягина.
- •Тема 13. Задача Эйлера вариационного исчисления.
- •Случаи:
- •Тема 14. Уравнение Беллмана.
- •1. Идея, основные элементы уравнения Беллмана.
- •2. Синтез оптимального управления.
- •Тема 16. Оптимальное управление
- •Тема 17. Динамическое программирование.
- •Выделим особенности модели динамического программирования:
2. Виды управления. Управление по разомкнутому контуру.
В этом случае оптимальное управление, являющееся решением (1) определяется как функция времени {u*(t)}. Это управление полностью определяется в начальный момент t0, а фазовая траектория {х(t)} отыскивается в результате интегрирования уравнений движения при фиксированных начальных условиях.
Управление по замкнутому контуру (с обратной связью)
В этом случае оптимальное управление определяется как функция текущих фазовых координат и времени {u*(t),t}.
При этом управлении решения можно пересматривать с учётом новой информации, которую несут текущие фазовые координаты.
Задача определения оптимального управления α – задача синтеза.
Автоматические стабилизаторы, такие, как пособие по безработице и подоходный налог – системы управления с обратной связью. Так как рост числа безработных приводит к росту суммы выплат пособий по безработице, что противодействует росту безработицы.
Расширение инфляции приводит при действующей системе прогрессивного налогообложения к росту подоходного налога, что противодействует росту инфляции.
Прогрессивное налогообложение – налогообложение, предусматривающее повышение ставки налога по мере роста налоговой базы.
Упр.2 Денежная политика в том виде, как она осуществляется федеральной резервной системой США, которая регулирует выпуск денег и определяет условия кредита в соответствии с текущими значениями экономических переменных. Имели место предложения превратить эту систему в 1, в которой определённый заранее темп роста суммы денег, участвующих в обороте например в размере 5% в год, выдерживался бы неизменным вне зависимости от текущего состояния экономики.
Управляющие параметры в каждом из этих
случаев (пособие по безработице, налоговые
отчисления)
-
исходные данные
- что требуется определить (максимизировать )
- виды управления
Предполагается, что задача управления не содержит случайных переменных, и что все необходимые параметры, функции и множества, указанные в (1) полностью определены. В этом случае виды управления приводят к одинаковым результатам.
Тема 11. Достаточные условия оптимальности.
В ТОУ для решения задач применяется специфический математический аппарат, основанный на достаточных условиях оптимальности. Это утверждает, что если утверждаемое условие оптимальности достаточно, то данный управляемый процесс оптимальный. Но это не означает, что не может быть других оптимальных процессов, для которых достаточные условия не выполняются. Другими словами, условие А достаточно для выполнения заданного условия В.
Тема 12. Метод Лагранжа – Понтрягина для непрерывных управляемых процессов.
1. Уравнение метода.
Теоретической основой всех рассматриваемых вычислительных методов ТОУ являются ДУО. Эти условия проявляются как признак оптимальности применительно к непрерывным и дискретным управляемым процессам (x*, u*) в общем виде. Ставя при формулировке задач ТОУ ряд дополнительных ограничений на постановку задачи, получаем соотношения в форме Лагранжа – Понтрягина как необходимые условия оптимальности, которые вытекают из теоремы ДУО, отвечая необходимым условиям выполнения этих достаточных условий. Применительно к непрерывным управляемым процессам они известны в виде принципа максимума Понтрягина.
Рассмотрим задачу ТОУ для непрерывной системы: пусть заданы ДУ процесса
i= 1, …, n
(5)
x=(x1, x2, …, xn)
u=(u1, u2, …, ur),
где x – n – мерный вектор её состояния
u – r – мерный вектор управления.
На управление может быть наложено ограничение uVt
Где VtRt – некоторая область возможных значений управления (R – множество действительных чисел, векторов), которая может изменяться во времени
Для ДУ (5) будем считать заданное начальное состояние системы в виде совокупности условий
xi(0)=xi 0, i=1, 2, …, n
кроме того, может быть задано состояние системы в конечный момент времени t=T
xi(T)=xi 1, i=1, 2, …, m, mn (6)
представляющее дополнительные ограничения на протекающий в ней процесс (x(t), u(t)). Ограничения (6) могут быть заданы не по всем переменным, а лишь по некоторой их части, в данном случае по первым m.
Будем считать, что качество процесса оценивается функционалом
(7)
Если правый конец траектории процесса зафиксирован с помощью соотношений (6), то второе слагаемое в (7) является постоянной величиной и не влияет на нахождение оптимального решения.
Требуется определить процесс (x*(t), u*(t)), удовлетворяющий условиям (5, 6) и минимизирующий функционал. Такой процесс называется оптимальным.
Пусть (x*(t),
u*(t))
– допустимый процесс, удовлетворяющий
теореме о достаточных условиях
оптимальности. Это означает что существует
функция
,
обладающая тем же свойством, что и
выражение
(8)
Достигается при t[0;T] максимума по переменным x, u в точке (x*(t), u*(t)), а функция Ф(х)=(T, x) + F(x) принимает максимальное значение при х=х*(Т)
Этот процесс удовлетворяет достаточным условиям.
{При рассмотрении непрерывных систем, для формулировки теории вводятся 2 функции (R(t,x,u) и Ф(х), а для их построения вводятся функции (х) (не требует ни каких свойств типа непрерывности и дифференцируемости) переменных (t, x1, x2, …, xn)}
Для рассмотрения метода введём функцию Гамильтона:
i=1, 2, …, n,
где
-
вектор функция,
(x*(t))
означает, что после вычисления
вектор х должен принимать значение
(x*(t)).
С помощью функции Гамильтона функция
может быть записана в виде
(9)
Так как процесс (x*(t), u*(t)) удовлетворяет достаточным условиям оптимальности то
R(t, x*(t), u*(t))R(t, x, u)
Для всех (x,u)Vt, отсюда вытекает, что неравенство
R(t, x*(t), u*(t))R(t, x(t), u)
выполняется для всех допустимых значений управления uÎVt
Сравнивая полученные неравенство с (9)
получаем в качестве следствия (т.к.
слагаемое
не зависит от u), что
Это неравенство говорит о том что
выражение
,
рассматриваемое при каждом фиксированном
значении t[0;T]
как функция от u,
достигает максимального значения при
u=u*(t).
Это обстоятельство может быть выражено
в следующей форме.
(10)