
- •Содержание и предмет “Теории оптимального управления”
- •Экономическая задача решается в трёх измерениях:
- •Тема 1. Характерные особенности теории и практики оптимального управления.
- •1. Управление – наука и искусство.
- •2. Сложность и актуальность теории эффективного управления.
- •Тема 2. Управление как система.
- •Тема 7. Основы моделирования экономических процессов.
- •Система, модель, моделирование.
- •Системные признаки:
- •Таким образом, для выделения системы требуется наличие:
- •Управление. Обратная связь. Замкнутая система.
- •В структуре системы управления можно выделить:
- •Экономическая система как объект управления.
- •В целом можно представить себе одну из двух альтернатив:
- •Тема 8. Оптимизационные модели экономической динамики.
- •Однопродуктовая динамическая макроэкономическая модель.
- •Р ис.1. Принципиальная схема производства и распределения продукции
- •Однопродуктовая оптимизационная динамическая макроэкономическая модель.
- •Модель примет следующий вид:
- •Тема 9. Исследование однопродуктовой макромодели оптимального развития экономики.
- •1. Моделирование производства на макроуровне.
- •2. Модель развития экономики.
- •Тема 10. Задача управления.
- •1. Задача управления и её формулировка.
- •Переменные величины – управляющие параметры. Множество функций – множество управления времени.
- •2. Виды управления. Управление по разомкнутому контуру.
- •Управление по замкнутому контуру (с обратной связью)
- •Тема 11. Достаточные условия оптимальности.
- •Тема 12. Метод Лагранжа – Понтрягина для непрерывных управляемых процессов.
- •1. Уравнение метода.
- •2. Принцип максимума Понтрягина.
- •Тема 13. Задача Эйлера вариационного исчисления.
- •Случаи:
- •Тема 14. Уравнение Беллмана.
- •1. Идея, основные элементы уравнения Беллмана.
- •2. Синтез оптимального управления.
- •Тема 16. Оптимальное управление
- •Тема 17. Динамическое программирование.
- •Выделим особенности модели динамического программирования:
Случаи:
Постоянная индикатриса, т.е.,
=
Индикатриса с ограниченной нелинейностью по управлению.
Выпуклая
, её исследование можно провести с помощью принципа максимума. В соответствии с принципом необходимо построить функцию Гамильтона.
т.к., ограничений на построение x и u нет, то применим необходимое условие максимума функции Гамильтона.
отсюда получаем
(4)
система уравнения процесса и сопряжённое уравнение, используя ограничение (2)
(5)
Решая систему двух дифференциальных уравнений 2 и 5 относительно искомых переменных х и , с учётом выражения 4 получаем процесс, удовлетворяющий необходимым условиям.
Тема 14. Уравнение Беллмана.
1. Идея, основные элементы уравнения Беллмана.
При постановке задачи ТОУ предполагалось, что такие элементы, как начальное состояние и начальный момент t, фиксированы. Но это не всегда выполняется на практике. При решении конкретной задачи оказывается удобным рассматривать её в составе множества качественно однотипных задач, описываемых теми же уравнениями процесса и функционалом, но с различными значениями перечисленных параметров.
Определяя оптимальное управление сразу для всего множества таких задач, получим решение в форме синтеза, которое будет представлять зависимость качественных свойств оптимального управления от состояния системы и текущего момента времени. Из этой задачи нетрудно получить решение для любых фиксированных начальных условий в обычной форме, т.е. найти оптимальное управление как функцию времени.
Решение подобных задач обладает рядом преимуществ. Главное из них состоит в том, что имеется полная информация об оптимальном управлении. Если при этом реализовались заранее неизвестные значения состояния системы, а на практике это типичная ситуация, то значение синтеза оптимального управления позволяет принять оптимальное решение в данной ситуации.
Поиск синтеза оптимального управления, т.е. совокупности качественно однородных свойств системы, – это более трудоемкая процедура по сравнению с решением обычной задачи оптимального управления.
С математической точки зрения отыскания синтеза оптимального управления сводится к решению нелинейного дифференциального уравнения с частными производными, называемого уравнением Гамильтона – Якоби – Беллмана (для непрерывных процессов). Сложность численного решения этого уравнения сильно возрастает с увеличением размерности решаемой задачи. Для дискретных процессов это менее сложно.
По исследованию операции представление о преемственности метода лишь к дискретным процессам.
Рассмотрим задачи оптимального управления с условием:
(1)
(2)
х(0)=х0; uÎVtх (3)
Из условий видно что отсутствуют ограничения на состояние, а множества допустимых управлений Vtх в отличие от принципа максимума (uVt) не зависит от состояния х.
Т.е. множество при всех t[0;T] совпадает с пространством х, а при t=0 задано начальное условие – фиксированная точка х0. Ограничения на состояние х в момент t=T не задан.
Для получения уравнения Гамильтона – Якоби – Беллмана необходимо воспользоваться теоремой о достаточных условиях оптимальности, согласно которой если есть допустимый процесс
V*= (x*(t), u*(t))М и непрерывно дифференцируемая функция (t, x) такие что при всех t, x
R(t, x*(t), u*(t))=
R(t,
x, u), t[0;T]
при
t=T
то процесс (x*(t), u*(t)) оптимален, т.е.,
(x*, u*)=
Известно, что
Ф(х)=(Т,х) + F(х)
Введём функцию:
Р(t,х) = max R(t, x, u)
(заданная и непрерывная функция) предположим, что удалось так определить функцию (Т,х) что
Р(t,х) =с(t)
с(t) – произвольное число, которое м.б. равно 0.
Ф(х)=с1
Т.к. функция (t, x) задана, следовательно задана и функция R(t, x, u) максимизируя которую по управлению uVtх, найдём u*(t, x):
u*(t, x)=
R(t, x, u)
u*(t,x) является синтезом оптимального управления, решением рассматриваемой оптимизационной задачи. Для определения оптимального состояния вектора x*(t) подставим синтез от управлений u*(t, x) в уравнение процесса
х(0)=x0
(4)
Определение оптимального состояния x*(t) сводится к решению задачи Коши (4) для уравнения процесса, замкнутого синтезом оптимальных управлений с начальными условиями х(0)= x0
В отличие от синтеза оптимального управления u*(t, x) функцию
(5)
называют оптимальной программой управления.
Данное определение отражает, что оптимальная программа управления (ОПУ), определяемая формулой (5) отвечает уже не произвольному состоянию х, а конкретному оптимальному х*(t).
Изложенный метод нахождения процесса (х*(t); u*(t)), при априорных5 ограничениях наложенных на функцию (t,x), называется методом Гамильтона – Якоби – Беллмана. В этом случае процесс х*(t), u*(t) является оптимальным.