- •9. Теория оптимального управления
- •9.1. Определения
- •9.2. Стратегия управления
- •9.6. Уравнение Эйлера
- •9.12. Динамическое программирование
- •9.11. Принцип максимума л.С.Понтрягина
- •9.11.1. Допустимые управления
- •9.11.2. Управление автономной системой
- •9.11.3. Основная теорема (принцип максимума)
- •9.12. Применение уравнения Эйлера для решения технических задач
- •9.12.1. Электрический привод постоянного тока
- •9.12.2. Формулировка задачи оптимального управления электропривода
- •9.12.3. Оптимальная диаграмма тока при постоянном моменте сопротивления.
9.11.2. Управление автономной системой
Рассмотрим метод решения задач оптимального управления при отсутствии ограничений на фазовые координаты. Система (9.75) называется автономной, если в ее правую часть явно не входит время t.
Пусть в фазовом
пространстве Х
заданы две точки x0
= (
)
и x1
= (
).
Если начальное и конечное положения
изображающей точки в фазовом пространстве
определены по всем n
координатам, то задачу об оптимальном
управлении называют задачей с закрепленными
концами.
Рассмотрим следующую задачу. Требуется среди допустимых управлений u(t), t0 ≤ t ≤ t1, т.е. кусочно-непрерывных вектор-функций u(t) U (моменты t0 и t1 не фиксированы), переводящих фазовую точку системы (9.75) из заданного начального положения x0 (x(t0) = x0) в заданное конечное положение x1 (x(t1) = x1), найти управление и траекторию при ограничениях вида (9.76) или (9.77), минимизируя при этом функционал
i
= 1:n,
j
= 1:m.
Управление u(t) и траектория х(t), решающие поставленную задачу, называются оптимальными.
Особое внимание уделяется частному случаю, когда f0 = 1. В этом случае функционал
задает время движения. Управление и траектория, минимизирующие функционал, называются оптимальными по быстродействию.
Как показано выше (см. п. 9.6) уравнения Эйлера (9.10) представляют собой систему n уравнений второго порядка. Такую систему всегда можно свести к системе 2n уравнений первого порядка. Наиболее удобны уравнения Эйлера в так называемой форме Гамильтона.
Введем новые переменные
(9.80)
и функцию
,
(9.81)
где ψi – канонические переменные, H – функция Гамильтона.
Из выражения (9.81) следует, что
,
i
= 1:n
(9.82)
Уравнения Эйлера (9.10) перепишутся в виде
,
i
= 1:n.
(9.83)
Из выражения (9.81) также следует
,
i
= 1:n.
(9.84)
Объединяя уравнения (9.83), (9.84) получаем так называемую Гамильтонову форму уравнений Эйлера (2n уравнений Эйлера-Гамильтона)
(9.85)
9.11.3. Основная теорема (принцип максимума)
Пусть u(t) – управление, переводящее изображающую точку из положения x(t0) в положение x(t1), t0 ≤ t ≤ t1, а x(t) – соответствующая этому управлению траектория, переводящая фазовую точку х системы (9.75) из заданного начального положения х0 в заданное конечное положение х1,.где x(t0) = х0, x(t1) = х1.Если управление u(t) и х(t) – оптимальное управление и оптимальная траектория, то найдется такая непрерывная вектор-функция ψ(t), удовлетворяющая уравнениям
(9.86)
что:
в каждый момент времени t, t0 ≤ t ≤ t1, функция H(ψ(t), x(t), u), рассматриваемая как функция переменного u, достигает в точке u =u(t) максимума
H[(ψ(t), x(t), u(t)] = М[(ψ(t), x(t)];
выполнено условие нетривиальности решения системы уравнений (9.86)
ψ(t) ≠ 0;
в конечный момент времени t1
Для задачи о максимальном быстродействии, когда функционалом, минимум которого отыскивается, является время
(9.69)
уравнение для
переменного ψ0
отпадает и функция
принимает вид
Оказывается, что при оптимальном управлении функции H(t) и ψ0(t) остаются постоянными и принимают значения:
H(t), a ψ0(t) ≤ 0. (9.70)
Сформулированное условие является лишь необходимым, а не достаточным. Принцип максимума устанавливает связь между управлением и координатами прямой и сопряженных систем. В связи с этим решение задачи сводится к выбору таких начальных значений сопряженной системы, при которых фазовая траектория управляемой системы будет переходить из начального xi(t0) в требуемое конечное положение xi(t1).
Заметим, что задачу
о минимуме любого функционала (9.62) можно
свести к задаче о быстродействии, введя
новую переменную
и
дополнительное уравнение
Пользуясь теоремой
о максимуме, можно фактически определять
оптимальные уравнения uj(t),
доставляющие минимум функционалу (9.62)
при учете уравнений связи (9.61).
Действительно, для определения 2n+k
неизвестных функций x1,
x2,…,
xn,
ψ1,
ψ2,…,
ψn,
u1,
u2,…,
uk
имеем
уравнений (9.65) и (9.66) и k
уравнений следуют из условия максимума
гамильтониана H
(9.64) по управлениям u1,
u2,…,
uk.
Отметим, что, используя теорему о
максимуме, мы отыскиваем решение не в
классе кусочно-гладких функций, а в
более обширном классе – классе
кусочно-непрерывных функций.
Пример 9.6.
Найти для объекта
= х2,
=
u
управление, которое переводит объект
из состояния х(0)
= (1;1) в состояние покоя за 5 секунд,
затратив минимум энергии. Функционал
качества
,
множество цели – точка х(5)
= (0;0).
Решение. Составим функцию Гамильтона (9.81)
H(х, u, ψ) =-u2 + ψ1х2 +ψ2u.
Максимизируем функцию Гамильтона по управлению и найдем оптимальное управление:
Получаем значение оптимального управления u* = 0,5 ψ2(t).
Каноническая система будет представлена уравнениями:
= х2; = 0,5 ψ2(t);
х1(0) = х2(0) = 1; х1(5) = х2(5) = 0;
Используя (9.83),
получаем
Из канонической системы следует:
Постоянные интегрирования находим из краевых условий:
t = 0 С3 = С4 = 0; С1 = -0,67; С2 = -2,079.
Оптимальное управление u* = (0,67t – 2,08)/2.
.
