
- •Раздел 3. Нелинейные задачи оптимального управления
- •Раздел 3. Нелинейные задачи оптимального управления
- •§1. Дополнительные сведения из теории дифференциальных уравнений и функционального анализа
- •§2. Задача Майера: постановка и обсуждение
- •§3. Теорема существования оптимального управления в задаче Майера
- •§4. Существование оптимального управления в задачах Больца и Лагранжа
- •§5. Принцип максимума в задачах с терминальным функционалом качества
- •§6. Принцип максимума в автономных задачах с закрепленными концами
- •§7. Принцип максимума в автономных задачах с подвижными концами
- •§8. Принцип максимума для неавтономных систем
- •§9. Общая схема применения принципа максимума для вычисления оптимального управления
- •§10. Примеры решения нелинейных задач оптимального управления с применением принципа максимума
- •Вопросы для самопроверки
§7. Принцип максимума в автономных задачах с подвижными концами
Рассмотрим задачу (3.32)-(3.36), в которой вместо конечной точки x 1 дано целое множество M 1 Rn. Требуется из точки x 0 привести систему (3.32) в любую точку x 1 M 1 так, чтобы минимизировался функционал (3.36).
Будем считать, что множество M 1 задано системой
i(x) = 0, i = 1, ..., k, (3.42)
т.е.
.
Для каждой фиксированной точки x 1 M 1 получаем задачу (3.32)-(3.36). Поэтому в каждом конкретном случае в пределах множества M 1 справедлива теорема 3.8 или теорема 3.9 в зависимости от фиксированности или нет времени Т.
Изменение
формулировки необходимых условий в
задаче с подвижным правым концом
заключается в замене условия (3.35) на
правом конце оптимальной траектории
на граничное условие для сопряженной
системы (3.38). Оно заключается в
ортогональности вектора
множеству M 1
в точке
и называется условием
трансверсальности
(см. также §5).
Выведем аналитический
вид этого условия. Пусть в момент Т
система (3.32)-(3.33) пришла в точку
(см. рис. 3.4), т.е.
(3.43)
По определению, для касательной гиперплоскости Pi в точке x* и для любой точки xPi
Это есть уравнение касательной гиперплоскости Pi. Составим пересечение всех касательных гиперплоскостей в точке x*:
.
Это есть линейное множество, касательное к M 1 в точке x*.
Условие трансверсальности на правом конце заключается в ортогональности вектора этому множеству P, т.е.
для всех xP.
Так как 0 есть
минимальное значение скалярного
произведения на многообразии P,
то точка
является решением следующей задачи:
Необходимым и достаточным условием оптимальности в этой задаче является равенство
(3.44)
где i – множители Лагранжа. Это и есть окончательный аналитический вид условия трансверсальности.
Принцип максимума для задачи (3.32)-(3.36) с подвижным правым концом принимает следующую форму.
Теорема 3.10. Пусть – оптимальный программный процесс в задаче (3.32)-(3.36) с подвижным правым концом, где M 1 имеет вид (3.42). Тогда существуют непрерывные вектор-функции , ..., и число такие, что выполняются условия 1)-3) теоремы 3.8 и условие (3.44) вместе с равенством (3.43). Если время Т нефиксировано, то, кроме того, имеет место условие 4) теоремы 3.8.
Аналогично можно получить условие трансверсальности в задаче с подвижным левым концом (x 0M 0, x (T) = x 1):
§8. Принцип максимума для неавтономных систем
Рассмотрим следующую задачу:
, t0 t T (T – нефиксировано), (3.45)
x(t0) = x 0, (3.46)
u(t)U, t0 t T, (3.47)
x(T) = x 1, (3.48)
(3.49)
Предположим функции f0, f1, …, fn непрерывными по всем переменным и непрерывно дифференцируемыми по t и x; U – множество кусочно-непрерывных управлений с условием (3.47).
Принцип максимума для (3.45)-(3.49) можно получить из принципа максимума для автономных задач с подвижным правым концом (см. теорему 3.10).
"Превратим"
время t
в фазовую координату:
,
тогда
,
.
Тогда задача (3.45)-(3.49) запишется так:
(3.50)
где L – прямая, параллельная оси Oxn+1.
Получили автономную
задачу с подвижным правым концом. Так
как задача (3.50) эквивалентна задаче
(3.45)-(3.49), то оптимальный в задаче
(3.45)-(3.49) процесс
является оптимальным в задаче (3.50).
Поэтому, согласно теореме 3.10, существуют
непрерывная вектор-функция
и число
,
удовлетворяющие условиям 1)-3) теоремы
3.8.
Равенство (3.40) записывается так:
,
t0 t T.
(3.51)
Условие
трансверсальности на правом конце
означает ортогональность вектора
к прямой L
и поэтому имеет вид
.
(3.52)
Наконец, предположение
о том, что вектор
не является тривиальным, остается в
силе.
Итак, принцип максимума в задаче (3.45)-(3.49) можно сформулировать следующим образом.
Теорема 3.11.
Пусть
– оптимальный программный процесс в
задаче (3.45)-(3.49) с нефиксированным временем
Т.
Тогда существуют непрерывная вектор-функция
и число
такие, что
выполнены первые три условия теоремы 3.8, где fi = fi (t, x, u), i = 0,1, ..., n;
;
выполнено равенство (3.51).
Примечание. Условие трансверсальности, как таковое, в теореме 3.11 отсутствует, так как оно задается условием (3.52), а переменной n+1 в теореме 3.11 нет.
Принцип максимума в задаче (3.45)-(3.49) с фиксированным временем отличается от теоремы 3.11 тем, что в нем отсутствует условие (3.51).
В неавтономных задачах с подвижными концами имеет место теорема 3.11 с дополнительными условиями трансверсальности на соответствующих концах траекторий, которые записываются как в автономной системе (см. §6 этого раздела).