
- •Раздел 3. Нелинейные задачи оптимального управления
- •Раздел 3. Нелинейные задачи оптимального управления
- •§1. Дополнительные сведения из теории дифференциальных уравнений и функционального анализа
- •§2. Задача Майера: постановка и обсуждение
- •§3. Теорема существования оптимального управления в задаче Майера
- •§4. Существование оптимального управления в задачах Больца и Лагранжа
- •§5. Принцип максимума в задачах с терминальным функционалом качества
- •§6. Принцип максимума в автономных задачах с закрепленными концами
- •§7. Принцип максимума в автономных задачах с подвижными концами
- •§8. Принцип максимума для неавтономных систем
- •§9. Общая схема применения принципа максимума для вычисления оптимального управления
- •§10. Примеры решения нелинейных задач оптимального управления с применением принципа максимума
- •Вопросы для самопроверки
§3. Теорема существования оптимального управления в задаче Майера
Сначала докажем несколько лемм, приводящих к доказательству теоремы существования оптимального управления в задаче (3.4).
Так
как множества M0
и M1
компактны, то управление
можно продолжить за пределы
.
Более точно, существуют такие
и
,
что для управления
(3.10)
(
– любой фиксированный элемент из U)
и соответствующей ему траектории
,
.
Обозначим
через X 0
множество всех решений (3.5), определенных
на
.
Лемма
3.1. Существуют
такие постоянные
,
что для всех
и
a)
(т.е. X 0
равномерно ограничено);
b)
,
.
Доказательство.
Так как M0
компактно, то
(здесь
).
Из ограниченности интеграла в (3.5) как
непрерывной функции верхнего предела
на ограниченном интервале
следует
для всех
.
Согласно (3.8),
,
.
В
условии a) можно взять
.
Тогда в силу (3.5) и (3.6)
,
где
.
Лемма доказана.
Пусть
– некоторая последовательность
допустимых управлений. Продолжим
на интервал
указанным в (3.10) способом и пусть
– решение вида (3.5), соответствующее
и определенное на
.
Совокупность соответствующих граничных
параметров обозначим
,
где
,
.
Лемма
3.2. Существует
такая минимизирующая последовательность
,
что
равномерно сходится к
на
при
.
Кроме того,
удовлетворяет условиям a)
и b)
леммы 3.1 и
сходится к e*.
Доказательство.
Пусть
– некоторая минимизирующая
последовательность, а
– соответствующие решения вида (3.5). Так
как M0
и M1
– компактные множества, то
ограничена. Используя теорему Асколи
(см. §1) для X 0,
получаем, что существует такая
подпоследовательность
,
что
сходится равномерно на
к некоторому
,
а
сходится к e*
при
.
Обозначим
.
Так как
удовлетворяет условиям a)
и b)
леммы 3.1 при каждом
,
то
также удовлетворяет этим условиям.
Поскольку
стремится к e*,
а
равномерно сходится к
,
то
,
.
Лемма доказана.
В
следующих двух леммах докажем существование
такого управления
,
что соответствующая траектория
при
,
,
удовлетворяет равенству (3.5).
Заметим,
что функция
,
построенная в лемме 3.2, удовлетворяет
условию Липшица (3.7), значит, она абсолютно
непрерывна, следовательно, производная
существует почти всюду.
Лемма
3.3. Пусть в
задаче (3.1) множество
выпукло для каждого
.
Тогда если
существует, то для каждого
.
Доказательство.
При
и
под
понимаются соответственно левая и
правая производные. Пусть
.
Обозначим для простоты
и рассмотрим -окрестность
множества W:
,
где
.
Так как W
– выпуклое множество, то
тоже выпуклое множество. Непрерывная
функция f
равномерно непрерывна на компактном
множестве
(см. условие a)
леммы 3.1). Следовательно, существует
положительная последовательность
,
стремящаяся к нулю при
,
для которой
,
когда
.
В
частности, пусть
,
,
и используем неравенство
.
Пусть
и
,
,
(
).
Выберем
так, чтобы
при
,
.
Пусть
.
Тогда
,
и, значит,
,
когда
,
.
Ввиду (3.5)
,
.
Так
как
– выпуклое множество и
,
правая часть этого равенства принадлежит
.
Пусть
.
Так как
– замкнутое множество, получаем, что
,
.
Пусть
,
тогда
.
Но число
было выбрано произвольно. Следовательно,
.
Лемма доказана.
Лемма 3.4. Существует такое управление , что
(3.11)
почти всюду на интервале .
Доказательство.
Согласно лемме 3.3 и определению множества
получаем, что существует управление
,
удовлетворяющее (3.11). Однако для того,
чтобы
,
необходимо, чтобы функция
была интегрируемой по Лебегу. Это, в
свою очередь, гарантируется леммой об
измеримом выборе ([36], стр. 277). Лемма
доказана.
Теперь сформулируем и докажем основную теорему.
Теорема 3.1. Пусть в задаче Майера (3.4) выполнены следующие условия:
f непрерывна по всем переменным (т.е. в );
существует такое постоянное число
, что для всех ,
и
;
существует такое постоянное число
, что для всех , и ;
;
U компактно в ;
M0 и M1 компактны в ;
F непрерывна на M1;
множество обобщенных скоростей выпукло для каждого .
Тогда
в задаче (3.4) существует оптимальное
управление
.
Доказательство.
Пусть
,
,
,
,
e*
такие же, как в лемме 3.2, а управление
такое же, как в лемме 3.4. Так как M0
и M1
– компактные множества и
,
,
то
,
.
Кроме того,
,
соответствующее
,
удовлетворяет равенству (3.5). Поскольку
F
– непрерывная функция, то
при
.
Но последовательность
стремится к
,
так как эта последовательность
минимизирующая. Следовательно,
.
Отсюда
следует, что функция J
достигает минимума на U
при
.
Теорема доказана.
Замечание.
Если в реальной задаче управления
условие 8) теоремы 3.1 не выполняется, то
в рассматриваемом классе U
оптимальное управление не существует.
Именно по этой причине в примере 3.1 (см.
§2) отсутствует оптимальное управление.
Действительно, множество
представляет собой часть плоскости,
заключенную между параболами (рис. 3.3),
и потому не является выпуклым.
В таком случае
расширяют множество U
следующим образом. На множестве U
определяют вероятностную меру (т.е. для
каждого подмножества множества U
определяют вероятность его появления).
Тогда под управлением понимается любое
отображение ,
которое каждому t
ставит в соответствие некоторую
вероятностную меру (t)
на U.
Такие управления называются с
кользящими
режимами. B
результате множество
становится выпуклым и теорему 3.1 можно
применить к задаче (3.1) (для существования
оптимального скользящего режима).
Из теоремы 3.1 можно вывести условия существования оптимального управления в нелинейных задачах на быстродействие (см. пример 3.1 и замечание к теореме 3.1).
Рассмотрим следующую задачу:
(3.12)
где T – (нефиксированный) момент прихода фазовой точки (траектории) во множество М.
Теорема 3.2. Пусть в задаче (3.12) выполнены условия 1)-5) и 8) теоремы 3.1. Пусть, кроме того, множество М компактно. Тогда в задаче (3.12) существует управление , которое переводит систему из точки x0 во множество М за минимальное время.
Докажите эту теорему самостоятельно.