
- •Раздел 3. Нелинейные задачи оптимального управления
- •Раздел 3. Нелинейные задачи оптимального управления
- •§1. Дополнительные сведения из теории дифференциальных уравнений и функционального анализа
- •§2. Задача Майера: постановка и обсуждение
- •§3. Теорема существования оптимального управления в задаче Майера
- •§4. Существование оптимального управления в задачах Больца и Лагранжа
- •§5. Принцип максимума в задачах с терминальным функционалом качества
- •§6. Принцип максимума в автономных задачах с закрепленными концами
- •§7. Принцип максимума в автономных задачах с подвижными концами
- •§8. Принцип максимума для неавтономных систем
- •§9. Общая схема применения принципа максимума для вычисления оптимального управления
- •§10. Примеры решения нелинейных задач оптимального управления с применением принципа максимума
- •Вопросы для самопроверки
§4. Существование оптимального управления в задачах Больца и Лагранжа
Задачу Больца поставим в следующей общей форме:
(3.13)
Задача
(3.13) рассматривается в том же классе
допустимых управлений
,
что и задача (3.4).
Множество обобщенных скоростей определим следующим образом: для каждого состояния
.
Теорема 3.3. Пусть в задаче (3.13) выполнены следующие условия:
условия 1)-4) и 8) (для
) теоремы 3.1;
– непустое, компактное для каждого в и непрерывное в
множество;
M0(t) и M1(t) – непустые, компактные для каждого в Rn и непрерывные на [t0,T] множества;
f 0 – скалярная непрерывная по всем переменным (т.е. в ) функция;
F – непрерывна в Rn.
Тогда в задаче
(3.13) существует оптимальное управление
Ввиду ограниченности
объема учебного пособия, доказательство
этой теоремы приводить не будем.
Доказательство, построенное по схеме
доказательства теоремы 3.1, можно найти
в [36], стр. 97. Другой способ доказательства
теоремы 3.3 может состоять в сведении
задачи Больца (3.13) к задаче Майера (3.4).
Для этого введем дополнительную фазовую
переменную
из условий
(3.14)
Отсюда для каждого
.
Следовательно, функционал качества в задаче (3.13) можно представить в виде
,
где
.
В итоге задача Больца (3.13) получит
следующую форму (задачи Майера):
;
,
;
,
в
фазовом пространстве
(
),
где
,
,
,
.
Если в построенной таким образом задаче Майера существует оптимальное управление (см. теорему 3.1), то оно существует и в исходной задаче Больца (3.13).
Если
,
то задача (3.13) превращается в задачу
Лагранжа. Нетрудно видеть, что
преобразование (3.14) превращает задачу
Лагранжа в задачу Майера.
Теорема 3.4. Пусть в задаче Лагранжа, которая получается из (3.13) при , выполнены условия a)-d) теоремы 3.3. Тогда в задаче Лагранжа существует оптимальное управление
Заметим также, что для перехода от задачи Майера к задаче Лагранжа достаточно использовать преобразование
Следовательно,
(
).
Положим
,
.
Тогда
,
и мы получили задачу Лагранжа с функционалом
.
В
завершение параграфа приведем еще одну
теорему существования для нелинейной
задачи Лагранжа, в которой нет ограничений
на управляющие параметры вида
,
т.е. когда
.
Рассмотрим задачу
(3.15)
где f, h, f 0, h 0, вообще говоря, нелинейные функции.
Под
допустимым
управлением
понимается любая функция
,
которая вместе с соответствующей
траекторией
доставляет критерию качества
конечное значение.
Здесь
– пространство измеримых на интервале
функций с нормой
,
.
(3.16)
Из неравенства Гельдера (см. §1) получаем:
,
.
(3.17)
Поэтому, введя норму
,
(3.18)
считаем,
что каждое допустимое управление
принадлежит пространству
.
Теорема 3.5. Пусть в задаче (3.15) выполнены следующие условия:
f, h, f 0, h 0 – непрерывные по
,
,
функции;
f, h непрерывно дифференцируемы по x;
для каждого
;
для каждого
, где
,
– постоянные числа;
h 0 выпукло по u при любом ;
, где
– монотонно возрастающая функция
.
Тогда
в задаче (3.15) существует оптимальное
управление
.
Доказательство.
Из условий 3) и 4) следует
,
поэтому существует неотрицательная
нижняя грань m
значений
.
Пусть
– последовательность допустимых
управлений таких, что
при
.
Тогда можно написать для любого
.
Следовательно (см. условия 4) и 3)),
для
достаточно больших k.
Поэтому можно выбрать подпоследовательность
,
которая сходилась бы к некоторому
пределу
и такую, что
.
(3.19)
Из (3.16)-(3.18) получаем:
,
где
.
Поэтому все траектории
равномерно ограничены:
.
Для
любых
имеем оценку
.
Таким образом, существует постоянная , не зависящая от k, для которой
.
Здесь
c
– наибольшая из неотрицательных нижних
граней
и
(см. условия 3), 4)). Применяя (3.19), из
последнего неравенства получаем:
.
Следовательно, семейство функций является равностепенно непрерывным на интервале .
Из
теоремы Асколи следует, что можно выбрать
подпоследовательность
так, что
при каждом .
Покажем,
что траектория
порождена управлением
.
Распишем последнее равенство:
.
По
определению пределов
и
имеем равномерно выполняющиеся равенства:
,
,
.
Пользуясь
этими равенствами и равенством (3.17),
написанным для
,
можно доказать, что
.
Отсюда следует, что
,
т.е. есть траектория, порожденная управлением .
Для минимизирующей последовательности и ее предела справедливо
.
Из этого неравенства и из выпуклости по u следует, что
.
Следовательно,
и
есть оптимальное управление в задаче
(3.15). Теорема доказана.