
- •Раздел 3. Нелинейные задачи оптимального управления
- •Раздел 3. Нелинейные задачи оптимального управления
- •§1. Дополнительные сведения из теории дифференциальных уравнений и функционального анализа
- •§2. Задача Майера: постановка и обсуждение
- •§3. Теорема существования оптимального управления в задаче Майера
- •§4. Существование оптимального управления в задачах Больца и Лагранжа
- •§5. Принцип максимума в задачах с терминальным функционалом качества
- •§6. Принцип максимума в автономных задачах с закрепленными концами
- •§7. Принцип максимума в автономных задачах с подвижными концами
- •§8. Принцип максимума для неавтономных систем
- •§9. Общая схема применения принципа максимума для вычисления оптимального управления
- •§10. Примеры решения нелинейных задач оптимального управления с применением принципа максимума
- •Вопросы для самопроверки
Раздел 3. Нелинейные задачи оптимального управления
Раздел 3. Нелинейные задачи оптимального управления
§1. Дополнительные сведения из теории дифференциальных уравнений и функционального анализа
Цель первой части этого раздела – формулировка и обсуждение тех условий, при выполнении которых нелинейные задачи оптимального управления имеют решение. Теоремы существования оптимальных управлений, как правило, содержат два вида условий: одни условия должны обеспечить существование и единственность решения системы дифференциальных уравнений, описывающих динамику управляемого объекта, а другие – максимизацию или минимизацию вдоль допустимой траектории значения функционала качества в выбранном классе допустимых управлений.
Уравнение динамики управляемого объекта получается из классической системы обыкновенных дифференциальных уравнений вида
(3.1)
(или
в векторной форме
)
"добавлением" в правые части
управляющих параметров u1,
…, um.
Тогда правые части системы (3.1) превращаются
в "управляемые" функции
,
.
Напомним, что
правые части системы (3.1) определены на
некотором открытом множестве
,
а ее решением (интегральной кривой)
называется система функций
,
…,
,
заданных на
,
если эти функции дифференцируемы и
обращают (3.1) в тождество на
.
Из теории дифференциальных уравнений известны следующие теоремы существования решений системы (3.1).
Теорема
(Пеано). Если функции
непрерывны в области D,
то через каждую точку
проходит, по крайней мере, одна интегральная
кривая и эта кривая может быть продолжена
за границы области D.
В условиях этой
теоремы, если через точку
проходит более чем одна интегральная
кривая, то через нее проходит бесконечно
много интегральных кривых. Если же
функции
имеют частные производные по
,
непрерывные по t,
x1,
…, xn,
то через каждую точку
проходит единственная интегральная
кривая. Здесь условия дифференцируемости
можно заменить условиями Липшица: для
любых
,
существует такое число
(константа Липшица), что
Теорема (Пикара). Если функции непрерывны в области D и удовлетворяют условию Липшица, то через каждую точку области D проходит единственная интегральная кривая.
С практической точки зрения в задачах оптимального управления теоремы существования нужны для того, чтобы быть уверенным в существовании оптимального управления в рассматриваемом классе допустимых управлений прежде, чем приступить к вычислениям. Естественно, что существование или несуществование оптимального управления зависит и от выбранного класса допустимых управлений, от тех условий, с помощью которых определяется допустимость управления в данной задаче (гладкость, непрерывность, измеримость и т.д.). Обширность практических задач управления не позволяет вписывать всех их в такие "удобные" (с математической точки зрения) классы допустимых управлений, как гладкие, непрерывные и даже кусочно-непрерывные функции. Отсутствие оптимального управления в классах таких функций объясняется их "узостью" для большинства сложных задач управления. Поэтому, если выясняется, что, например, в классе кусочно-гладких функций оптимальное управление существовать не может, тогда приходится рассматривать этот вопрос в классе непрерывных, затем кусочно-непрерывных функций и т.д. Отсюда возникает необходимость разработки теории существования для более широких классов допустимых управлений. Именно таким является класс измеримых по Лебегу управлений. Теоремы существования оптимальных измеримых управлений основываются на соответствующих теоремах для дифференциальных уравнений вида (3.1) с разрывными правыми частями.
Предположим, что
в системе (3.1) функции
при любых фиксированных x1, …, xn
измеримы по t
и при каждом фиксированном t
непрерывны по x1, …, xn.
В таком случае решением системы (3.1)
называются абсолютно непрерывные на
каждом отрезке
функции
,
.
(3.2)
Говорят, что функции
удовлетворяют обобщенному условию
Липшица, если при любых t
и фиксированных значениях
,
…,
выполняется неравенство
,
где
– интегрируемая по Лебегу функция.
Теорема (Каратеодори). Пусть в области для всех
измеримы по t при каждом x и непрерывны по x при всех t;
, где m(t) – интегрируемая по Лебегу функция.
Тогда
для каждой точки
существует хотя бы одно абсолютно
непрерывное решение (3.2) системы (3.1).
Если при этом выполняется обобщенное условие Липшица, то это решение единственно.
Приведем далее те сведения из функционального анализа, которые будут нам нужны для доказательства теорем существования оптимальных управлений в нелинейных задачах.
Пусть
функция m(t)
непрерывна на
и удовлетворяет неравенству
,
где
.
Тогда для любых
.
(3.3)
Неравенство (3.3) называется неравенством Гронуолла.
Множество
X
функций
называется равностепенно
непрерывным
на
,
если для заданного
существует такое
,
что
для всех функций из X,
как только
.
Множество
X
называется равномерно
ограниченным,
если существует такое постоянное число
,
что
для всех
и для всех
.
Теорема
(Асколи). Пусть X
– множество равностепенно непрерывных
и равномерно ограниченных функций,
определенных на отрезке
.
Тогда любая последовательность
содержит подпоследовательность
,
которая равномерно сходится на
.
В
пространстве
измеримых на
функций с конечной нормой
,
,
для
любых двух функций
справедливо неравенство
,
,
называемое (интегральным) неравенством Гельдера.