
- •Раздел 4. Синтез оптимальных управлений
- •Раздел 4. Синтез оптимальных управлений
- •§1. Задача синтеза и ее обсуждение
- •§2. Принцип оптимальности Беллмана и его обоснование
- •§3. Уравнение Беллмана как необходимое условие оптимальности программного управления
- •§4. Достаточные условия оптимального синтеза
- •§5. Метод динамического программирования
- •§6. Связь метода динамического программирования с принципом максимума
- •§7. Примеры решения задач синтеза
- •Вопросы для самопроверки
§4. Достаточные условия оптимального синтеза
Для нахождения функции Беллмана V(t, x), являющейся, по определению, минимальным значением функционала качества в задаче (x, T – t), требуется интегрировать уравнение (4.10) с начальным условием (4.6). Это равносильно решению уравнения (4.10) "с конца".
Заметим, что вопросы существования и единственности решения задачи (4.10), (4.6), а также свойства ее решения в настоящее время изучены слабо. Здесь эта задача нас будет интересовать лишь с точки зрения решения проблемы синтеза.
Итак, предположим, что уравнение (4.10) выполнено и при этом справедливы предположения A, B.
Функцию, стоящую под знаком минимума в (4.10), обозначим
(4.12)
Для
каждой фиксированной точки (t, x)Г
минимум в (4.10) берется по множеству U
(а не по U).
Так как согласно предположениям U
компактно, а функция R
непрерывна по u,
то в любой точке (t, x)
существует такое
,
что
т.е.
уравнение (4.10) в каждой точке (t, x)Г
дает "мгновенное" оптимальное
значение какой-то функции
.
Эта функция может, вообще говоря, зависеть
от разных аргументов. Чтобы подчеркнуть
конкретную зависимость (т.е. конкретный
класс функций), говорят, что минимум в
(4.10) реализуется на функции вида u = u(t)
или u = u(x),
или u = u(t, x)
и т.д.
Гладкая функция V, зависящая от кусочно-гладкого решения x системы (4.1), в результате оказывается кусочно-гладкой по t. Поэтому за исключением, быть может, конечного числа моментов на отрезке [t,T] мы можем написать (см. (4.12)):
Интегрируя это уравнение на [t,T], получим:
Применяя условия (4.6) и (4.7), имеем:
Отсюда
(4.13)
Теорема 4.2. Пусть в (4.1)-(4.4) выполнены следующие условия:
в любой точке (t, x)Г выполнено условие (4.10) и существует удовлетворяющее предположению В решение V(t, x) этого уравнения с начальным условием (4.6);
минимум в (4.10) реализуется на функции вида
, удовлетворяющей требованиям а) и б) из определения 4.1 оптимального синтезирующего управления.
Тогда управление
(4.14)
является оптимальным синтезирующим управлением в задаче (4.1)-(4.4), а V(t, x) – функцией Беллмана.
Доказательство.
Рассмотрим произвольную (t, x)-задачу
(x, T – t).
Пусть
,
[t,T],
– допустимое управление из условия 2)
теоремы. По условию а) определения 4.1
существует единственная кусочно-гладкая
траектория
,
а по условию b) определения 4.1 функция
вида
кусочно-непрерывна на [t,T],
причем
для любых [t,T].
Для доказательства оптимальности (4.14)
достаточно показать выполнение для
него условия c) определения 4.1.
Так как
реализует минимум в (4.10) по условию 2),
то для всех uU,
xM()
справедливы соотношения
.
(4.15)
Для произвольного программного yправления u(), [t,T], в задаче (x,T–t) и для соответствующей ему траектории x()M(), [t,T], выполняются включения u()U для каждого [t,T]. Поэтому из (4.15) следует
(4.16)
Так как , из (4.13), (4.15) и (4.16) имеем:
(4.17)
т.е.
В силу произвольности управления
это неравенство означает оптимальность
программного управления
в задаче (x,T–t).
Таким образом, условие c) определения
4.1 выполняется и управление
,
вычисляемое по формуле (4.14), является
оптимальным синтезом в задаче (4.1)-(4.4).
Покажем теперь, что V(t, x) является функцией Беллмана. Из (4.17) видно
Отсюда (подставляя значение J(x, u) из (4.13)):
Тем самым показано, что V(t, x) и в самом деле является функцией Беллмана задачи (4.1)-(4.4), а функция , на которой достигается минимум в (4.10) – является оптимальным синтезирующим управлением для этой задачи. Теорема доказана.
Данная теорема дает достаточное условие оптимального синтеза в задаче (4.1)-(4.4), а также, и это будет использовано в следующем параграфе, показывает, как решение задачи оптимального синтеза сводится к решению уравнения Беллмана (4.10) с граничным условием (4.6).