
- •1.1.2. Условия лежандра
- •1.1.5. Функционалы со многими неизвестными
- •1.1.9. Задачи нл условный экстремум
- •1.1.10. О решении задач оптимального управления вариационными методами
- •1.2. Метод динамического программирования
- •1.2.1. Принцип оптимальности
- •1.2.2. Одномерная дискретная задача и вычислительные аспекты метода
- •1.2.3. Метод динамического программирования в непрерывной задаче. Уравнение беллмана
- •1.3. Принцип максимума понтрягина
- •1.3.1. Игольчатая вариация и условия оптимальности
- •1.3.2. Система сопряженных уравнений
- •1.3.3. Обобщения. Обсуждение результатов
- •Неавтономный объект с закрепленными концами траектории и фиксированным временем управления
- •Неавтономный объект с закрепленными концами траектории и нефиксированным временем управления
- •Неавтономный объект со свободным правым концом траектории и нефиксированным временем управления
- •Оптимальное управление автономными объектами
- •1.3.4. Вычислительные аспекты принципа максимума
1.3.2. Система сопряженных уравнений
Чтобы
воспользоваться принципом максимума
(1.86), необходимо определить вектор
;
он до сих пор не известен, хотя все
предыдущие выводы основывались на его
существовании. Продифференцировав
(1.83) по времени
,
запишем
(1.87)
Компоненты
вектора
являются бесконечно малыми, так как
порождены игольчатой вариацией,
существующей на бесконечно малом
интервале времени. Найдем уравнение,
которое их описывает. За основу принимаем
уравнение объекта (1.75) и предполагаем,
что переменные
при всех
изменились на бесконечно малые величины
.
Допуская дифференцируемость функции
по аргументу
,
из (1.75) в результате стандартной процедуры
линеаризации, основанной на разложении
нелинейных функций в ограниченный
линейными членами ряд Тейлора, получаем
уравнения в вариациях
(1.88)
где производная от вектора по вектору понимается как матрица вида
Учтем (1.88) в составе (1.87), тогда
Произведение
сомножителей в левой части этого
соотношения должно равняться нулю при
любых функциях
и
всех
.
Это возможно, если первый сомножитель
равен нулю, т.е.
(1.89)
или в скалярной форме
(1.90)
Уравнения
(1.89) или (1.90) образуют линейную систему,
позволяющую при граничных условиях
(1.81) совместно с уравнениями (1.75) и (1.86)
отыскать функции
участвующие в формировании функции
Гамильтона. Система (1.89) или (1.90) называется
сопряженной по отношению к системе
уравнений объекта (1.75). Обе системы часто
объединяют общей формой записи, основанной
на введенной функции Гамильтона (1.85).
Из сопоставления соотношений (1.75),
(1.85) и (1.89) нетрудно установить
или в скалярной форме
Эти соотношения называют каноническими уравнениями Гамильтона.
Оптимальное
управление ищут при совместном решении
уравнений (1.75), (1.86) и (1.90), содержащих
неизвестных
и
.
Соотношения (1.75) и (1.90) образуют систему
из
дифференциальных уравнений, решения
которых зависят от такого же числа
постоянных интегрирования. Для их
определения мы располагаем
начальными условиями (1.76) и
конечными условиями (1.81). Условие (1.86)
не приводит к дифференциальным уравнениям,
поэтому располагаем всеми данными,
достаточными для определения оптимального
управления из условия совместного
выполнения соотношений (1.75), (1.86) и (1.90).
1.3.3. Обобщения. Обсуждение результатов
Принцип максимума обобщается на другие варианты задачи оптимального управления. Приведем некоторые из этих обобщений.
Неавтономный объект с закрепленными концами траектории и фиксированным временем управления
Чтобы
управление
было оптимальным для
,
необходимо существование такой ненулевой
непрерывной вектор функции
,
соответствующей функциям
и сопряженной системе (1.89), чтобы при
любом
:
1) функция
,
определяемая соотношением (1.85), достигала
максимума по управлению
;
2)
.
Система
(1.90) должна решаться при таких начальных
условиях
,
при которых траектория объекта
,
найденная из решения системы (1.75) при
начальных условиях
и соответствующем условию (1.86) оптимальном
управлении, пройдет через граничную
точку
.
Эти начальные условия находят путем
последовательных приближений в
соответствии со специально разрабатываемыми
вычислительными схемами. Смысл
соответствующих операций сводится к
следующему. Для решения системы (1.75) и
(1.90), состоящей из
дифференциальных уравнений, необходимо
иметь
начальных
условий. Одна половина условий определена
заданным начальным состоянием объекта
,
другая половина зависит от начального
значения вектора
.
Если этим значением задаться произвольно
и решить совместно (1.75), (1.90) и (1.86), то
траектория
не пройдет через точку
.
Начальные условия
нужно изменить так, чтобы после повторения
всех вычислений траектория
прошла через заданную граничную точку.