Лекция № 10
ПРИНЦИП МАКСИМУМА
В ряде практических задач оптимизации объектов управления экстремум функционала (3.91) при заданных уравнениях объекта (3.92) обеспечивается при управлении u(t), имеющем разрывы первого рода. При этом координаты также имеют разрывы, положение и число которых заранее неизвестны. Эти обстоятельства затрудняют применение классического вариационного исчисления для некоторых задач оптимизации, которые могут быть решены методом, разработанным акад. Л.С.Понтрягин и названным принципом, максимума.
Задачай оптимизации является определение оптимальных управлений u°(t) и траектории Х°(t) из условия минимума функционала (3.91) для заданных уравнений объекта (3.92) при начальных X(t0) и конечных X(tк) значениях, заданном интервале времени t0 t tк с учетом ограничений вида X(t) x, u(t) u .
Функции управления u(t) допускают разрывы первого рода (см. кривую 1 на рис. 3.6). Так как координаты выхода xi(t) не являются гладкими, то канонические уравнения (3.78) и (3.80) при введенных множителях Лагранжа (3.76) и функции Гамильтона (3.77) не могут быть непосредственно применены для определения оптимальных управлений. Объясняется это тем, что из-за разрывов первого рода вариация функции u(t) может быть большой, следовательно, большой будет и вариация функционала. В результате этого в выражении (3.56) уже нельзя ограничиваться только линейными относительно вариаций функций u(t) и х(t) членами, а следует учитывать также нелинейные члены. В связи с этим было введено понятие игольчатой вариации [12].
Игольчатая вариация представляет собой приращение варьируемой функции оптимального управления u°(t) на бесконечно малом отрезке времени в виде импульса ограниченной величины (см. кривую 4 на рис. 3.6) с учетом u(t) u. Влияние такой вариации на последующее движение объекта управления в интервале < t < tк бесконечно мало, поскольку влияние любого импульса оценивается величиной его площади (u – u°) е, которая в данном случае бесконечно мала. Следовательно, приращение функционала при игольчатой вариации управления будет бесконечно малым. Оно обращается в нуль, т. е. выполняется условие экстремума (3.58) функционала (3.54), когда игольчатая вариация производится относительно оптимального управления u°(t).
Основные уравнения и их применение для синтеза оптимальных систем. Рассмотрим кратко сущность принципа максимума. Пусть математическая модель объекта оптимизации задана в виде уравнений состояния
, (3.113)
где i = 1, 2, ..., n; r – количество координат управления. Уравнение (3.113) можно представить в векторной форме
. (3.114)
Сигналы управления могут иметь ограничения для всех координат
.
Зададимся некоторой функцией f0(Х, u) и будем считать, что цель управления объектом будет достигнута, если изображающая точка из начального положения Х0 с координатами (х10, х20, ..., хn0) в n-мерном фазовом пространстве переместится в положение Х1 с координатами (x11, x21, …, xn1).
При оптимизации объекта требуется найти вектор управляющего воздействия u(t) с учетом указанных ограничений из условия минимума функционала
. (3.115)
Сначала рассмотрим задачу при одной координате управления (r=1) в пространстве (n+1) координат, введя дополнительную переменную х0, определяемую уравнением
. (3.116)
При этом для вывода принципа максимума используем игольчатую вариацию.
Если управляющему воздействию u°(t) соответствует оптимальное движение объекта Х°(t), то после игольчатой вариации дальнейшее движение X(t) будет отличаться от оптимального. Разность между ними в момент t= , определяется разностью скоростей
. (3.117)
Эта разность бесконечно мала, так как – бесконечно малая величина. Поэтому для интервала t T введем вектор вариации траектории
.
Закон изменения вариации, являющейся бесконечно малой величиной, может быть найден из уравнений, записанных для малых изменений X(t), которые называют уравнениями в вариациях. Эти уравнения можно получить из (3.113) или (3.114), если заменить xi на xi + хi а затем после разложения fi в ряд по степеням xi отбросить члены высших порядков малости. Далее вычтем уравнение вида (3.113) и получим линейное уравнение в вариациях
, (3.118)
где j = 0, 1, 2..., n.
Вектор вариаций X при t = Т характеризует изменение критерия оптимальности J. Для любых неоптимальных управлений u(t) эта величина определяется скалярным произведением вектора вариаций X(T) и вспомогательного вектора (Т) и является отрицательной:
. (3.119)
Уравнение (3.119) позволяет найти X(T) в зависимости от начального условия X(), определяемого значением u().
Если подобрать такой (n+1)-мерный вектор (t), который при < t T удовлетворяет условию
, (3.120)
где (t) = [0(t) 1(t) … n(t)]T,
то вместо принятой в классическом вариационном исчислении функции Гамильтона (3.77) можно составить функцию Гамильтона для неклассических вариационных задач:
. (3.121)
Эта функция достигает максимума при оптимальном управлении u°(t), откуда следует принцип максимума: нужно так подобрать u(t) u, чтобы величина Н* достигала максимального значения. При этом можно записать (для открытого множества u)
Н*/u = 0. (3.122)
Используя выражение (3.121) и уравнения объекта управления (3.113) с учетом (3.116), можно составить аналогично уравнениям (3.81) канонические уравнения Гамильтона для неклассических вариационных задач:
, (3.123)
где i = 0, 1, 2, ..., n.
Уравнения (3.123) при r координатах управления дополняются уравнениями
. (3.124)
Пусть существует допустимое управление u(t) u, то соответствующая ему фазовая траектория проходит через фиксированные начальную X(t0) и конечную X(Т) точки. Тогда u°(t) определяется по теореме Л. С. Понтрягина [12]:
для того чтобы управление u(t) было оптимальным, необходимо существование такой ненулевой вектор-функции (t), соответствующей в силу уравнений (3.123) функциям u(t) и X(t), чтобы:
1) при t0 t Т функция H* достигла максимума при u°(t)
; (3.125)
2) в конечный момент времени t = Т выполнялись бы соотношения
. (3.126)
В большинстве случаев в (3.126) можно принять 0(Т) = – 1.