Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
089-132.doc
Скачиваний:
16
Добавлен:
28.04.2019
Размер:
1.7 Mб
Скачать

6.5. Принцип максимума

В практических задачах физики, техники, экономики или экологии, в которых, исследуя проблемы управления соответствующими системами, чаще всего на множество допустимых управлений накладываются некоторые существенные ограничения. В предыдущем разделе были рассмотрены достаточно простые задачи такого рода, и оказалось, что даже в них методы вариационного исчисления неэффективны, а, как показывает опыт, в более сложных задачах вовсе неприменимы.

Во второй половине ХХ века Понтрягиным, МакШейном и другими были сформулированы необходимые условия экстремума при решении указанных выше задач и получили они название – принцип максимума.

Задача Майера. Рассмотрим задачу управления

(6.41)

(6.42)

(6.43)

Новым в постановке задачи является ограничение (6.43), в котором множество U замкнуто, а следовательно, решение задачи может находиться на границе множества U. В этом случае нельзя произвольным образом варьировать по u, и условия стационарности (6.17) на границе теряют смысл.

Предполагаем, что функции f и непрерывны и дифференцируемы нужное число раз. Управление ищется в классе кусочно-непрерывных функций. Так как значение в точках разрыва не влияет на значение функционала, то доопределение в точках разрыва можно выполнить произвольно.

Необходимые условия оптимальности, называемые принципом максимума (Понтрягина), формулируются следующим образом.

Принцип максимума Понтрягина. Пусть - оптимальное управление в задаче (4.41) – (4.43), а - соответствующая ему оптимальная траектория. Тогда удовлетворяет условию максимума:

. (6.44)

Здесь гамильтониан Н определяется равенством

а вектор сопряженных переменных является решением задачи

Очевидно отличие от решения вариационных задач – вместо условия стационарности используется условие (6.44). Отметим также, что как функция времени t непрерывна, так как, независимо от скачков управления, она равна в любой момент левой части выражения (6.44).

Для задачи Больца с ограничением (6.43) и минимизируемым функционалом

(6.45)

где и заданы.

Тогда справедливо утверждение. Если - оптимальное управление в задаче (6.41), (6.43), (6.45), а - оптимальная траектория, то существует такой вектор , удовлетворяющий уравнениям:

(6.46)

что справедливо условие максимума

, (6.47)

где функция Н определяется равенством

. (6.48)

Таким образом, указанный метод решения задач оптимизации состоит из следующих шагов:

  1. Определяем управление из (6.47).

  2. Подставляем найденное управление в выражения (6.41) и (6.46) и решаем полученную краевую задачу относительно и .

  3. Подставляем найденные значения , в выражение для . Как и для задач без ограничений вида (6.43), полученное управление является оптимальным, если решение исходной задачи управления (6.41),(6.43),(6.45) существует, а решение краевой задачи в п.2 единственное.

Пример 6.6. Для системы

(6.49)

найти управление, минимизирующее функционал

. (6.50)

где , и .

Решение. Начнем с построения функции Н:

. (6.51)

Условие (6.47) с учетом (6.51) даёт . Уравнение (6.46) для сопряженной переменной принимает вид

. (6.52)

Пологая, что , подставим в уравнение (6.49). Тогда для определения траектории и функции получим краевую задачу, образованную уравнением (6.52) и уравнением

(6.53)

Решение краевой задачи (6.52) – (6.53) получаем из общего решения системы дифференциальных уравнений

.

Поскольку , то для управления систем записать

, если ,

а следовательно,

, если .

Пример 6.7. Пусть при наличии ограничения на управление требуется повернуть находящийся в покое вал двигателя за заданное время T на максимальный угол и затормозить его. Уравнение объекта имеет вид , где - угол поворота двигателя, - угловая скорость, - момент инерции, - момент действующих сил. Обозначая , и , получим уравнения динамики системы:

,

а граничные условия и функционал имеют вид:

.

Решение. Функция Понтрягина имеет вид

.

Сопряженные уравнения совпадают с первыми двумя уравнениями Эйлера-Лагранжа, поэтому с учетом условий трансверсальности имеем . Из условия максимума

следует, что оптимальное управление принимает только крайние значения (a или -a) и его знак всюду в точках непрерывности совпадает со знаком функции :

.

Так как линейная функция может изменить знак на интервале не более одного раза, то оптимальное управление

или

По условию задачи надо повернуть вал двигателя на максимальный (положительный угол). Поэтому оптимальным может быть только первое из двух приведенных управлений.

Действительно, если в уравнении , , то для любых и отсюда следует, что . Но такое управление обеспечивает только и , что не соответствует условию. Тогда сначала для , а следовательно , а затем с момента , а следовательно .

Определим точку переключения управления (разрыва). Проинтегрируем уравнения объекта при выбранном управлении с учетом начальных условий (краевые условия на левом конце траектории по ):

Используя непрерывность , т.е. равенство , можно представить

Из краевых условий на правом конце траектории получаем . Итак, окончательно для оптимального управления получаем:

.

Пример 6.8. Найти управление, переводящее систему , из состояния в конечное состояние: , - свободно, при минимальном значении функционала и ограничении на управление .

Решение. Составим гамильтониан задачи

,

и уравнение Эйлера-Лагранжа

;

.

Из условия трансверсальности, связанного с подвижностью , получим:

.

Из принципа максимума следует, что

Последнее равенство с учётом условий и приводит к неравенству .

На рис. 6.7 изображены прямые (нижняя граница) и . Двигаясь из начала координат (для упрощения это точка А) по прямой для в некоторый момент (точка В), далее, поскольку для используем уже управление для . Исходя из этого, условие для имеет вид

(1)

Рис. 6.7. Иллюстрация формирования управления

Таким образом, можно записать для управления:

а подставив в уравнение динамики, получим:

Из начального условия получим:

, (2)

а используя условие непрерывности в точке переключения , имеем

. (3)

Далее, интегрируя управление для , получаем:

Используя начальные и конечные условия, можем записать:

, (4)

. (5)

Из условия непрерывности в точке переключения имеем:

. (6)

Подставляя (3) в (5), получим , и, используя значение и равенство (1) для (6), получим:

.

Таким образом, получены все константы для определения оптимальной пары ( , ).

Рассмотрев примеры, мы хотели бы подчеркнуть, что условия принципа максимума являются только необходимыми условиями. Так, например, для системы

(6.54)

найдем управление, минимизирующее функционал

(6.55)

Для функции Н можем записать

и при этом получаем

(6.56)

Заметим, что

(6.57)

удовлетворяют уравнениям (6.54), (6.56), а также, для любого управления , условию максимума

.

Иначе говоря, функции (6.57) удовлетворяют всем условиям принципа максимума. Покажем, однако, что траектория и управление не являются решением поставленной задачи (6.54) (6.55). Значение функционала (6.55) при есть . Построим теперь последовательность управлений, для которых значение критерия (6.55) можно сделать как угодно отрицательными. Положим

(6.58)

где . Соответствующая траектория имеет вид

(6.59)

отыскав значение критерия (6.55), получим

. (6.60)

Отсюда видно, что

. (6.61)

Из (6.60), (6.61) вытекает, что управление не является оптимальным.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]