ТУ - лекции Овсянникова / 17.Постановка задачи оптимального управления.Принцип максимума
.pdfЛекция 17. Постановка задачи оптимального управления. Задачи Майера, Лагранжа, Больца. Связь между ними. Формулировка принципа максимума Л.С. Понтрягина.
Постановка задачи. Рассмотрим управляемую систему |
|
x = f(t; x(t); u(t)): |
(1) |
С начальным условием |
(2) |
x(0) = x0: |
Здесь x – n-мерный вектор фазовых координат; t – время, t 2 [0; T ];
u – r-мерный вектор управления; f(t; x(t); u(t)) – n-мерная вектор-функция; предполагаем, что f(t; x(t); u(t)) непрерывна на [0; T ] U и имеет частные производные по u, где – открытое множество в Rn.
Рассмотрим класс D кусочно-непрерывных на [0; T ] вектор-функций u(t) со значениями в U, где U – компакт в Rr.
1
Дополнительно будем продполагать, что 8u 2 D (при любом допустимом управлении) решение задачи Коши для системы (1) при начальном условии (2) существует и единственно на всем интервале [0; T ].
Введем функционал
I(u) = g(x(T )): |
(3) |
Задача минимизации функционала (3) на решениях (1) называется терминальной или задачей Майера.
Введем функционал
Z T
I(u) = |
'(t; x(t); u(t))dt: |
(4) |
0
Здесь ' непрерывна по совокуности аргументов, ' > 0. Задача минимизации функционала (4) на решениях (1) называется задачей Лагранжа.
Задача же минимизации функционала вида
Z T
I(u) = |
'(t; x(t); u(t))dt + g(x(T )); |
(5) |
0
2
называется задачей Больца.
Все поставленные задачи в сущности эквивалентны, что можно показать соответствующим преобразованием переменных.
Сведем, например, задачу Лагранжа к задаче Майера. Введем помимо n фазовых переменных дополнительную xn+1, удовлетворяющую уравнению xn+1 = '(t; x(t); u(t)) с начальным условием xn+1(0) = 0. Тогда функционал (4) будет эквивалентен терминальному функционалу I(u) = xn+1(T ).
Задачу Больца можно свести к задаче Лагранжа, введя дополнительную переменную xn+1, удовлетворяющую уравнению xn+1 = 0 с начальным
условием xn+1(0) = T1 g(x(T )). Тогда функционал (5) будет эквивалентен
интегральному функционалу I(u) = R0T ('(t; x(t); u(t)) + xn+1(t))dt.
Выбор функций в функционалах (3)-(5) зависит от требований к моделируемому процессу. Например функционалы вида I(u) = (x(T ) x)2 и I(u) = R0T (x(T ) x(t))2dt оценивают отклонение траектории от некоторой заданной точки x на выходе и от заданной траектории x(t) соответственно. Задача об оптимальном быстродействии и задача терминального управления являются хорошо известными примерами задачи Майера.
3
Формулировка принципа максимума.
Теорема 1 Пусть u0 = u0(t) – оптимальное управление, доставляющее минимум функционалу (3), а функция 0(t) удовлетворяет на оптимальном процессе уравнениям
_0(t) = |
@f( |
t; x0; u) |
|
|
0(t) |
(6) |
|
|
@x |
|
|
||||
с конечным условием |
@g(x0(T )) |
|
|
||||
0(T ) = |
|
(7) |
|||||
|
|
|
: |
|
|||
@x |
|
|
|
Тогда при почти всех t 2 [0; T ] (кроме разве что точек разрыва управления u0(t)) выполняется следующее условие максимума:
max H(t; x0(t); 0(t); u) = H(t; x0(t); 0(t); u0(t)); |
(8) |
|
u2U |
|
|
где H(t; x; ; u) = |
(t)f(t; x; u), x0(t) – траектория, соответсвующая |
u0(t), U – компакт, множество значений управлений.
4