ТУ - лекции Шмырова / Лекции по ТУ / 17
.pdfЛекция 17. Постановка задачи оптимального управления. Задачи Майера, Лагранжа, Больца. Связь между ними. Формулировка принципа максимума Л.С. Понтрягина.
Постановка задачи. Рассмотрим управляемую систему
|
x = f(t; x(t); u(t)): |
(1) |
|
С начальным условием |
x(0) = x0 |
: |
(2) |
|
Здесь x n-мерный вектор фазовых координат; t время, t 2 [0; T ]; u r-мерный вектор управления; f(t; x(t); u(t)) n-мерная вектор-функция; предполагаем, что
f(t; x(t); u(t)) непрерывна |
íà |
[0; T ] £ - £ U |
и имеет частные производные по |
u |
, ãäå |
- |
|
|
n. |
|
|
||||
открытое множество в R |
|
|
|
|
|
|
Рассмотрим класс D кусочно-непрерывных на [0; T ] вектор-функций u(t) со зна- чениями в U, ãäå U компакт в Rr.
Дополнительно будем продполагать, что 8u 2 D (при любом допустимом управ-
лении) решение задачи Коши для системы (1) при начальном условии (2) существует и единственно на всем интервале [0; T ].
Введем функционал |
I(u) = g(x(T )): |
(3) |
|
Задача минимизации функционала (3) на решениях (1) называется терминальной |
||
или задачей Майера. |
|
|
Введем функционал |
I(u) = Z0T '(t; x(t); u(t))dt: |
(4) |
Здесь ' непрерывна по совокуности аргументов, ' > 0. Задача минимизации функ- |
||
ционала (4) на решениях (1) называется задачей Лагранжа. |
|
|
Задача же минимизации функционала вида |
|
|
|
Z T |
(5) |
I(u) = |
'(t; x(t); u(t))dt + g(x(T )); |
|
|
0 |
|
называется задачей Больца.
Все поставленные задачи в сущности эквивалентны, что можно показать соответствующим преобразованием переменных.
Сведем, например, задачу Лагранжа к задаче Майера. Введем помимо n фазовых переменных дополнительную xn+1, удовлетворяющую уравнению xn+1 = '(t; x(t); u(t))
с начальным условием xn+1(0) = 0. Тогда функционал (4) будет эквивалентен терминальному функционалу I(u) = xn+1(T ).
|
|
Задачу Больца можно свести к задаче Лагранжа, введя дополнительную перемен- |
||
íóþ xn+1, удовлетворяющую уравнению xn+1 |
= 0 с начальным условием xn+1(0) = |
|||
|
1 |
g(x(T )). Тогда функционал (5) будет эквивалентен интегральному функционалу |
||
|
|
|||
T |
R |
|
||
I(u) = |
0T ('(t; x(t); u(t)) + xn+1)dt. |
|
Выбор функций в функционалах (3)-(5) зависит от òребований RкTмоделирóемому процессу. Например функционалы вида I(u) = (x(T )¡x)2 è I(u) = 0 (x(T )¡x(t))2dt
78
оценивают отклонение траектории от некоторой заданной точки x на выходе и от заданной траектории x(t) соответственно. Задача об оптимальном быстродействии и
задача терминального управления являются хорошо известными примерами зада- чи Майера. Так, если в функционале (3) g=T, мы имеем задачу об оптимальном быстродействии.
Формулировка принципа максимума.
Теорема 1 Пусть u0 = u0(t) оптимальное управление, доставляющее минимум функционалу (3), а функция Ã0(t) удовлетворяет на оптимальном процессе урав-
нениям |
µ@f(@x |
|
) |
¶ |
¤ |
(6) |
||||
Ã_(t) = ¡ |
|
|
Ã(t) |
|||||||
|
|
|
t; x; u |
|
|
|
|
|
||
с конечным условием |
|
|
@g(x(T )) |
|
|
|||||
Ã(T ) = ¡ |
: |
(7) |
||||||||
|
|
|
|
|
||||||
|
@x |
|
|
|
Тогда при почти всех t 2 [0; T ] (кроме разве что точек разрыва управления u0(t)) выполняется следующее условие максимума:
max H(t; x0(t); Ã0(t); u) = H(t; x0(t); Ã0(t); u0(t)); |
(8) |
u2U |
|
ãäå H(t; x; Ã; u) = ä(t)f(t; x; u), x0(t) траектория, соответсвующая u0(t), U компакт, множество значений управлений.
79