vostrikov
.pdf13.3. Метод динамического программирования |
|
|
|
441 |
|||
и дополним его уравнением в частных производных (13.26) |
|||||||
2u0 |
|
V |
0 . |
|
|||
|
|
|
|
||||
|
xT |
|
|||||
|
|
|
|
|
|
||
Выразим из второго уравнения |
|
V |
|
x и подставим в первое, в резуль- |
|||
тате получим |
|
|
|
|
|
|
|
5x2 |
u2 |
4xu2 |
2u2 |
0 |
|||
|
0 |
|
|
0 |
|
0 |
|
или после приведения подобных |
|
|
|
|
|
|
|
u2 |
4xu |
5x2 |
0 . |
|
|||
0 |
|
0 |
|
|
|
|
|
Решение квадратного уравнения относительно управления дает два |
|||||||
значения: |
|
|
|
|
|
|
|
u0 1 |
5x, |
u0 2 |
|
x. |
Поскольку для одной системы двух оптимальных законов управления быть не может, одно из найденных значений не является оптимальным. Для определения оптимального управления проверим устойчивость замкнутой системы.
В уравнение объекта подставим значение u0 1 и получим уравнение замкнутой системы
x 3x .
Как видим, система неустойчива, а значит, первое управляющее воздействие не является оптимальным.
В уравнение объекта подставим значение u0 2 , при этом уравнение замкнутой системы примет вид
x 3x
и она будет устойчивой.
Таким образом, оптимальный закон управления имеет вид u0 Kx , где
K 1 .
442 |
Глава 13. ОПТИМАЛЬНЫЕ СИСТЕМЫ |
13.4. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
13.4.1. ОСНОВНОЕ СООТНОШЕНИЕ ПРИНЦИПА МАКСИМУМА
Принцип максимума Понтрягина представляет собой метод расчета оптимального управления. Он был сформулирован независимо [1, 3, 31] и почти в то же время, что и метод динамического программирования. Впоследствии оказалось, что уравнения одного метода можно получить из другого и наоборот. Запишем основные соотношения принципа максимума на основе уравнений метода динамического программирования.
Рассмотрим основное соотношение (13.24)
min f0 (x, u) |
V |
f (x, u) 0 . |
|
xT |
|||
u u |
|
Поскольку минимум функции равен максимуму этой же функции с противоположным знаком, то справедливо:
max f0 (x, u) |
V |
f (x, u) 0 . |
(13.27) |
|
xT |
||||
u u |
|
|
Преобразуем уравнение (13.27), предварительно введя ряд обозначений.
1. Введем расширенный вектор состояния z Rn 1 , дополнив его компонентой x0:
|
|
T |
|
|
|
|
x0 |
f0 (x, u)d |
|
|
|
|
x1 |
0 |
|
|
|
z |
x1 |
. |
(13.28) |
||
|
|||||
|
|
|
xn |
|
|
xn |
||
|
444 |
Глава 13. ОПТИМАЛЬНЫЕ СИСТЕМЫ |
При этом сопряженные координаты определяются системой дифференциальных уравнений
|
H |
. |
(13.34) |
|
|||
|
zT |
|
Формулировка принципа максимума. Оптимальным является управ-
ление из области допустимых значений, которое обеспечивает максимум выражения (13.33).
В случае, когда ресурс управления объекта не ограничен, для нахождения максимума гамильтониана можно воспользоваться необходимым условием экстремума
H
uT
0 . ( 13.35)
При ограниченном ресурсе (например, u U ) вычисленное с по-
мощью (13.35) оптимальное управляющее воздействие может находиться вне области допустимых значений, поэтому для отыскания максимума гамильтониана необходимо использовать максимальное значе-
ние управления U .
13.4.2. ПРОЦЕДУРА ОПРЕДЕЛЕНИЯ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
На основе рассмотренных соотношений принципа максимума Понтрягина можно предложить следующую процедуру расчета регулятора.
1. Описание объекта следует привести к стандартному для теории оптимального управления виду (13.1):
x f (x, u), |
|
|
|
|
u |
U . |
|||
|
|
|
|
|
Записывается критерий оптимальности (13.4) в форме
T
J 0 min f0 (x, u)dt . |
|
u |
u 0 |
|
13.4. Принцип максимума Понтрягина |
445 |
2. Формируется расширенный вектор состояния |
z и правых час- |
тей (z,u); в общем виде записывается вектор сопряженных координат
0 , 1,..., n .
3. В форме скалярного произведения векторов ( ) и ( ) записывается выражение
H(z) (z, u) .
4.Из условия максимума определяется оптимальное управление как функция сопряженных координат
max H : u0 u0 ( ) .
uu
5.Формируется система дифференциальных уравнений для нахождения сопряженных координат
H . zT
6.Вычисляется оптимальное управление в виде функции времени (программное управление)
u0 u0 (t) .
7. По возможности осуществляется переход к оптимальному управлению в виде обратной связи
u0 u0 (x) ,
т. е. решается задача синтеза регулятора.
Рассмотрим вычисление оптимального управления с помощью описанной процедуры на примере.
446 |
Глава 13. ОПТИМАЛЬНЫЕ СИСТЕМЫ |
ПРИМЕР 13.3
Определить оптимальное управление для объекта, поведение которого описывают уравнения
x1 x2 , x2 u.
Требуется обеспечить переход из начальной точки в конечную
x1 |
0 |
0 |
x1 |
T |
1 |
x2 |
0 |
0 |
x2 |
T |
0 |
за заданное время T 1 с при минимуме затрат энергии, т. е.
T
J min u2d .
u |
u 0 |
|
Поскольку известно описание объекта в переменных состояния, переходим к формированию расширенного вектора состояния и правых частей, а также запишем вектор сопряженных координат
|
|
|
T |
|
|
|
|
|
z1 |
x0 |
u2d |
|
f0 |
u2 |
|
z |
z2 |
x1 |
0 |
, |
f1 |
x2 , |
|
x1 |
|||||||
|
z3 |
x2 |
|
f2 |
u |
||
|
x2 |
|
|||||
|
|
|
|
|
|
||
|
|
|
0, |
1, |
2 . |
|
Сформируем теперь гамильтониан
H |
0 |
u2 |
x |
2 |
u |
|
1 |
2 |
|
и определим его максимум по u
max H : |
H |
2 |
0u |
2 0 . |
||
|
||||||
u |
||||||
u |
u |
|
|
|
||
|
|
|
|
|
Из этого уравнения определим оптимальное управление в виде функции сопряженных координат
u0 |
|
2 |
. |
|
|
||
2 |
0 |
|
448 |
Глава 13. ОПТИМАЛЬНЫЕ СИСТЕМЫ |
|
|
Решая полученную систему уравнений, определим неизвестные коэф- |
|
|
||
|
фициенты: b1 12, b2 |
6 . В результате оптимальный программный за- |
|
кон управления будет |
|
|
|
u0 12t 6 . |
13.4.3. ЗАДАЧА ОПТИМАЛЬНОГО БЫСТРОДЕЙСТВИЯ
Задача оптимального быстродействия имеет некоторые особенности, которые упрощают ее решение на основе принципа максимума Понтрягина [1, 3].
Гамильтониан быстродействия. Рассмотрим общий класс объек-
тов управления (13.1)
x f (x,u), x Rn , u Rm , m n
с ограниченным управлением u U и критерием оптимальности в виде (13.6), т. е. критерием быстродействия
T
J min d .
u |
u 0 |
|
Согласно процедуре синтеза на основе принципа максимума запишем расширенный вектор правых частей и вектор сопряженных координат
1 |
|
|
|
|
|
f1( ) |
, |
1, |
1, , |
n , |
|
|
|||||
|
|
|
|
fn ( )
азатем сформируем гамильтониан в виде
H |
( ) 1 1 f1( ) n fn ( ) . |
(13.36) |
В соответствии с (13.33) максимум гамильтониана равен нулю. Поскольку первое слагаемое в данном выражении не зависит от управления, можно вместо (13.36) рассматривать усеченный гамильтониан,
который называется гамильтонианом быстродействия
13.4. Принцип максимума Понтрягина |
449 |
Hб f ( ) |
|
1 f1( ) |
|
n fn ( ) . |
(13.37) |
В этом случае уравнение принципа максимума принимает вид |
|
||||
|
max Hб |
1. |
|
(13.38) |
|
|
u |
u |
|
|
|
|
|
|
|
|
Таким образом, при решении задачи оптимального быстродействия нет необходимости переходить к расширенному вектору состояния и расширенному вектору правых частей. Можно сформировать гамильтониан быстродействия и определить управление, обеспечивающее его максимум в соответствии с (13.38).
Разрывное (релейное) управление. Для объектов с аддитивным управлением вида (13.2)
x f (x) B(x)u, |
x Rn , u Rm , |
|||
|
|
|
|
|
ограниченным ресурсом управления |
u |
U и требованием в виде кри- |
||
|
|
|
|
|
терия быстродействия управляющее воздействие имеет разрывный характер.
Сформируем гамильтониан быстродействия (13.37) |
|
||||
Hб |
1 f1( ) 1B1( )u |
|
n fn ( ) |
nBn ( )u , |
(13.39) |
где fi ( ) – i-й элемент вектора |
f (x) , |
а Bi ( ) |
– i-я строка матрицы |
||
B(x) , i = 1, 2, …, n. |
|
|
|
|
Управление, обеспечивающее максимум гамильтониана (13.39) с учетом ограничений, имеет вид
|
|
|
|
u0 U |
sgn B(x) . |
(13.40) |
Следовательно, для объектов класса (13.2) оптимальное управление всегда носит релейный характер.
Теорема о числе переключений. Данная теорема связывает число переключений оптимального управления со свойствами объекта. Она справедлива для линейных объектов (13.3)
x Ax Bu , x Rn , u Rm , m n
с ограничением типа u U и критерием быстродействия. При этом оптимальное управление имеет вид (13.40).
450 |
Глава 13. ОПТИМАЛЬНЫЕ СИСТЕМЫ |
Поскольку объект управления линейный, для него можно определить корни характеристического уравнения
det( pI A) 0 |
(13.41) |
в виде совокупности |
1,..., n . |
Рассмотрим без доказательства формулировку теоремы.
Теорема. Если корни характеристического уравнения (13.41) вещественные, то число переключений управляющего воздействия не превышает (n – 1), где n – порядок объекта.
С л е д с т в и е. Число интервалов постоянства управляющего воздействия не превышает n.
Варианты изменения оптимального управления в линейной системе третьего порядка с вещественными корнями приведены на рис.13.8.
+U |
+U |
+U |
t |
t |
t |
-UU |
U-U |
U-U |
а) |
б) |
в) |
а |
б |
в |
Рис. 13.8. Иллюстрация изменения оптимального управления:
а – нет переключений; б – с одним, в – с двумя переключениями
В случае, когда среди совокупности корней характеристического уравнения (13.41) есть комплексно-сопряженные, число переключений теоретически не ограничено. В реальных системах невысокого порядка число переключений, как правило, невелико.
ПРИМЕР 13.4
Рассмотрим задачу синтеза оптимальной по быстродействию системы для объекта
x1 x2 ,
x2 |
|
|
|
|
|
x1 2dx2 u, |
u |
U. |