Учебное пособие 800669
.pdf
|
Очевидно, отрезок (0, k1] на оси абсцисс |
|
|
не является областью Парето, т.к. здесь увеличе- |
|
|
ние k1 уменьшает установившуюся ошибку, не |
|
|
увеличивая колебательности процессов. Обла- |
|
|
стью Парето, т.е. решением задачи векторной оп- |
|
|
тимизации, являются значения k1>1/4Т. В этой |
|
Рис. 5.36. Графики зависимости |
области любое изменение k1 приводя к уменьше- |
|
нию одного критерия, обязательно увеличивает |
||
показателей качества от добротности |
||
|
||
контура |
другой. |
Таким образом, формализация требований к системе управления в виде векторного
критерия позволила несколько сократить исходную неопределенность относительно доб-
ротности системы: вместо k1>0 имеем k1>1/4Т. Дальнейшее уменьшение неопределенно-
сти решения связано с дополнительной информацией о предпочтениях проектировщика,
позволяющих достичь компромисса между интересами отдельных частных критериев.
5.5.4. Синтез систем программного управления
Принцип максимума. Пусть требуется определить оптимальное управление при использовании информации только о времени (программное управление или управление в разомкнутой системе) для объекта, описывае-
мого на интервале [t1, t2] дифференциальным уравнением /9/
x(t ) f( x(t ),u(t ),t ), x Rn , u Rm . (5.180)
Момент начала процесса t1 задан, а момент окончания процесса t2 оп-
ределяется первым моментом достижения точкой (t,x(t)) некоторой заданной
поверхности Rn+1: |
|
|
||
{(t2 ,x ) |
|
i (t2 ,x ) 0, |
i 1,...,l;t2 (t1 , ), x Rn }, (5.181) |
|
|
||||
т.е. в момент t2 должны выполняться условия |
||||
i (t2 ,x(t2 )) 0, |
i 1,...,l , |
где 0 l n+1, при l=n+1 множество представлено точкой в пространстве
Rn+1, функции i(t2,x) – непрерывно дифференцируемы, а система векторов
551
|
i (t2 |
,x ) |
|
i (t2 ,x ) |
|
i (t2 |
,x ) |
|
|
||
|
,..., |
, |
, |
i 1,...,l |
|||||||
x1 |
|
xn |
t1 |
|
|
||||||
|
|
|
|
|
|
|
|
линейно независима (t2,x) Rn+1.
Будем считать, что область допустимых управлений Uдоп есть множест-
во всех ограниченных непрерывных функций u(t) на [t1, t2] таких, что u(t) U
для любого t из [t1, t2], где U - заданное подмножество метрического про-
странства Rm размерности m.
Введем скалярный критерий качества вида (5.175)
I(d ) V3 ( x(t2 |
),t2 ) |
t2 |
|
L( x,u,t )dt , |
(5.182) |
||
|
|
t1 |
|
где L(x,u,t) действительная функция на R Rm [t1,t2]; V3(x(t2),t2) – действи-
тельная функция на Rn [t1,t2].
Пусть S – заданное множество из Rn [t1,t2]. Элементами S являются па-
ры (x(t2),t2). Назовем S множеством целей (множеством конечных состоя-
ний) и V3(x(t2),t2) – функцией конечных состояний.
Будем считать, что функции f(x,u,t) и L(x,u,t) непрерывны и дифферен-
цируемы по совокупности переменных x, u, t.
Пусть t1 элемент из [t1,t2] и x(t1) – элемент из Rn.
Задачей оптимального управления для системы (5.180) при сделанных предположениях относительно множества конечных состояний S для функ-
ционала (5.182), области допустимых управлений u(t) U и начального со-
стояния x(t1) в начальный момент времени t1 является отыскание такого управления u(t) из U, что функционал I достигает минимального значения.
Конкретизация выражений f(x,u,t), L(x,u,t), V3(x(t2),t2) и множество це-
лей S порождают различные типы задач синтеза управлений /32/.
Решение задач синтеза управлений базируется на классическом вариа-
ционном исчислении, к которому принято относить все методы решения оп-
тимизационных задач, основанные на анализе необходимых (и достаточных) 552
условий оптимальности, вытекающих из анализа вариаций (малых смеще-
ний) минимизируемого функционала. Однако, в практических задачах мно-
жество управлений нередко имеют ограничения, выражаемые неравенствами,
и необходимые условия минимизации функционала, следующие из классиче-
ского вариационного исчисления, становятся непригодными для синтеза сис-
тем.
Существенным развитием теории оптимального управления является принцип максимума Л.С. Понтрягина, определяющий условия экстремума
функционала вида (5.176). |
|
|
|
|
|
Пусть на тройке d* |
(t2* ,x* ( ),u* ( )) D(t1 ,x1 ) |
достигается минимум |
|||
функционала |
(5.175). |
Тогда |
существует |
такая |
функция |
(t ) ( 1(t |
),.... n(t ))T (где i(t) – множители Лагранжа), что: |
|
в каждой точке непрерывности управления u*(t) функция
H(t, (t),x*(t),u) достигает максимума по управлению, т.е.
max H(t, (t ),x* (t ),u) H(t, (t ),x* (t ),u* (t ))
u U |
|
|
n |
|
|
где H(t, ,x,u) j fj (t,x,u) 0 L(t,x,u) |
0 |
, n – порядок харак- |
j 1 |
1 |
теристического уравнения системы;
выполняется условие трансверсальности
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
V3 (t*2 |
) H(t2* |
) t2 j (t2* ) xj |
|
0 |
(5.183) |
|||||||||
|
|
|
|
|
|
|
|
|
|
j 1 |
|
|
|
|
|
|
при любых вариациях t2 |
|
и xj, удовлетворяющих системе |
|
|||||||||||||
|
|
|
|
|
|
* |
|
* |
|
* |
|
|
|
|
|
|
|
|
|
i (t2 |
,x |
|
(t2 )) 0, |
|
|
|
|
|
|||||
|
|
|
|
i 1,...,l |
|
|
|
|||||||||
|
|
|
|
|
(t* ,x* (t* |
)) 0, |
i 1,...,l |
|
|
|
|
|||||
|
|
|
i |
|
|
|
|
|||||||||
|
|
|
|
|
2 |
|
|
2 |
|
|
|
|
|
|
|
|
где H(t* |
) H(t* |
, (t* |
),x* (t* ),u* |
(t* )), |
V (t* ) V (t |
* |
,x* (t* |
)), а вариации |
||||||||
2 |
2 |
2 |
|
|
|
|
2 |
|
|
2 |
3 |
2 |
3 |
2 |
2 |
|
определяются следующим образом:
553
|
|
|
|
|
|
|
|
V (t* ,x* (t* |
)) |
|
n |
|
|
V (t* ,x* |
(t* |
)) |
|
||||||||||||
V3 (t2* ) V3 (t2* |
,x* (t*2 )) |
|
|
|
|
3 |
|
2 |
|
2 |
|
|
|
t2 |
|
|
3 2 |
2 |
|
xj , |
|||||||||
|
|
|
|
|
|
t2 |
|
|
|
|
|
|
|
xj |
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
j 1 |
|
|
|
|
|
|||
|
|
|
* |
,x |
* |
(t |
* |
)) |
|
|
n |
|
|
|
|
* |
,x |
* |
* |
|
|
|
|
||||||
i (t2* ,x* (t2* )) |
i (t2 |
|
2 |
t2 |
|
i (t2 |
|
(t2 )) |
xj ; |
|
|
|
|||||||||||||||||
t2 |
|
|
|
|
|
|
|
|
|
|
|
xj |
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
j 1 |
|
|
|
|
|
|
|
|
|
|
|
|||||
функции x*( ), |
( ) удовлетворяют системе уравнений |
|
|
|
|||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
* |
|
|
|
* |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x*j |
(t ) |
H(t, (t ),x |
|
(t ),u (t )) |
fj (t,x* (t ),u* (t )), |
|
|
||||||||||||||||||||||
|
|
|
|
||||||||||||||||||||||||||
|
|
|
|
|
|
||||||||||||||||||||||||
|
|
|
|
|
j |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
H(t, (t ),x |
* |
(t ),u |
* |
(t )) |
|
|
|
|
|
|
|
|
|
||||||||||||
j |
|
|
|
|
|
|
|
|
|
|
|
|
(5.184) |
||||||||||||||||
(t ) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
, |
|
|
|
|
|
|
|
|
|||||
|
|
|
|
xj |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
* |
(t1 ) x0 j , j 1,...,n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
xj |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Система (5.184) называется системой канонических уравнений, функ-
ции 1(t),… n(t) – вспомогательные переменные (множители Лагранжа),
H(t, ,x,u) – гамильтониан.
Из общей постановки задачи следуют несколько практически важных частных случаев.
1.Если заданы времена окончания процесса t2 и фиксированное чис-
ло k координат x11,…,xk1 |
x(t2), |
т.е. t2=T2 , xj(t2)=xj1, j=1,…,k; 0 k n, |
|
l=k+1, функции j(t2,x) имеют вид |
|
|
|
j (t2 ,x ) xj |
xj1 |
0, |
j 1,...,k; |
k 1(t2 ,x ) t2 T2 0.
При k=n правый конец траектории фиксирован, а при k=0 – свободен.
Отсюда следует, что xj=0, j=1,…,k; t2=0.
Решаемая задача с фиксированным временем окончания записывается в
форме |
|
t2 |
|
I(d ) V3( x(t2 )) L( x(t ),u(t ),t )dt min |
|
t1 |
. |
Решением задачи является пара (x*( ), u*( )) – оптимальные траектория
554
и управление.
2.Если начальное состояние и момент начала процесса не заданы,
аопределяются вместе с конечным состоянием соотношениями
|
|
|
|
|
|
i (t1 ,x(t1 ),t2 |
,x(t2 )) 0, |
i 1,...,l , |
|||||
терминальный |
член |
функционала может |
|
задаваться |
в виде разности |
||||||||
V32(t2,x(t2))-V31(t1,x(t1)). Тогда решаемая задача записывается в форме |
|||||||||||||
|
I(d ) V32 (t2 ,x(t2 )) V31(t1 |
t2 |
|
|
|||||||||
|
,x(t1 )) L( x(t ),u(t ),t )dt min |
||||||||||||
|
|
|
|
|
|
|
|
|
|
t1 |
|
, |
|
а условия трансверсальности имеют вид |
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
V32 (t2* ) H(t2* ) t2 j (t2* ) xjt2 |
||||||||
|
|
|
|
|
|
|
|
|
|
j 1 |
|
|
(5.185) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
V31(t1* ) H(t1* ) t1 j (t1* ) xjt1 |
0 |
|||||||
|
|
|
|
|
|
|
|
|
|
j 1 |
|
|
|
|
|
|
* |
* |
* |
* |
* |
|
* |
|
|
|
|
i (t |
1 ,x |
|
(t1 |
),t2 ,x (t2 )) 0, |
i 1,...,l |
|
|
||||||
|
|
|
|
||||||||||
при |
|
(t* |
,x* |
(t* ),t* ,x* (t* |
)) 0, |
i 1,...,l |
. |
|
|||||
|
i |
|
|
|
|||||||||
|
1 |
|
|
1 |
2 |
|
2 |
|
|
|
|
|
Решением в этом случае является четверка (t1* ,t*2 ,x* ( ),u( )), вклю-
чающая оптимальные моменты начала и окончания процесса, траекторию и управление.
3.Если на управление нет ограничений, т.е. U=Rq , то максимум га-
мильтониана ищется с помощью необходимых и достаточных условий безус-
ловного экстремума.
4.Если модель объекта управления линейна, а функционал квадра-
тичный, принцип максимума является необходимым и достаточным услови-
ем оптимальности в задаче (5.176).
Рассмотрим несколько подробнее частный, но важный для практиче-
ских приложений, случай о линейных оптимальных быстродействиях, когда уравнение состояния объекта линейны и минимизируется время перехода
555
t2
I t2 t1 dt
t1 .
Примем, что закон движения в общем случае нестационарного объекта описывается векторным дифференциальным уравнением ( уравнения выхода)
вида (5.23) |
|
|
x(t |
) A(t )x(t ) B(t )u(t ), |
(5.186) |
где x – n-мерный вектор состояния; u – q-мерный вектор управлений (вход-
ных воздействий); A(t), B(t) – матрицы размера (n n), (n q) соответственно.
Пусть линейный объект стационарен, а матрица коэффициентов А име-
ет все действительные собственные значения. Тогда характеристическое
уравнение системы (5.186)
|
a11 |
a12 |
|
a1n |
|
|
|
a21 |
a22 |
|
a2n |
0 |
(5.187) |
|
|
|
|
|
|
|
|
an1 |
an2 |
|
ann |
|
|
имеет только действительные значения.
Множество U представляет собой параллелепипед, определенный не-
равенствами
i ui i , i 1,2, ,m. |
|
(5.188) |
|
Гамильтониан может быть записан в виде |
|
|
|
n |
n |
n |
n |
H( ,x,u ) ( ,Ax ) ( Bu ) j |
aji xi |
j bjiui |
|
j 1 |
i 1 |
j 1 |
i 1 |
Вспомогательная система уравнений записывается следующим обра-
зом:
|
d j |
aji xi , |
j 1, ,n |
|
|
|
n |
|
|
|
dt |
i 1 |
|
|
или в векторной форме |
|
|
|
|
|
|
AT . |
(5.189) |
|
|
|
556 |
|
Очевидно, гамильтониан как функция u U достигает максимума одно-
временно с функцией ( ,Bu). Таким образом, на основании принципа макси-
мума можно утверждать, что если u(t) – оптимальное управление, переводя-
щее фазовую точку x0(t) в конечное состояние xk(t), то существует такое ре-
шение вспомогательной системы (5.189), что
( (t ),Bu(t )) sup H( ,x,u) M( (t )), |
(5.190) |
u U |
|
где M( (t)) – верхняя грань значений функции H( ,x.u).
Уравнение (5.189) не содержит неизвестных функций x(t) и u(t) поэто-
му все решения этого уравнения могут быть найдены, а затем определяется управление u(t) как решение уравнения (5.190). Так как функция ( (t),Bu)
линейна, то она либо постоянна, либо достигает своего максимума лишь на границе многогранника. Поскольку это соображение применимо к каждой грани, то функция ( (t),Bu) достигает своего максимума либо лишь в одной вершине многогранника U, либо на целой грани, причем в последнем случае достижение максимума возможно лишь для конечного числа значений t.
Точку разрыва оптимального управления называют точкой переключения.
Сформулируем без доказательства теорему о числе переключений,
впервые доказанную А.А. Фельдбаумом /104/.
Теорема. Пусть область управления U представляет собой параллеле-
пипед, определяемый неравенствами (5.188), и все собственные значения матрицы A действительны. Тогда для каждого ненулевого решения (t)
уравнений (5.189) соотношение (5.190) однозначно определяет управление u(t)=(u1(t),…,um(t)). При этом оказывается, что каждая из функций uk(t) (k=1,…,m) кусочно-постоянна, принимает только значения k и k и имеет не более (n-1) переключений (не более n интервалов постоянства), где n – поря-
док системы уравнений (5.186).
Пример 5.9. Даны модель объекта управления /9/
x(t |
) x(t ) u(t ), |
x(0) 0, |
557
где x R; x R; t [0;1], и функционал
1
I u2(t )dt x(1) min
0 .
Требуется найти оптимальную пару ( x*( ),u( )), на которой достигается минимум функционала.
Сравнивая с (5.180), имеем f(t,x,u)=x+u, а сопоставляя функционал с (5.182), -
L(t,x,u)=u2, V3(t2)=-x. В соответствии с (5.181) i(t2 ,x(t2 )) t2 1 0 . Решается задача
Больца.
1.Составляем гамильтониан: H(t, ,x,u)= (x+u)-u2.
2.Находим максимум гамильтониана по управлению. Так как ограничения на управление отсутствуют, можно применить необходимые условия безусловного экстре-
мума |
|
H(t, (t ),x(t ),u) (t ) 2u 0. |
Отсюда |
u*(t ) |
(t ) |
и |
|
u |
|
|
2 |
|
2
u2 H(t, (t ),x(t ),u) 2 0.
3. Выписываем уравнения системы (5.184) с учетом полученного результата:
x*j |
(t ) |
H(t, (t ),x* (t ),u* (t )) |
x(t ) u* (t ) x(t ) |
|
( t ) |
, |
x(0 ) 0 |
||
|
|
2 |
|||||||
|
|
|
|
|
|
||||
j |
(t ) |
H(t, (t ),x* ( t ),u* (t )) |
(t ). |
|
|
|
|
||
|
|
|
|
|
|||||
|
|
|
x |
|
|
|
|
4. Проверяем условие трансверсальности в форме (5.183). Так как V3(t2,x)=-x, то
V3=- x и
x H(t |
|
) t |
|
(t |
|
) x |
|
0 |
|
|||
|
2 |
|
|
2 |
|
|
|
2 |
|
t2 1 |
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Поскольку t2=1, то t2=0. Ограничений на x(t2) не наложено, поэтому вариация x |
||||||||||||
произвольна. В результате имеем [ (t2 |
) 1] x |
|
0 |
и, следовательно, (1)-1=0. |
||||||||
|
||||||||||||
|
|
|
|
|
|
|
|
|
t2 1 |
|
|
|
5. Решаем полученную двухточечную краевую задачу: |
|
|||||||||||
|
|
|
|
|
(t ) |
|
|
|
|
|
||
x(t ) x(t ) |
|
|
|
, |
x(0 ) |
0 |
|
|||||
2 |
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
||
(t ) (t ), (1) 1. |
|
|
||||||||||
|
|
Из второго уравнения с конечным условием имеем (t ) e1 t . Поэтому оптималь-
558
ное управление u*(t ) 1e1 t .
2
Решая первое уравнение системы с начальным условием, получим оптимальную
траекторию x*(t ) 1 e1 t e1 t .
4
Пример 5.10. Найти оптимальное по быстродействию управление, соответствую-
щие ему траекторию и время, затрачиваемое на переход из состояния x1(0)=0, x2(0)=-4 в
начало координат для модели объекта управления, описываемой системой дифференци-
альных уравнений
x1(t ) x2(t ), x2(t ) u(t ),
где x=(x1,x2)T, mod(u) 1.
Cформулируем задачу в форме минимизации функционала
T
I dt min
|
0 |
, |
где момент окончания процесса управления Т не задан и подлежит определению. |
||
В данном примере f1(t,x,u)=x2, |
f2(t,x,u)=u и L(t,x,u)=1, V3(t2) 0, t2=T, |
|
1(T,x(T )) x1(T ) 0, |
2(T,x(T )) x2(T ) 0. Решается задача Лагранжа. |
Требуется найти оптимальное программное управление u*( ), соответствующую ему траекторию x*( ), и время T.
1.Составляем гамильтониан: H(t, ,x,u)= 1 x2+ 2 u - 1.
2.Находим максимум гамильтониана по управлению. Так как имеются ограниче-
ния на управление, требуется найти условный максимум гамильтониана по управлению. В
данной задаче гамильтониан линеен по u на заданном отрезке изменения управления
[-1,1], поэтому оптимальное управление имеет вид
u*(t ) argmax H(t, (t ),x(t ),u) 1 sign 2(t )
u |
1 |
. |
|
3. Выписываем уравнения системы (5.184) с учетом полученного результата:
559
x1* (t ) x2(t ), |
x1(0 ) 0, x1(T ) 0, |
|
|
|
|||||||
x*2(t ) u(t ) sign 2(t ), |
|
|
|
|
|
|
|||||
x2(0 ) 4, x2(T ) 0, |
|||||||||||
|
|
|
|
* |
|
* |
|
|
|
|
|
1(t ) |
H(t, (t ),x |
|
(t ),u (t )) |
|
0, |
|
|
||||
|
|
|
|
||||||||
|
|
|
|
||||||||
|
|
x1 |
|
|
|
|
|
|
|
||
|
H(t, (t ),x* (t ),u* (t )) |
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
2(t ) |
x |
2 |
|
|
|
|
1(t ). |
|
|||
|
|
|
|
|
|
|
|
|
. |
||
4. Проверяем условие трансверсальности в форме (5.183) |
|
||||||||||
|
|
|
|
2 |
|
|
|
|
0 |
|
|
|
|
|
|
|
|
|
|||||
V3 H(t2 ) t2 j |
(t2 ) xj |
t2 |
|
||||||||
|
|
|
j 1 |
|
|
|
T |
, |
|||
|
|
|
|
|
|
|
|
где V3=0. Так как момент окончания Т не задан, а x1(T) и x2(T) заданы, то вариация t2
произвольна, а, x1=0, |
x2=0. Поэтому из условия трансверсальности следует |
|||
H(T)=H(T, (T),x(T),u(T))=0. |
|
|
|
|
5. Решаем полученную двухточечную краевую задачу: |
|
|||
x1(t ) x2(t ), |
x1(0 ) 0, x1(T ) 0 |
|
||
x2 (t ) sign 2(t ), |
x2(0 ) 4, x2(T ) 0 |
|
||
|
||||
1(t ) 0 |
|
|
|
|
|
|
|
||
2(t ) 1(t ) |
|
|
|
|
|
|
|
||
H(T, (T ),x(T ),u(T )) 0 |
|
|||
|
Решая два уравнения для вспомогательных переменных, получаем
1(t ) C1 const, 2(t ) C1t C2 , u* (t ) 1 sign( C1t C2 ).
Так как линейная функция меняет знак не более одного раза, то оптимальное управление является кусочно-постоянной функцией, имеющей не более двух интервалов знакопостоянства, что отвечает теореме о числе переключений. На одном интервале u(t)=1, а на другом u(t)=-1.
6. Для определения оптимальной траектории построим фазовый портрет. Уравне-
ние фазовых траекторий системы
|
|
|
|
|
|
|
|
|
x1 |
(t ) x2(t ), |
|
|
||||
|
|
|
|
|
|
|
|
|
x2(t ) u(t ) const |
|||||||
|
dx |
|
|
x |
|
|
|
|
x |
|
|
|
|
|
x2 |
|
имеет вид |
|
1 |
|
|
2 |
. Откуда dx |
|
|
|
2 |
|
dx |
|
, или x |
2 |
C . |
|
|
|
|
|
|
|
||||||||||
|
dx2 |
|
u |
|
1 |
|
u |
|
2 |
1 |
2u |
На рис. 5.37, а,б изображены два возможных семейства парабол. По траекториям,
проходящим через начало координат, движение происходит на последнем интервале зна-
560