Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Учебное пособие 800669

.pdf
Скачиваний:
19
Добавлен:
01.05.2022
Размер:
25.44 Mб
Скачать

 

Очевидно, отрезок (0, k1] на оси абсцисс

 

не является областью Парето, т.к. здесь увеличе-

 

ние k1 уменьшает установившуюся ошибку, не

 

увеличивая колебательности процессов. Обла-

 

стью Парето, т.е. решением задачи векторной оп-

 

тимизации, являются значения k1>1/4Т. В этой

Рис. 5.36. Графики зависимости

области любое изменение k1 приводя к уменьше-

нию одного критерия, обязательно увеличивает

показателей качества от добротности

 

контура

другой.

Таким образом, формализация требований к системе управления в виде векторного

критерия позволила несколько сократить исходную неопределенность относительно доб-

ротности системы: вместо k1>0 имеем k1>1/4Т. Дальнейшее уменьшение неопределенно-

сти решения связано с дополнительной информацией о предпочтениях проектировщика,

позволяющих достичь компромисса между интересами отдельных частных критериев.

5.5.4. Синтез систем программного управления

Принцип максимума. Пусть требуется определить оптимальное управление при использовании информации только о времени (программное управление или управление в разомкнутой системе) для объекта, описывае-

мого на интервале [t1, t2] дифференциальным уравнением /9/

x(t ) f( x(t ),u(t ),t ), x Rn , u Rm . (5.180)

Момент начала процесса t1 задан, а момент окончания процесса t2 оп-

ределяется первым моментом достижения точкой (t,x(t)) некоторой заданной

поверхности Rn+1:

 

 

{(t2 ,x )

 

i (t2 ,x ) 0,

i 1,...,l;t2 (t1 , ), x Rn }, (5.181)

 

т.е. в момент t2 должны выполняться условия

i (t2 ,x(t2 )) 0,

i 1,...,l ,

где 0 l n+1, при l=n+1 множество представлено точкой в пространстве

Rn+1, функции i(t2,x) – непрерывно дифференцируемы, а система векторов

551

 

i (t2

,x )

 

i (t2 ,x )

 

i (t2

,x )

 

 

 

,...,

,

,

i 1,...,l

x1

 

xn

t1

 

 

 

 

 

 

 

 

 

 

линейно независима (t2,x) Rn+1.

Будем считать, что область допустимых управлений Uдоп есть множест-

во всех ограниченных непрерывных функций u(t) на [t1, t2] таких, что u(t) U

для любого t из [t1, t2], где U - заданное подмножество метрического про-

странства Rm размерности m.

Введем скалярный критерий качества вида (5.175)

I(d ) V3 ( x(t2

),t2 )

t2

 

L( x,u,t )dt ,

(5.182)

 

 

t1

 

где L(x,u,t) действительная функция на R Rm [t1,t2]; V3(x(t2),t2) – действи-

тельная функция на Rn [t1,t2].

Пусть S – заданное множество из Rn [t1,t2]. Элементами S являются па-

ры (x(t2),t2). Назовем S множеством целей (множеством конечных состоя-

ний) и V3(x(t2),t2) функцией конечных состояний.

Будем считать, что функции f(x,u,t) и L(x,u,t) непрерывны и дифферен-

цируемы по совокупности переменных x, u, t.

Пусть t1 элемент из [t1,t2] и x(t1) – элемент из Rn.

Задачей оптимального управления для системы (5.180) при сделанных предположениях относительно множества конечных состояний S для функ-

ционала (5.182), области допустимых управлений u(t) U и начального со-

стояния x(t1) в начальный момент времени t1 является отыскание такого управления u(t) из U, что функционал I достигает минимального значения.

Конкретизация выражений f(x,u,t), L(x,u,t), V3(x(t2),t2) и множество це-

лей S порождают различные типы задач синтеза управлений /32/.

Решение задач синтеза управлений базируется на классическом вариа-

ционном исчислении, к которому принято относить все методы решения оп-

тимизационных задач, основанные на анализе необходимых (и достаточных) 552

условий оптимальности, вытекающих из анализа вариаций (малых смеще-

ний) минимизируемого функционала. Однако, в практических задачах мно-

жество управлений нередко имеют ограничения, выражаемые неравенствами,

и необходимые условия минимизации функционала, следующие из классиче-

ского вариационного исчисления, становятся непригодными для синтеза сис-

тем.

Существенным развитием теории оптимального управления является принцип максимума Л.С. Понтрягина, определяющий условия экстремума

функционала вида (5.176).

 

 

 

 

Пусть на тройке d*

(t2* ,x* ( ),u* ( )) D(t1 ,x1 )

достигается минимум

функционала

(5.175).

Тогда

существует

такая

функция

(t ) ( 1(t

),.... n(t ))T (где i(t) – множители Лагранжа), что:

 

в каждой точке непрерывности управления u*(t) функция

H(t, (t),x*(t),u) достигает максимума по управлению, т.е.

max H(t, (t ),x* (t ),u) H(t, (t ),x* (t ),u* (t ))

u U

 

 

n

 

 

где H(t, ,x,u) j fj (t,x,u) 0 L(t,x,u)

0

, n – порядок харак-

j 1

1

теристического уравнения системы;

выполняется условие трансверсальности

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

V3 (t*2

) H(t2*

) t2 j (t2* ) xj

 

0

(5.183)

 

 

 

 

 

 

 

 

 

 

j 1

 

 

 

 

 

при любых вариациях t2

 

и xj, удовлетворяющих системе

 

 

 

 

 

 

 

*

 

*

 

*

 

 

 

 

 

 

 

 

 

i (t2

,x

 

(t2 )) 0,

 

 

 

 

 

 

 

 

 

i 1,...,l

 

 

 

 

 

 

 

 

(t* ,x* (t*

)) 0,

i 1,...,l

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

2

 

 

2

 

 

 

 

 

 

 

где H(t*

) H(t*

, (t*

),x* (t* ),u*

(t* )),

V (t* ) V (t

*

,x* (t*

)), а вариации

2

2

2

 

 

 

 

2

 

 

2

3

2

3

2

2

 

определяются следующим образом:

553

 

 

 

 

 

 

 

 

V (t* ,x* (t*

))

 

n

 

 

V (t* ,x*

(t*

))

 

V3 (t2* ) V3 (t2*

,x* (t*2 ))

 

 

 

 

3

 

2

 

2

 

 

 

t2

 

 

3 2

2

 

xj ,

 

 

 

 

 

 

t2

 

 

 

 

 

 

 

xj

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j 1

 

 

 

 

 

 

 

 

*

,x

*

(t

*

))

 

 

n

 

 

 

 

*

,x

*

*

 

 

 

 

i (t2* ,x* (t2* ))

i (t2

 

2

t2

 

i (t2

 

(t2 ))

xj ;

 

 

 

t2

 

 

 

 

 

 

 

 

 

 

 

xj

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j 1

 

 

 

 

 

 

 

 

 

 

 

функции x*( ),

( ) удовлетворяют системе уравнений

 

 

 

 

 

 

 

 

 

 

 

 

*

 

 

 

*

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x*j

(t )

H(t, (t ),x

 

(t ),u (t ))

fj (t,x* (t ),u* (t )),

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

H(t, (t ),x

*

(t ),u

*

(t ))

 

 

 

 

 

 

 

 

 

j

 

 

 

 

 

 

 

 

 

 

 

 

(5.184)

(t )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

xj

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

*

(t1 ) x0 j , j 1,...,n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xj

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Система (5.184) называется системой канонических уравнений, функ-

ции 1(t),… n(t) – вспомогательные переменные (множители Лагранжа),

H(t, ,x,u) гамильтониан.

Из общей постановки задачи следуют несколько практически важных частных случаев.

1.Если заданы времена окончания процесса t2 и фиксированное чис-

ло k координат x11,…,xk1

x(t2),

т.е. t2=T2 , xj(t2)=xj1, j=1,…,k; 0 k n,

l=k+1, функции j(t2,x) имеют вид

 

 

 

j (t2 ,x ) xj

xj1

0,

j 1,...,k;

k 1(t2 ,x ) t2 T2 0.

При k=n правый конец траектории фиксирован, а при k=0 свободен.

Отсюда следует, что xj=0, j=1,…,k; t2=0.

Решаемая задача с фиксированным временем окончания записывается в

форме

 

t2

 

I(d ) V3( x(t2 )) L( x(t ),u(t ),t )dt min

 

t1

.

Решением задачи является пара (x*( ), u*( )) – оптимальные траектория

554

и управление.

2.Если начальное состояние и момент начала процесса не заданы,

аопределяются вместе с конечным состоянием соотношениями

 

 

 

 

 

 

i (t1 ,x(t1 ),t2

,x(t2 )) 0,

i 1,...,l ,

терминальный

член

функционала может

 

задаваться

в виде разности

V32(t2,x(t2))-V31(t1,x(t1)). Тогда решаемая задача записывается в форме

 

I(d ) V32 (t2 ,x(t2 )) V31(t1

t2

 

 

 

,x(t1 )) L( x(t ),u(t ),t )dt min

 

 

 

 

 

 

 

 

 

 

t1

 

,

а условия трансверсальности имеют вид

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

V32 (t2* ) H(t2* ) t2 j (t2* ) xjt2

 

 

 

 

 

 

 

 

 

 

j 1

 

 

(5.185)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

V31(t1* ) H(t1* ) t1 j (t1* ) xjt1

0

 

 

 

 

 

 

 

 

 

 

j 1

 

 

 

 

 

 

*

*

*

*

*

 

*

 

 

 

 

i (t

1 ,x

 

(t1

),t2 ,x (t2 )) 0,

i 1,...,l

 

 

 

 

 

 

при

 

(t*

,x*

(t* ),t* ,x* (t*

)) 0,

i 1,...,l

.

 

 

i

 

 

 

 

1

 

 

1

2

 

2

 

 

 

 

 

Решением в этом случае является четверка (t1* ,t*2 ,x* ( ),u( )), вклю-

чающая оптимальные моменты начала и окончания процесса, траекторию и управление.

3.Если на управление нет ограничений, т.е. U=Rq , то максимум га-

мильтониана ищется с помощью необходимых и достаточных условий безус-

ловного экстремума.

4.Если модель объекта управления линейна, а функционал квадра-

тичный, принцип максимума является необходимым и достаточным услови-

ем оптимальности в задаче (5.176).

Рассмотрим несколько подробнее частный, но важный для практиче-

ских приложений, случай о линейных оптимальных быстродействиях, когда уравнение состояния объекта линейны и минимизируется время перехода

555

t2

I t2 t1 dt

t1 .

Примем, что закон движения в общем случае нестационарного объекта описывается векторным дифференциальным уравнением ( уравнения выхода)

вида (5.23)

 

 

x(t

) A(t )x(t ) B(t )u(t ),

(5.186)

где x n-мерный вектор состояния; u q-мерный вектор управлений (вход-

ных воздействий); A(t), B(t) – матрицы размера (n n), (n q) соответственно.

Пусть линейный объект стационарен, а матрица коэффициентов А име-

ет все действительные собственные значения. Тогда характеристическое

уравнение системы (5.186)

 

a11

a12

 

a1n

 

 

 

a21

a22

 

a2n

0

(5.187)

 

 

 

 

 

 

 

 

an1

an2

 

ann

 

 

имеет только действительные значения.

Множество U представляет собой параллелепипед, определенный не-

равенствами

i ui i , i 1,2, ,m.

 

(5.188)

Гамильтониан может быть записан в виде

 

 

n

n

n

n

H( ,x,u ) ( ,Ax ) ( Bu ) j

aji xi

j bjiui

j 1

i 1

j 1

i 1

Вспомогательная система уравнений записывается следующим обра-

зом:

 

d j

aji xi ,

j 1, ,n

 

 

 

n

 

 

 

dt

i 1

 

 

или в векторной форме

 

 

 

 

 

AT .

(5.189)

 

 

556

 

Очевидно, гамильтониан как функция u U достигает максимума одно-

временно с функцией ( ,Bu). Таким образом, на основании принципа макси-

мума можно утверждать, что если u(t) – оптимальное управление, переводя-

щее фазовую точку x0(t) в конечное состояние xk(t), то существует такое ре-

шение вспомогательной системы (5.189), что

( (t ),Bu(t )) sup H( ,x,u) M( (t )),

(5.190)

u U

 

где M( (t)) – верхняя грань значений функции H( ,x.u).

Уравнение (5.189) не содержит неизвестных функций x(t) и u(t) поэто-

му все решения этого уравнения могут быть найдены, а затем определяется управление u(t) как решение уравнения (5.190). Так как функция ( (t),Bu)

линейна, то она либо постоянна, либо достигает своего максимума лишь на границе многогранника. Поскольку это соображение применимо к каждой грани, то функция ( (t),Bu) достигает своего максимума либо лишь в одной вершине многогранника U, либо на целой грани, причем в последнем случае достижение максимума возможно лишь для конечного числа значений t.

Точку разрыва оптимального управления называют точкой переключения.

Сформулируем без доказательства теорему о числе переключений,

впервые доказанную А.А. Фельдбаумом /104/.

Теорема. Пусть область управления U представляет собой параллеле-

пипед, определяемый неравенствами (5.188), и все собственные значения матрицы A действительны. Тогда для каждого ненулевого решения (t)

уравнений (5.189) соотношение (5.190) однозначно определяет управление u(t)=(u1(t),…,um(t)). При этом оказывается, что каждая из функций uk(t) (k=1,…,m) кусочно-постоянна, принимает только значения k и k и имеет не более (n-1) переключений (не более n интервалов постоянства), где n – поря-

док системы уравнений (5.186).

Пример 5.9. Даны модель объекта управления /9/

x(t

) x(t ) u(t ),

x(0) 0,

557

где x R; x R; t [0;1], и функционал

1

I u2(t )dt x(1) min

0 .

Требуется найти оптимальную пару ( x*( ),u( )), на которой достигается минимум функционала.

Сравнивая с (5.180), имеем f(t,x,u)=x+u, а сопоставляя функционал с (5.182), -

L(t,x,u)=u2, V3(t2)=-x. В соответствии с (5.181) i(t2 ,x(t2 )) t2 1 0 . Решается задача

Больца.

1.Составляем гамильтониан: H(t, ,x,u)= (x+u)-u2.

2.Находим максимум гамильтониана по управлению. Так как ограничения на управление отсутствуют, можно применить необходимые условия безусловного экстре-

мума

 

H(t, (t ),x(t ),u) (t ) 2u 0.

Отсюда

u*(t )

(t )

и

 

u

 

 

2

 

2

u2 H(t, (t ),x(t ),u) 2 0.

3. Выписываем уравнения системы (5.184) с учетом полученного результата:

x*j

(t )

H(t, (t ),x* (t ),u* (t ))

x(t ) u* (t ) x(t )

 

( t )

,

x(0 ) 0

 

 

2

 

 

 

 

 

 

j

(t )

H(t, (t ),x* ( t ),u* (t ))

(t ).

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

4. Проверяем условие трансверсальности в форме (5.183). Так как V3(t2,x)=-x, то

V3=- x и

x H(t

 

) t

 

(t

 

) x

 

0

 

 

2

 

 

2

 

 

 

2

 

t2 1

.

 

 

 

 

 

 

 

 

 

 

 

 

Поскольку t2=1, то t2=0. Ограничений на x(t2) не наложено, поэтому вариация x

произвольна. В результате имеем [ (t2

) 1] x

 

0

и, следовательно, (1)-1=0.

 

 

 

 

 

 

 

 

 

 

t2 1

 

 

5. Решаем полученную двухточечную краевую задачу:

 

 

 

 

 

 

(t )

 

 

 

 

 

x(t ) x(t )

 

 

 

,

x(0 )

0

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

(t ) (t ), (1) 1.

 

 

 

 

Из второго уравнения с конечным условием имеем (t ) e1 t . Поэтому оптималь-

558

ное управление u*(t ) 1e1 t .

2

Решая первое уравнение системы с начальным условием, получим оптимальную

траекторию x*(t ) 1 e1 t e1 t .

4

Пример 5.10. Найти оптимальное по быстродействию управление, соответствую-

щие ему траекторию и время, затрачиваемое на переход из состояния x1(0)=0, x2(0)=-4 в

начало координат для модели объекта управления, описываемой системой дифференци-

альных уравнений

x1(t ) x2(t ), x2(t ) u(t ),

где x=(x1,x2)T, mod(u) 1.

Cформулируем задачу в форме минимизации функционала

T

I dt min

 

0

,

где момент окончания процесса управления Т не задан и подлежит определению.

В данном примере f1(t,x,u)=x2,

f2(t,x,u)=u и L(t,x,u)=1, V3(t2) 0, t2=T,

1(T,x(T )) x1(T ) 0,

2(T,x(T )) x2(T ) 0. Решается задача Лагранжа.

Требуется найти оптимальное программное управление u*( ), соответствующую ему траекторию x*( ), и время T.

1.Составляем гамильтониан: H(t, ,x,u)= 1 x2+ 2 u - 1.

2.Находим максимум гамильтониана по управлению. Так как имеются ограниче-

ния на управление, требуется найти условный максимум гамильтониана по управлению. В

данной задаче гамильтониан линеен по u на заданном отрезке изменения управления

[-1,1], поэтому оптимальное управление имеет вид

u*(t ) argmax H(t, (t ),x(t ),u) 1 sign 2(t )

u

1

.

 

3. Выписываем уравнения системы (5.184) с учетом полученного результата:

559

x1* (t ) x2(t ),

x1(0 ) 0, x1(T ) 0,

 

 

 

x*2(t ) u(t ) sign 2(t ),

 

 

 

 

 

 

x2(0 ) 4, x2(T ) 0,

 

 

 

 

*

 

*

 

 

 

 

 

1(t )

H(t, (t ),x

 

(t ),u (t ))

 

0,

 

 

 

 

 

 

 

 

 

 

 

 

x1

 

 

 

 

 

 

 

 

H(t, (t ),x* (t ),u* (t ))

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2(t )

x

2

 

 

 

 

1(t ).

 

 

 

 

 

 

 

 

 

 

.

4. Проверяем условие трансверсальности в форме (5.183)

 

 

 

 

 

2

 

 

 

 

0

 

 

 

 

 

 

 

 

V3 H(t2 ) t2 j

(t2 ) xj

t2

 

 

 

 

j 1

 

 

 

T

,

 

 

 

 

 

 

 

 

где V3=0. Так как момент окончания Т не задан, а x1(T) и x2(T) заданы, то вариация t2

произвольна, а, x1=0,

x2=0. Поэтому из условия трансверсальности следует

H(T)=H(T, (T),x(T),u(T))=0.

 

 

 

5. Решаем полученную двухточечную краевую задачу:

 

x1(t ) x2(t ),

x1(0 ) 0, x1(T ) 0

 

x2 (t ) sign 2(t ),

x2(0 ) 4, x2(T ) 0

 

 

1(t ) 0

 

 

 

 

 

 

2(t ) 1(t )

 

 

 

 

 

 

H(T, (T ),x(T ),u(T )) 0

 

 

Решая два уравнения для вспомогательных переменных, получаем

1(t ) C1 const, 2(t ) C1t C2 , u* (t ) 1 sign( C1t C2 ).

Так как линейная функция меняет знак не более одного раза, то оптимальное управление является кусочно-постоянной функцией, имеющей не более двух интервалов знакопостоянства, что отвечает теореме о числе переключений. На одном интервале u(t)=1, а на другом u(t)=-1.

6. Для определения оптимальной траектории построим фазовый портрет. Уравне-

ние фазовых траекторий системы

 

 

 

 

 

 

 

 

 

x1

(t ) x2(t ),

 

 

 

 

 

 

 

 

 

 

 

x2(t ) u(t ) const

 

dx

 

 

x

 

 

 

 

x

 

 

 

 

 

x2

имеет вид

 

1

 

 

2

. Откуда dx

 

 

 

2

 

dx

 

, или x

2

C .

 

 

 

 

 

 

 

 

dx2

 

u

 

1

 

u

 

2

1

2u

На рис. 5.37, а,б изображены два возможных семейства парабол. По траекториям,

проходящим через начало координат, движение происходит на последнем интервале зна-

560