Добавил:

mihail1000 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Воронежский государственный технический университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Учебное пособие 800669

.pdf

Скачиваний:

Добавлен:

01.05.2022

Размер:

25.44 Mб

Скачать

☆

<<< < Предыдущая 44 45 46 47 48 49 50 51 52 53 54 5556 / 6956 57 58 59 60 61 62 63 64 65 66 67 68 > Следующая >>>

		Очевидно, отрезок (0, k1] на оси абсцисс
		не является областью Парето, т.к. здесь увеличе-
		ние k1 уменьшает установившуюся ошибку, не
		увеличивая колебательности процессов. Обла-
		стью Парето, т.е. решением задачи векторной оп-
		тимизации, являются значения k1>1/4Т. В этой
	Рис. 5.36. Графики зависимости	области любое изменение k1 приводя к уменьше-
	Рис. 5.36. Графики зависимости	нию одного критерия, обязательно увеличивает
	показателей качества от добротности	нию одного критерия, обязательно увеличивает
	показателей качества от добротности
	контура	другой.

Таким образом, формализация требований к системе управления в виде векторного

критерия позволила несколько сократить исходную неопределенность относительно доб-

ротности системы: вместо k1>0 имеем k1>1/4Т. Дальнейшее уменьшение неопределенно-

сти решения связано с дополнительной информацией о предпочтениях проектировщика,

позволяющих достичь компромисса между интересами отдельных частных критериев.

5.5.4. Синтез систем программного управления

Принцип максимума. Пусть требуется определить оптимальное управление при использовании информации только о времени (программное управление или управление в разомкнутой системе) для объекта, описывае-

мого на интервале [t1, t2] дифференциальным уравнением /9/

x(t ) f( x(t ),u(t ),t ), x Rn , u Rm . (5.180)

Момент начала процесса t1 задан, а момент окончания процесса t2 оп-

ределяется первым моментом достижения точкой (t,x(t)) некоторой заданной


поверхности Rn+1:
{(t2 ,x )	i (t2 ,x ) 0,		i 1,...,l;t2 (t1 , ), x Rn }, (5.181)

т.е. в момент t2 должны выполняться условия
i (t2 ,x(t2 )) 0,		i 1,...,l ,

где 0 l n+1, при l=n+1 множество представлено точкой в пространстве

Rn+1, функции i(t2,x) – непрерывно дифференцируемы, а система векторов

551

i (t2	,x )		i (t2 ,x )		i (t2	,x )
		,...,		,			,	i 1,...,l
x1			xn		t1

линейно независима (t2,x) Rn+1.

Будем считать, что область допустимых управлений Uдоп есть множест-

во всех ограниченных непрерывных функций u(t) на [t1, t2] таких, что u(t) U

для любого t из [t1, t2], где U - заданное подмножество метрического про-

странства Rm размерности m.

Введем скалярный критерий качества вида (5.175)

I(d ) V3 ( x(t2	),t2 )	t2
I(d ) V3 ( x(t2	),t2 )	L( x,u,t )dt ,	(5.182)
		t1

где L(x,u,t) действительная функция на R Rm [t1,t2]; V3(x(t2),t2) – действи-

тельная функция на Rn [t1,t2].

Пусть S – заданное множество из Rn [t1,t2]. Элементами S являются па-

ры (x(t2),t2). Назовем S множеством целей (множеством конечных состоя-

ний) и V3(x(t2),t2) – функцией конечных состояний.

Будем считать, что функции f(x,u,t) и L(x,u,t) непрерывны и дифферен-

цируемы по совокупности переменных x, u, t.

Пусть t1 элемент из [t1,t2] и x(t1) – элемент из Rn.

Задачей оптимального управления для системы (5.180) при сделанных предположениях относительно множества конечных состояний S для функ-

ционала (5.182), области допустимых управлений u(t) U и начального со-

стояния x(t1) в начальный момент времени t1 является отыскание такого управления u(t) из U, что функционал I достигает минимального значения.

Конкретизация выражений f(x,u,t), L(x,u,t), V3(x(t2),t2) и множество це-

лей S порождают различные типы задач синтеза управлений /32/.

Решение задач синтеза управлений базируется на классическом вариа-

ционном исчислении, к которому принято относить все методы решения оп-

тимизационных задач, основанные на анализе необходимых (и достаточных) 552

условий оптимальности, вытекающих из анализа вариаций (малых смеще-

ний) минимизируемого функционала. Однако, в практических задачах мно-

жество управлений нередко имеют ограничения, выражаемые неравенствами,

и необходимые условия минимизации функционала, следующие из классиче-

ского вариационного исчисления, становятся непригодными для синтеза сис-

тем.

Существенным развитием теории оптимального управления является принцип максимума Л.С. Понтрягина, определяющий условия экстремума

функционала вида (5.176).
Пусть на тройке d*		(t2* ,x* ( ),u* ( )) D(t1 ,x1 )		достигается минимум
функционала	(5.175).	Тогда	существует	такая	функция
(t ) ( 1(t	),.... n(t ))T (где i(t) – множители Лагранжа), что:

в каждой точке непрерывности управления u*(t) функция

H(t, (t),x*(t),u) достигает максимума по управлению, т.е.

max H(t, (t ),x* (t ),u) H(t, (t ),x* (t ),u* (t ))

u U
n
где H(t, ,x,u) j fj (t,x,u) 0 L(t,x,u)	0	, n – порядок харак-
j 1	0	1

теристического уравнения системы;

выполняется условие трансверсальности

V3 (t*2

) H(t2*

) t2 j (t2* ) xj

(5.183)

j 1

при любых вариациях t2

и xj, удовлетворяющих системе

i (t2

(t2 )) 0,

i 1,...,l

(t* ,x* (t*

)) 0,

i 1,...,l

где H(t*

) H(t*

, (t*

),x* (t* ),u*

(t* )),

V (t* ) V (t

,x* (t*

)), а вариации

определяются следующим образом:

553

V (t* ,x* (t*

))

V (t* ,x*

(t*

))

V3 (t2* ) V3 (t2*

,x* (t*2 ))

3 2

xj ,

j 1

))

i (t2* ,x* (t2* ))

i (t2

(t2 ))

xj ;

j 1

функции x*( ),

( ) удовлетворяют системе уравнений

x*j

(t )

H(t, (t ),x

(t ),u (t ))

fj (t,x* (t ),u* (t )),

H(t, (t ),x

(t ),u

(t ))

(5.184)

(t )

(t1 ) x0 j , j 1,...,n

Система (5.184) называется системой канонических уравнений, функ-

ции 1(t),… n(t) – вспомогательные переменные (множители Лагранжа),

H(t, ,x,u) – гамильтониан.

Из общей постановки задачи следуют несколько практически важных частных случаев.

1.Если заданы времена окончания процесса t2 и фиксированное чис-

ло k координат x11,…,xk1	x(t2),	т.е. t2=T2 , xj(t2)=xj1, j=1,…,k; 0 k n,
l=k+1, функции j(t2,x) имеют вид
j (t2 ,x ) xj	xj1	0,	j 1,...,k;

k 1(t2 ,x ) t2 T2 0.

При k=n правый конец траектории фиксирован, а при k=0 – свободен.

Отсюда следует, что xj=0, j=1,…,k; t2=0.

Решаемая задача с фиксированным временем окончания записывается в

форме
t2
I(d ) V3( x(t2 )) L( x(t ),u(t ),t )dt min
t1	.

Решением задачи является пара (x*( ), u*( )) – оптимальные траектория

554

и управление.

2.Если начальное состояние и момент начала процесса не заданы,

аопределяются вместе с конечным состоянием соотношениями

i (t1 ,x(t1 ),t2

,x(t2 )) 0,

i 1,...,l ,

терминальный

член

функционала может

задаваться

в виде разности

V32(t2,x(t2))-V31(t1,x(t1)). Тогда решаемая задача записывается в форме

I(d ) V32 (t2 ,x(t2 )) V31(t1

,x(t1 )) L( x(t ),u(t ),t )dt min

а условия трансверсальности имеют вид

V32 (t2* ) H(t2* ) t2 j (t2* ) xjt2

j 1

(5.185)

V31(t1* ) H(t1* ) t1 j (t1* ) xjt1

j 1

i (t

1 ,x

(t1

),t2 ,x (t2 )) 0,

i 1,...,l

при

(t*

,x*

(t* ),t* ,x* (t*

)) 0,

i 1,...,l

Решением в этом случае является четверка (t1* ,t*2 ,x* ( ),u( )), вклю-

чающая оптимальные моменты начала и окончания процесса, траекторию и управление.

3.Если на управление нет ограничений, т.е. U=Rq , то максимум га-

мильтониана ищется с помощью необходимых и достаточных условий безус-

ловного экстремума.

4.Если модель объекта управления линейна, а функционал квадра-

тичный, принцип максимума является необходимым и достаточным услови-

ем оптимальности в задаче (5.176).

Рассмотрим несколько подробнее частный, но важный для практиче-

ских приложений, случай о линейных оптимальных быстродействиях, когда уравнение состояния объекта линейны и минимизируется время перехода

555

I t2 t1 dt

t1 .

Примем, что закон движения в общем случае нестационарного объекта описывается векторным дифференциальным уравнением ( уравнения выхода)

вида (5.23)
x(t	) A(t )x(t ) B(t )u(t ),	(5.186)

где x – n-мерный вектор состояния; u – q-мерный вектор управлений (вход-

ных воздействий); A(t), B(t) – матрицы размера (n n), (n q) соответственно.

Пусть линейный объект стационарен, а матрица коэффициентов А име-

ет все действительные собственные значения. Тогда характеристическое

уравнение системы (5.186)

a11	a12	a1n
a21	a22	a2n	0	(5.187)

an1	an2	ann

имеет только действительные значения.

Множество U представляет собой параллелепипед, определенный не-

равенствами

i ui i , i 1,2, ,m.			(5.188)
Гамильтониан может быть записан в виде
n	n	n	n
H( ,x,u ) ( ,Ax ) ( Bu ) j	aji xi	j bjiui
j 1	i 1	j 1	i 1

Вспомогательная система уравнений записывается следующим обра-

зом:

	d j	aji xi ,	j 1, ,n
		n
	dt	i 1
или в векторной форме
		AT .		(5.189)
		556

Очевидно, гамильтониан как функция u U достигает максимума одно-

временно с функцией ( ,Bu). Таким образом, на основании принципа макси-

мума можно утверждать, что если u(t) – оптимальное управление, переводя-

щее фазовую точку x0(t) в конечное состояние xk(t), то существует такое ре-

шение вспомогательной системы (5.189), что

( (t ),Bu(t )) sup H( ,x,u) M( (t )),	(5.190)
u U

где M( (t)) – верхняя грань значений функции H( ,x.u).

Уравнение (5.189) не содержит неизвестных функций x(t) и u(t) поэто-

му все решения этого уравнения могут быть найдены, а затем определяется управление u(t) как решение уравнения (5.190). Так как функция ( (t),Bu)

линейна, то она либо постоянна, либо достигает своего максимума лишь на границе многогранника. Поскольку это соображение применимо к каждой грани, то функция ( (t),Bu) достигает своего максимума либо лишь в одной вершине многогранника U, либо на целой грани, причем в последнем случае достижение максимума возможно лишь для конечного числа значений t.

Точку разрыва оптимального управления называют точкой переключения.

Сформулируем без доказательства теорему о числе переключений,

впервые доказанную А.А. Фельдбаумом /104/.

Теорема. Пусть область управления U представляет собой параллеле-

пипед, определяемый неравенствами (5.188), и все собственные значения матрицы A действительны. Тогда для каждого ненулевого решения (t)

уравнений (5.189) соотношение (5.190) однозначно определяет управление u(t)=(u1(t),…,um(t)). При этом оказывается, что каждая из функций uk(t) (k=1,…,m) кусочно-постоянна, принимает только значения k и k и имеет не более (n-1) переключений (не более n интервалов постоянства), где n – поря-

док системы уравнений (5.186).

Пример 5.9. Даны модель объекта управления /9/

x(t

) x(t ) u(t ),

x(0) 0,

557

где x R; x R; t [0;1], и функционал

I u2(t )dt x(1) min

0 .

Требуется найти оптимальную пару ( x*( ),u( )), на которой достигается минимум функционала.

Сравнивая с (5.180), имеем f(t,x,u)=x+u, а сопоставляя функционал с (5.182), -

L(t,x,u)=u2, V3(t2)=-x. В соответствии с (5.181) i(t2 ,x(t2 )) t2 1 0 . Решается задача

Больца.

1.Составляем гамильтониан: H(t, ,x,u)= (x+u)-u2.

2.Находим максимум гамильтониана по управлению. Так как ограничения на управление отсутствуют, можно применить необходимые условия безусловного экстре-

мума		H(t, (t ),x(t ),u) (t ) 2u 0.	Отсюда	u*(t )	(t )	и
	u			2

u2 H(t, (t ),x(t ),u) 2 0.

3. Выписываем уравнения системы (5.184) с учетом полученного результата:


x*j	(t )	H(t, (t ),x* (t ),u* (t ))		x(t ) u* (t ) x(t )			( t )	,	x(0 ) 0
x*j	(t )			x(t ) u* (t ) x(t )		2		,	x(0 ) 0
						2
j	(t )		H(t, (t ),x* ( t ),u* (t ))		(t ).
j	(t )				(t ).
			x

4. Проверяем условие трансверсальности в форме (5.183). Так как V3(t2,x)=-x, то

V3=- x и

x H(t		) t			(t		) x		0
	2			2		2		t2 1		.
										.
Поскольку t2=1, то t2=0. Ограничений на x(t2) не наложено, поэтому вариация x
произвольна. В результате имеем [ (t2			) 1] x					0	и, следовательно, (1)-1=0.
произвольна. В результате имеем [ (t2			) 1] x					0	и, следовательно, (1)-1=0.
							t2 1
5. Решаем полученную двухточечную краевую задачу:
					(t )
x(t ) x(t )						,	x(0 )		0
x(t ) x(t )					2	,	x(0 )		0
					2
(t ) (t ), (1) 1.
(t ) (t ), (1) 1.

Из второго уравнения с конечным условием имеем (t ) e1 t . Поэтому оптималь-

558

ное управление u*(t ) 1e1 t .

Решая первое уравнение системы с начальным условием, получим оптимальную

траекторию x*(t ) 1 e1 t e1 t .

Пример 5.10. Найти оптимальное по быстродействию управление, соответствую-

щие ему траекторию и время, затрачиваемое на переход из состояния x1(0)=0, x2(0)=-4 в

начало координат для модели объекта управления, описываемой системой дифференци-

альных уравнений

x1(t ) x2(t ), x2(t ) u(t ),

где x=(x1,x2)T, mod(u) 1.

Cформулируем задачу в форме минимизации функционала

I dt min

	0	,
где момент окончания процесса управления Т не задан и подлежит определению.
В данном примере f1(t,x,u)=x2,		f2(t,x,u)=u и L(t,x,u)=1, V3(t2) 0, t2=T,
1(T,x(T )) x1(T ) 0,	2(T,x(T )) x2(T ) 0. Решается задача Лагранжа.

Требуется найти оптимальное программное управление u*( ), соответствующую ему траекторию x*( ), и время T.

1.Составляем гамильтониан: H(t, ,x,u)= 1 x2+ 2 u - 1.

2.Находим максимум гамильтониана по управлению. Так как имеются ограниче-

ния на управление, требуется найти условный максимум гамильтониана по управлению. В

данной задаче гамильтониан линеен по u на заданном отрезке изменения управления

[-1,1], поэтому оптимальное управление имеет вид

u*(t ) argmax H(t, (t ),x(t ),u) 1 sign 2(t )

u	1	.

3. Выписываем уравнения системы (5.184) с учетом полученного результата:

559

x1* (t ) x2(t ),		x1(0 ) 0, x1(T ) 0,
x*2(t ) u(t ) sign 2(t ),
x*2(t ) u(t ) sign 2(t ),						x2(0 ) 4, x2(T ) 0,
				*		*
1(t )	H(t, (t ),x				(t ),u (t ))		0,
	H(t, (t ),x				(t ),u (t ))

		x1
	H(t, (t ),x* (t ),u* (t ))

2(t )		x	2						1(t ).
			2							.
4. Проверяем условие трансверсальности в форме (5.183)
					2				0
					2
V3 H(t2 ) t2 j						(t2 ) xj		t2
				j 1				t2	T	,
										,

где V3=0. Так как момент окончания Т не задан, а x1(T) и x2(T) заданы, то вариация t2


произвольна, а, x1=0,	x2=0. Поэтому из условия трансверсальности следует
H(T)=H(T, (T),x(T),u(T))=0.
5. Решаем полученную двухточечную краевую задачу:
x1(t ) x2(t ),		x1(0 ) 0, x1(T ) 0
x2 (t ) sign 2(t ),			x2(0 ) 4, x2(T ) 0
x2 (t ) sign 2(t ),			x2(0 ) 4, x2(T ) 0
1(t ) 0
1(t ) 0
2(t ) 1(t )
2(t ) 1(t )
H(T, (T ),x(T ),u(T )) 0
H(T, (T ),x(T ),u(T )) 0

Решая два уравнения для вспомогательных переменных, получаем

1(t ) C1 const, 2(t ) C1t C2 , u* (t ) 1 sign( C1t C2 ).

Так как линейная функция меняет знак не более одного раза, то оптимальное управление является кусочно-постоянной функцией, имеющей не более двух интервалов знакопостоянства, что отвечает теореме о числе переключений. На одном интервале u(t)=1, а на другом u(t)=-1.

6. Для определения оптимальной траектории построим фазовый портрет. Уравне-

ние фазовых траекторий системы

(t ) x2(t ),

x2(t ) u(t ) const

имеет вид

. Откуда dx

, или x

C .

dx2

На рис. 5.37, а,б изображены два возможных семейства парабол. По траекториям,

проходящим через начало координат, движение происходит на последнем интервале зна-

560

<<< < Предыдущая 44 45 46 47 48 49 50 51 52 53 54 5556 / 6956 57 58 59 60 61 62 63 64 65 66 67 68 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.05.202218.91 Mб51Учебное пособие 800664.pdf
#
01.05.202219.41 Mб38Учебное пособие 800665.pdf
#
01.05.202221.37 Mб21Учебное пособие 800666.pdf
#
01.05.202222.56 Mб19Учебное пособие 800667.pdf
#
01.05.202223.31 Mб25Учебное пособие 800668.pdf
#
01.05.202225.44 Mб19Учебное пособие 800669.pdf
#
01.05.2022409.79 Кб5Учебное пособие 80067.pdf
#
01.05.202225.75 Mб4Учебное пособие 800670.pdf
#
01.05.202226.29 Mб7Учебное пособие 800671.pdf
#
01.05.202228.85 Mб26Учебное пособие 800672.pdf
#
01.05.202229.01 Mб7Учебное пособие 800673.pdf