Добавил:

ivanov666 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Воронежский государственный технический университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

3832

.pdf

Скачиваний:

Добавлен:

15.11.2022

Размер:

25.44 Mб

Скачать

☆

<<< < Предыдущая 45 46 47 48 49 50 51 52 53 54 55 5657 / 6957 58 59 60 61 62 63 64 65 66 67 68 69 > Следующая >>>

копостоянства управления. Результирующий фазовый портрет и искомая оптимальная траектория, соответствующая заданным начальным условиям, представлены на рис. 5.37, в.

Рис. 5.37. Фазовый портрет системы

На первом участке

x1(t ) x2 (t ), x2(t ) u*(t ) 1

откуда

x	(t ) t C	,	x (t )	t2	C	t C
				2			2 .
2	1		1		1

При t =0 имеем x2(0)=C1= -4, x1(0)= C2=0, поэтому окончательно:

x1(t ) 4t,x2(t ) t 4 2 .

Найдем время Т= 1+ 2, затрачиваемое на переход из точки x0=(0,-4)T в начало ко-

ординат. Здесь 1 – время движения с управлением u*(t)=1 до точки переключения, 2 –

время движения с управлением u*(t)=-1.

На втором участке

x1(t ) x2 (t ),	x2(t ) u* (t ) 1
откуда

x	(t ) t C	,	x (t )	t2	C	t C
				2			2 .
2	1		1		1

В конечный момент времени Т= 1+ 2 траектория должна попасть в начало коорди-

нат:

	T	2
x (T )			C T C		0,
				2
1	2		1
x2(T ) T C1 ,

561

из чего следует	C1=T= 1+ 2,Ñ			T2			(		1		2	)2	.
из чего следует	C1=T= 1+ 2,Ñ												.
	2			2						2
				2						2
В силу непрерывности траектории при t= 1, имеем
	2						2								2
	x1( 1 )	1	4 1				1	( 1				2 ) 1		( 1 2 )
	x1( 1 )		4 1					( 1				2 ) 1
	2				2										2
	x2( 1 ) 1 4 1 1 2
	x2( 1 ) 1 4 1 1 2																	.
На первом участке оптимальной траектории до линии переключения u*(t)=1, а на
втором u*(t)=-1.
В результате получаем 2= 1-4,						12-8 1+8=0 и 1 4 2											, так как 2 0. Поэтому
В результате получаем 2= 1-4,						12-8 1+8=0 и 1 4 2										2	, так как 2 0. Поэтому

2 22,T 4 42 9,66

Если модель объекта управления описывается системой дифференциальных урав-

нений

x1(t ) x2(t ) p,
x2(t ) u(t )
	,

где p – заданное действительное число, то методика решения задачи не изменяется. Опти-

мальное управление является кусочно-постоянной функцией, имеющей не более двух ин-

тервалов знакопостоянства: на одном интервале u(t)=1, а на другом u(t)=-1. Уравнения фа-

зовых траекторий при u(t)=const:

dx1

x2 p

dx1

x2 p

dx2

или, интегрируя

px2

( x

p)2 C

На рис. 5.38, а,б изображены соответствующие фазовые траектории, а на рис. 5.38,

в –результирующий фазовый портрет с оптимальными фазовыми траекториями.

Синтез программного управления линейными системами при

квадратичном функционале оптимизации /9/. Пусть система (5.180), опи-

сывающая поведение модели объекта управления, имеет вид (5.186), а функ-

ционал качества управления квадратичный:

1 t2

(t )S(t )x(t ) u

(t2

) x(t

,(5.191)

(t )Q(t )u(t ) dt

2 x

2 )

562

	где Q(t) – неотрица-
	тельно определенная
	симметричная мат-
	рица размера (q q,);
	S(t) и – неотрица-
	тельно определен-
Рис. 5.38. Фазовый портрет системы	ные симметричные
матрицы размера (n n).

Начальное условие x(t1)=x0 Rn задано и определяет начальное состоя-

ние; на управление ограничений не наложено, т.е. u U=Rq; t T=[t1,t2] – про-

межуток времени функционирования системы, моменты начала t1 и оконча-

ния t2 процесса заданы, правый конец траектории x(t2) свободен.

Очевидно, что для достижения минимума функционала (5.191) необхо-

димо найти пару, состоящую из оптимальной траектории x*(t) и управления

u*(t).

Сравнивая (5.186), (5.191) с (5.180), (5.175), можем записать

f (t,x,u) A(t )x B(t )u,

L(t,x,u)

S(t )x u

Q(t )u

V3 (t,x,u)

x .

Учитывая, что

( Ax )

( xT Ax )

BT AT ,

(5.192)

AT ;

Ax AT x;( AB )T

составляем гамильтониан в виде:

H(t, ,x,u)

A(t )x

B(t )u

S(t )x u

Q(t )u

При отсутствии ограничений на управление можно применить необхо-

димые условия безусловного экстремума для определения максимума га-

мильтониана по управлению. Тогда

563

V3 Vx3 T x xT x

H(t, (t ),x(t ),u) BT (t ) (t ) Q(t )u 0

откуда определим оптимальное управление:

u* (t ) Q 1(t )BT (t ) (t ).

(5.193)

Найденное управление обеспечивает максимум функции H(t, ,x,u)

по управлению, так как удовлетворяются достаточные условия максимума

2 H(t, (t ),x(t ),u)

Q(t ) 0

в силу положительной определенности матрицы Q(t). Это позволяет соста-

вить систему канонических уравнений (5.184) в виде:

x(t	) A(t )x(t ) B(t )Q 1(t )BT (t ) (t ), x(t	1	) x	0		(5.194)
(t ) A(t ) (t ) S(t )x(t )		1		0	.	(5.194)
(t ) A(t ) (t ) S(t )x(t )

Для получения недостающих краевых условий системы (5.194), вос-

пользуемся условиями трансверсальности (5.183). Так как t2 задано, а состоя-

ние x(t2) свободно, то t2=0, а x - произвольно.

Находим вариацию функции V3 ( x ) 1 xT x :

Тогда условие трансверсальности принимает вид:

	T	(t2	)	T	(t2	T	x 0.
x						)

В силу произвольности x: (t2)= - x(t2).

Полученный результат позволяет представить двухточечную краевую задачу принципа максимума в виде

x(	t ) A(t )x(t ) B(t )Q 1(t )BT (t ) (t ),					x(t1 ) x0
(t ) A(t ) (t ) S(t )x(t ), (t2 ) x(t2 )								(5.195)
(t ) A(t ) (t ) S(t )x(t ), (t2 ) x(t2 )							.	(5.195)
*		1	(t )B	T	(t ) (t )
u (t ) Q			(t )B		(t ) (t )
					564

Пример 5.11. Для модели объекта x(t ) x(t ) u(t ), x(0 ) x0 при квадратичном

функционале качества управления I	1	1	u2	(t ) dt	1	x2	(1)	min требуется найти
		0
2					2

оптимальную пару (x*( ), u*( )), на которой достигается минимум функционала.

Сравнивая постановку задачи с (5.186), (5.191), получаем: A(t) =-1; B(t) =1; S(t) =0;

Q(t) =1; =1; t1=0; t2 =1. Тогда система (5.195) имеет вид

t ) x(t ) (t ),

x(t1 ) x0

(t ) (t ), (1) x(1)

u (t ) (t )

Решая полученную систему, имеем:

(t ) C

et , (1) C

e x(1), x(t ) C

e t

et , x(0 ) C

x(1) C

e 1

e,C

1 3e2

а искомая пара:

x*(t )

x (et

3e2 t )

, u*(t )

2x et

1 3e2 .

1 3e2

5.5.5. Синтез оптимального управления систем с полной обратной

связью

Модель объекта управления описывается уравнением (5.180) при функционале качества управления вида (5.175) /9/.

Предполагается, что при управлении используется информация о те-

кущем времени t и векторе состояния x, момент начала процесса задан, а мо-

мент окончания определяется первым моментом достижения точкой (t,x(t))

некоторой поверхности , заданной соотношениями (5.181). На множестве допустимых процессов D(t1,x(t1)=x0) задан функционал (5.175). Обозначим

Q Rn+1 множество точек (t,x), из которых можно достигнуть терминального множества по некоторой траектории, соответствующей допустимому управлению; Q(t1) – сечение множества Q при фиксированном времени t=t1.

Начальное значение x(t1)=x0 заранее не задано и может быть произвольным в

565

множестве Q(t1).

Множество Uдоп управлений с полной обратной связью (позиционных управлений) образуют функции u(t,x):T Rn U, которые для любых началь-

ных состояний порождают соответствующие тройки d=(t1,x( ),u( )) D(t1,x0),

где программные управления u( ) Uдоп, а t T u(t)=u(t,x(t)).

Применяемое в каждый момент времени t T управление имеет вид управления с полной обратной связью по вектору состояния. (рис. 5.39), при-

чем предполагается, что текущее (апостериорное) и априорное информаци-

онное обеспечение высокое.

Требуется найти такую функцию u*(t,x) Uдоп, что

I(d* ) min I(d )	x0 Q(t1 ),		(5.196)
d D( t1 ,x0 )
где d=(t1 , x( ), u( )=u*(t,x( ))).
	Функция u*(t,x( )) Uдоп назы-
	вается	оптимальным	управле-
	нием с полной обратной свя-
	зью и	порождает	минимум
	функционала (5.175) для лю-
Рис. 5.39. Система с полной обратной связью	бого начального состояния x0
Рис. 5.39. Система с полной обратной связью
по вектору состояния	из множества Q(t1).		Если мо-

мент окончания процесса t2 задан, оптимальное управление синтезируется в виде пары d=(x( ),u( )) D(t1,x0), порождающей минимум функционала (5.175)

для любого начального состояния x0 из множества Rn.

Достаточным условием минимума функционала (5.175) в системе с

полной обратной связью является уравнение Беллмана (Гамильтона – Якоби

– Беллмана) для непрерывных детерминированных систем /104/

V			V		0,	(5.197)
	min	L( x,u,t )		f ( x,u,t )
t			x
	u

где

566

Vt t2

V3 ( x(t2 )).

(5.198)

Введем в рассмотрение множество функций (t,x):Q R, непрерывно

дифференцируемых всюду, за исключением конечного числа сечений Q при

фиксированных t.

Тогда, если существует функция (t,x) , удовлетворяющая уравне-

нию Беллмана с граничными условиями

(t,x )

n (t,x )

max

(t,x,u) L(t,x,u) 0

(t,x ) Q,

(5.199)

u U

i 1

(t2 ,x ) V3 (t2 ,x )

(t2 ,x )

и управление, удовлетворяющее условию

(t,x )

u* (t,x ) argmax

fi (t,x,u) L(t,x,u)

u* (t,x ) Uдоп ,

(5.200)

u U

i 1

то u*(t,x) является оптимальным управлением с полной обратной связью. При этом минимальное значение функционала

		min	I(d ) (t1 ,x0				) (t1 ,x0 ) Q
	d D( t1 ,x0 )						.

Если положить Б(t,x)=- (t,x), то, используя равенство max f(x)=-min[-
f(x)], можно переписать (5.185) в эквивалентной форме
	Б	(t,x )	n	Б	(t,x )
min						fi	(t,x,u) L(t,x,u)	0,
		t
u U			i 1	xi				(5.201)

Б (t2 ,x ) V3 (t2 ,x )

При этом минимальное значение функционала (5.175)

min I(d ) Б (t	1	,x )	(t	1	,x	0	) Q.
d D( t1 ,x0 )	1	0		1		0
d D( t1 ,x0 )

Таким образом, отыскание оптимального управления в системе с пол-

ной обратной связью сопряжено с решением уравнения Беллмана (5.197) при граничных условиях (5.198).

Несмотря на компактную форму функционального уравнения (5.197),

его решение в практических многомерных случаях сталкивается с непреодо-

567

лимыми трудностями. Для подтверждения сказанного, положим, что v –

управление, удовлетворяющее необходимому условию локального минимума гладкой функции, находящейся в квадратных скобках уравнения (5.197). То-

гда вместо (5.197) можно записать

V		V
			f ( x,v,t ) L( x,v,t ),
t			f ( x,v,t ) L( x,v,t ),
t		t
				V	f ( x,v,t )
	L( x,v,t )			V		0
	L( x,v,t )					0

v				v x
v				v x		.

Таким образом, получили систему нелинейных взаимосвязанных урав-

нений в частных производных. Только при решении этой системы уравнений с учетом условия (5.198) и последующим выражением v как функции x,t за-

дача синтеза оптимального управления в виде обратной связи может считать-

ся решенной.

В инженерных приложениях оптимальное управление с полной обрат-

ной связью можно рассматривать как временную последовательность ло-

кальных программных управлений, что позволяет использовать для синтеза принцип максимума.

Пример 5.12. Для модели объекта и минимизируемого функционала, приведенных в примере 5.11, требуется найти оптимальное управление u*(t,x) с обратной связью, пере-

водящей объект из любого начального состояния в начало координат за наименьшее вре-

мя.

В данном случае f1(t,x,u)=x2, f2(t,x,u)=u и L(t,x,u)=1, V3(t2,x) 0, x(t2)=(0 0)T.. Решает-

ся задача Лагранжа.

1. Для рассматриваемой задачи условие (5.199)

имеет вид:

(t,x)

Б(t2 ,0) 0.

min

u 1 0,

Так как все траектории должны попасть в точку x(t2)=(0 0)T при t= t2, то граничное условие определено только в этой точке.

2.Находим структуру оптимального управления из условия минимума выражения

вфигурных скобках

568

u* (t,x ) sign Б (t,x ) .

3. Подставляем полученное выражение для управления в уравнение Беллмана

	Б(t,x )	Б(t,x )			x2		Б (t,x )			1 0,					Б (t2 ,0 ) 0.
					x2					1 0,					Б (t2 ,0 ) 0.
	t	x1					x2
4. Функция
												1
								2
								2
			x2			4 x1 2 x		2	,	x	1			x		2		x1
			x2			4 x1 2 x		2	,	x	1	2		x		2		x1
												2							,
	Б ( t ,x )			x2	,					x1	1		x				x1
															2
															2
											2
												1
								2
								2
			x2			4 x1 2 x		2	,	x	1			x		2		x1
			x2			4 x1 2 x		2	,	x	1	2		x		2		x1
												2

удовлетворяет граничному условию и уравнению в трех характерных областях, в чем можно убедиться подстановкой

Искомое оптимальное управление с полной обратной связью имеет вид

					1
			1,	x1			x		2			x1
			1,	x1			x		2			x1
					2								,
	*					1
	*					1
u		( t,x )	sign x2 ,	x1				x		2		x1
u		( t,x )	sign x2 ,	x1		2		x		2		x1
						2
			1,	x1		1		x				x1
											2
						2					2
						2

где x	1			1	x	2	x	1	– уравнение линии переключения оптимального управления.
				1

		2																1
		2
		Вычисляя производные функции Беллмана, например, при x													1				x	2	x	1	:


			Б ( t , x )							Б ( t ,x )			Б ( t ,x )			2
																2
											2							2 x2
									0 ,			,		1										,
									0 ,			,		1										,
					t					x1	4 x1 2 x22		x2				4 x1 2 x22

замечаем, что Б (t,x ) 0, т.е. u* (t,x )

вую часть уравнения Беллмана, получаем

Б(t,x )	Б (t,x )	x2	Б(t,x )
t	x1		x2

sign x2 1. Подставляя эти выражения в ле-

1 0			2		x2	2x2		1 0 .

	4x	1	2x	2		4x 2x	2
	4x		2x	2		4x 2x	2
				2		1	2

Следовательно, в области		1		полученные функции Á (t,x ) и u* (t,x )
Следовательно, в области	x1	2 x2	x1	полученные функции Á (t,x ) и u* (t,x )

являются решением задачи. В других областях проверка выполняется аналогично.

569

5.5.6. Аналитическое конструирование оптимальных регуляторов

Требования устойчивости и качества процессов можно описывать в не-

явной форме как экстремали тех или иных функционалов /9, 32/. Наиболее часто применяют интегральные квадратичные функционалы. Пусть поведе-

ние модели объекта управления описывается уравнением (5.186), а функцио-

нал качества управления представлен квадратичной формой (5.191).

Рассматривая, в общем случае, нестационарную задачу, для получения уравнения Беллмана сравним (5.186) с (5.180) и (5.101) с (5.175). Тогда

f (t,x,u ) A(t )x B(t )u,
	1			T			T
L(t,x,u)					S(t )x u			Q(t )u	,
L(t,x,u)	2	x			S(t )x u			Q(t )u	,
	2
V3 (t,x,u )			T	x
V3 (t,x,u )	x			x		.

Используя далее правила, определяемые (5.192) и то, что xT Ax 0 A AT 0,

из (5.199) получим для рассматриваемой задачи:

(t,x )

(t,x ) T

A(t )x

max

u Rq

S(t )x(t ) u

Q(t )u

(t2 ,x ) 1 xT x. 2

B(t )u

Из (5.203) определяем оптимальное управление в виде

*	(t,x )	T	1		T
*	(t,x )		1		T
u (t,x ) argmax		B(t )u		u		Q(t )u .
u (t,x ) argmax	x	B(t )u	2	u		Q(t )u .
u Rq	x		2

(5.202)

(5.203)

(5.204)

Дифференцируя последнее выражение по u с учетом вышеприведен-

ных правил и обозначений, приравнивая результат к нулю, получаем струк-

туру оптимального управления

*	1		T	(t,x )
u (t,x ) Q		(t )B		(t )		.	(5.205)
u (t,x ) Q		(t )B		(t )	x	.	(5.205)
					x

570

<<< < Предыдущая 45 46 47 48 49 50 51 52 53 54 55 5657 / 6957 58 59 60 61 62 63 64 65 66 67 68 69 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
15.11.202223.22 Mб13826.pdf
#
15.11.202223.31 Mб13827.pdf
#
15.11.202223.37 Mб13828.pdf
#
15.11.202224.68 Mб33829.pdf
#
15.11.202224.85 Mб03830.pdf
#
15.11.202225.44 Mб13832.pdf
#
15.11.202225.72 Mб03833.pdf
#
15.11.202225.75 Mб43834.pdf
#
15.11.202226.62 Mб13836.pdf
#
15.11.202227.05 Mб03837.pdf
#
15.11.202228.1 Mб13839.pdf