Добавил:

borisow03 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Новосибирский государственный технический университет

Предмет:

Основы Теории Управления

Файл:

vostrikov

.pdf

Скачиваний:

136

Добавлен:

23.01.2019

Размер:

12.99 Mб

Скачать

☆

<<< < Предыдущая 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 4445 / 4845 46 47 48 > Следующая >>>

13.3. Метод динамического программирования							441
и дополним его уравнением в частных производных (13.26)
2u0			V		0 .

			xT
			xT
Выразим из второго уравнения			V		x и подставим в первое, в резуль-
тате получим
5x2	u2	4xu2			2u2		0
	0			0		0
или после приведения подобных
u2	4xu			5x2		0 .
0		0
Решение квадратного уравнения относительно управления дает два
значения:
u0 1	5x,			u0 2			x.

Поскольку для одной системы двух оптимальных законов управления быть не может, одно из найденных значений не является оптимальным. Для определения оптимального управления проверим устойчивость замкнутой системы.

В уравнение объекта подставим значение u0 1 и получим уравнение замкнутой системы

x 3x .

Как видим, система неустойчива, а значит, первое управляющее воздействие не является оптимальным.

В уравнение объекта подставим значение u0 2 , при этом уравнение замкнутой системы примет вид

x 3x

и она будет устойчивой.

Таким образом, оптимальный закон управления имеет вид u0 Kx , где

K 1 .

442	Глава 13. ОПТИМАЛЬНЫЕ СИСТЕМЫ

13.4. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА

13.4.1. ОСНОВНОЕ СООТНОШЕНИЕ ПРИНЦИПА МАКСИМУМА

Принцип максимума Понтрягина представляет собой метод расчета оптимального управления. Он был сформулирован независимо [1, 3, 31] и почти в то же время, что и метод динамического программирования. Впоследствии оказалось, что уравнения одного метода можно получить из другого и наоборот. Запишем основные соотношения принципа максимума на основе уравнений метода динамического программирования.

Рассмотрим основное соотношение (13.24)

min f0 (x, u)	V	f (x, u) 0 .
	xT
u u

Поскольку минимум функции равен максимуму этой же функции с противоположным знаком, то справедливо:

max f0 (x, u)	V	f (x, u) 0 .	(13.27)
	xT
u u

Преобразуем уравнение (13.27), предварительно введя ряд обозначений.

1. Введем расширенный вектор состояния z Rn 1 , дополнив его компонентой x0:

		T
	x0	f0 (x, u)d
	x1	0
z	x1	x1	.	(13.28)
z			.	(13.28)

	xn
	xn	xn
		xn

13.4. Принцип максимума Понтрягина

443

2. Введем соответствующий расширенный вектор правых частей

Rn 1 :

		f0 (x, u)
	(x, u)	f1		(x, u)	.			(13.29)
	(x, u)				.			(13.29)

		fn (x, u)
3. Вектор сопряженных координат				Rn 1 :
(z)	1,	V	,	,		V	.	(13.30)
(z)	1,		,	,			.	(13.30)
		x1				xn

Определим скалярное произведение вектора сопряженных координат и расширенного вектора правых частей, которое называется функцией

Понтрягина (гамильтониан):

(z) (x,u) .

(13.31)

Если вместо вектора сопряженных координат и расширенного вектора правых частей подставить их значения согласно (13.30) и (13.29) в выражение (13.31), то последнее можно представить следующим образом:

					f0	(x,u)
H	1,	V	, ...,	V f1		(x,u)	,
H	1,	x	, ...,	x			,
		x		x
		1		n

fn (x,u)

или окончательно

H f0 (x, u)	V	f (x, u) .
	xT

С учетом (13.32) уравнение (13.27) можно записать в виде

max H (z,u) 0 ,

u u

(13.32)

(13.33)

которое и представляет собой основное соотношение принципа максимума.

444	Глава 13. ОПТИМАЛЬНЫЕ СИСТЕМЫ

При этом сопряженные координаты определяются системой дифференциальных уравнений

H	.	(13.34)

zT

Формулировка принципа максимума. Оптимальным является управ-

ление из области допустимых значений, которое обеспечивает максимум выражения (13.33).

В случае, когда ресурс управления объекта не ограничен, для нахождения максимума гамильтониана можно воспользоваться необходимым условием экстремума

0 . ( 13.35)

При ограниченном ресурсе (например, u U ) вычисленное с по-

мощью (13.35) оптимальное управляющее воздействие может находиться вне области допустимых значений, поэтому для отыскания максимума гамильтониана необходимо использовать максимальное значе-

ние управления U .

13.4.2. ПРОЦЕДУРА ОПРЕДЕЛЕНИЯ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

На основе рассмотренных соотношений принципа максимума Понтрягина можно предложить следующую процедуру расчета регулятора.

1. Описание объекта следует привести к стандартному для теории оптимального управления виду (13.1):

x f (x, u),
x f (x, u),	u	U .

Записывается критерий оптимальности (13.4) в форме

J 0 min f0 (x, u)dt .
u	u 0

13.4. Принцип максимума Понтрягина	445
2. Формируется расширенный вектор состояния	z и правых час-

тей (z,u); в общем виде записывается вектор сопряженных координат

0 , 1,..., n .

3. В форме скалярного произведения векторов ( ) и ( ) записывается выражение

H(z) (z, u) .

4.Из условия максимума определяется оптимальное управление как функция сопряженных координат

max H : u0 u0 ( ) .

5.Формируется система дифференциальных уравнений для нахождения сопряженных координат

H . zT

6.Вычисляется оптимальное управление в виде функции времени (программное управление)

u0 u0 (t) .

7. По возможности осуществляется переход к оптимальному управлению в виде обратной связи

u0 u0 (x) ,

т. е. решается задача синтеза регулятора.

Рассмотрим вычисление оптимального управления с помощью описанной процедуры на примере.

446	Глава 13. ОПТИМАЛЬНЫЕ СИСТЕМЫ

ПРИМЕР 13.3

Определить оптимальное управление для объекта, поведение которого описывают уравнения

x1 x2 , x2 u.

Требуется обеспечить переход из начальной точки в конечную

x1	0	0	x1	T	1
x2	0	0	x2	T	0

за заданное время T 1 с при минимуме затрат энергии, т. е.

J min u2d .

u	u 0

Поскольку известно описание объекта в переменных состояния, переходим к формированию расширенного вектора состояния и правых частей, а также запишем вектор сопряженных координат

			T
	z1	x0	u2d		f0	u2
z	z2	x1	0	,	f1	x2 ,
z	z2	x1	x1	,	f1	x2 ,
	z3	x2	x1		f2	u
	z3	x2	x2		f2	u
			x2
			0,	1,	2 .

Сформируем теперь гамильтониан

H	0	u2	x	2	u
	0	1	2	2

и определим его максимум по u

max H :		H	2	0u	2 0 .

		u
u	u	u
	u

Из этого уравнения определим оптимальное управление в виде функции сопряженных координат

u0	2	.

2	0

13.4. Принцип максимума Понтрягина

447

Для сопряженных координат запишем систему дифференциальных уравнений

из которой получим

const,

c2t

c3.

В результате оптимальное управление примет вид


u0		c2t c3	b t b .
u0			b t b .
	1			2
		2c1
Коэффициенты bi (i	1, 2) определим,			решая краевую задачу. С этой

целью запишем уравнения замкнутой системы

x1 x2 ,

x2 b1t b2.

Найдем решение для переменных состояния:

		T							1
x t	x 0		b t b d						1	b t2			b t,
x t	x 0		b t b d					2		b t2			b t,
2	2	0	1				2	2		1			2
		0
x t	x 0	T	1	b		2	b	d			1	b t3		1	b t 2.
x t	x 0	T		b			b	d				b t3			b t 2.
1	1	0	2		1		2			6		1	2		2
		0

Учтем теперь заданные начальные и конечные условия и T = 1 с.

x	T	1	1		b		1	b ,

1			6			1	2	2
x	T	0		1		b	b .

2			2			1		2

448		Глава 13. ОПТИМАЛЬНЫЕ СИСТЕМЫ
	Решая полученную систему уравнений, определим неизвестные коэф-

	фициенты: b1 12, b2	6 . В результате оптимальный программный за-
	кон управления будет
		u0 12t 6 .

13.4.3. ЗАДАЧА ОПТИМАЛЬНОГО БЫСТРОДЕЙСТВИЯ

Задача оптимального быстродействия имеет некоторые особенности, которые упрощают ее решение на основе принципа максимума Понтрягина [1, 3].

Гамильтониан быстродействия. Рассмотрим общий класс объек-

тов управления (13.1)

x f (x,u), x Rn , u Rm , m n

с ограниченным управлением u U и критерием оптимальности в виде (13.6), т. е. критерием быстродействия

J min d .

u	u 0

Согласно процедуре синтеза на основе принципа максимума запишем расширенный вектор правых частей и вектор сопряженных координат

1
f1( )	,	1,	1, ,	n ,
	,	1,	1, ,	n ,

fn ( )

азатем сформируем гамильтониан в виде

( ) 1 1 f1( ) n fn ( ) .

(13.36)

В соответствии с (13.33) максимум гамильтониана равен нулю. Поскольку первое слагаемое в данном выражении не зависит от управления, можно вместо (13.36) рассматривать усеченный гамильтониан,

который называется гамильтонианом быстродействия

13.4. Принцип максимума Понтрягина

449

Hб f ( )		1 f1( )		n fn ( ) .	(13.37)
В этом случае уравнение принципа максимума принимает вид
	max Hб		1.		(13.38)
	u	u
		u

Таким образом, при решении задачи оптимального быстродействия нет необходимости переходить к расширенному вектору состояния и расширенному вектору правых частей. Можно сформировать гамильтониан быстродействия и определить управление, обеспечивающее его максимум в соответствии с (13.38).

Разрывное (релейное) управление. Для объектов с аддитивным управлением вида (13.2)

x f (x) B(x)u,	x Rn , u Rm ,

ограниченным ресурсом управления	u	U и требованием в виде кри-

терия быстродействия управляющее воздействие имеет разрывный характер.

Сформируем гамильтониан быстродействия (13.37)
Hб	1 f1( ) 1B1( )u		n fn ( )	nBn ( )u ,	(13.39)
где fi ( ) – i-й элемент вектора		f (x) ,	а Bi ( )	– i-я строка матрицы
B(x) , i = 1, 2, …, n.

Управление, обеспечивающее максимум гамильтониана (13.39) с учетом ограничений, имеет вид


u0 U		sgn B(x) .	(13.40)

Следовательно, для объектов класса (13.2) оптимальное управление всегда носит релейный характер.

Теорема о числе переключений. Данная теорема связывает число переключений оптимального управления со свойствами объекта. Она справедлива для линейных объектов (13.3)

x Ax Bu , x Rn , u Rm , m n

с ограничением типа u U и критерием быстродействия. При этом оптимальное управление имеет вид (13.40).

450	Глава 13. ОПТИМАЛЬНЫЕ СИСТЕМЫ

Поскольку объект управления линейный, для него можно определить корни характеристического уравнения

det( pI A) 0

(13.41)

в виде совокупности

1,..., n .

Рассмотрим без доказательства формулировку теоремы.

Теорема. Если корни характеристического уравнения (13.41) вещественные, то число переключений управляющего воздействия не превышает (n – 1), где n – порядок объекта.

С л е д с т в и е. Число интервалов постоянства управляющего воздействия не превышает n.

Варианты изменения оптимального управления в линейной системе третьего порядка с вещественными корнями приведены на рис.13.8.

+U	+U	+U
t	t	t
-UU	U-U	U-U
а)	б)	в)
а	б	в

Рис. 13.8. Иллюстрация изменения оптимального управления:

а – нет переключений; б – с одним, в – с двумя переключениями

В случае, когда среди совокупности корней характеристического уравнения (13.41) есть комплексно-сопряженные, число переключений теоретически не ограничено. В реальных системах невысокого порядка число переключений, как правило, невелико.

ПРИМЕР 13.4

Рассмотрим задачу синтеза оптимальной по быстродействию системы для объекта

x1 x2 ,

x2
x2	x1 2dx2 u,	u	U.

<<< < Предыдущая 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 4445 / 4845 46 47 48 > Следующая >>>

Соседние файлы в предмете Основы Теории Управления

#
23.01.20194.79 Mб14klek_OTU_06_Часть1.doc
#
23.01.20194.26 Mб19klek_OTU_06_Часть2.doc
#
23.01.2019770.5 Кб11OTURGR (Repaired)2.pdf
#
23.01.2019557.96 Кб15OTU_RGR_Vasenkova.docx
#
23.01.201912.99 Mб136vostrikov.pdf
#
23.01.2019139.78 Кб12РГР ОТУ 2016.doc