Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Инженерно-технологическая академия ЮФУ

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Лабораторная работа 2

.pdf

Скачиваний:

Добавлен:

26.03.2016

Размер:

597.96 Кб

Скачать

☆

1 / 21 2 > Следующая >>>

Лабораторная работа № 2. Принцип максимума Понтрягина

Цель работы: изучение свойств оптимальной по быстродействию системы, синтезированной на основе принципа максимума методом

Понтрягина.

2.1. Теоретические сведения

Во многих прикладных задачах на управление накладывается ограничение типа неравенства. Часто оптимальное управление в таких задачах имеет разрыв. Метод множителей Лагранжа не позволяет определить число и местоположения точек разрыва, и поэтому в этих случаях он не эффективен. Такие задачи легче решаются с помощью принципа максимума Понтрягина.

Задача с закрепленными концами и фиксированным временем.

При отсутствии фазового ограничения задачу оптимального управления с закрепленными концами и фиксированным временем в общем виде можно сформулировать как следующую задачу Лагранжа:

		xi fi (x, u, t) , i = 1, 2, …, n;					(2.1а)
				u U Rr ,			(2.1б)
x (t	0	) x0	,	x (t	f	) x f , i = 1, 2, …, n;	(2.1в)
i	0	i		i	f	i
		t f
		J f0 (x, u, t)dt min(inf) .					(2.1г)
		t0

Функции fi (i = 0, 1, …, n) непрерывны по совокупности переменных xi,…,xn, u1,...,ui, t и непрерывно дифференцируемы по xi,…,xn t. Эта задача отличается от задачи оптимального управления классического типа тем, что

ограничение задается на управление в виде включения u U , где U –

допустимое множество значений управления. Кроме того, здесь не требуется гладкость (непрерывная дифференцируемость) функций fi (i = 0, 1, …, n) по u.

В данной задаче допустимыми управлениями считаются управления u(t), принадлежащие к классу кусочно-непрерывных функций и принимающие значения из допустимого множества U. Фазовая траектория x(t) называется допустимой, если она является кусочно-гладкой. При допустимом управлении фазовая траектория задачи (2.1) является кусочно-

гладкой: координаты xi(t) (t = 1, 2, ..., n) непрерывны всюду на интервале

[t0,tf], их производные могут иметь разрывы 1-го рода в точках разрыва


управления. Пара				~ ~	называется допустимой для задачи (2.1), если
управления. Пара				(u (t), x (t))	называется допустимой для задачи (2.1), если
~	и	~	являются допустимыми управлением и траекторией и			~	при
u (t)	и	x (t)	являются допустимыми управлением и траекторией и			x (t)	при

~ удовлетворяет уравнениям объекта и краевым условиям этой задачи. u u (t)

Рассмотрим функцию

n
H i fi ,	(2.2)

i 0

которую также называют функцией Гамильтона или гамильтонианом. Но она отличается от одноименной функции классического вариационного исчисления тем, что в них не входит ограничение на управление, имеющее в данном случае вид включения u U . В конкретных задачах ограничение на управление может быть задано в виде неравенства или равенства.

Гамильтониан (2.2), который не включает ограничение на управление, в

отличие от гамильтониана, включающего ограничение на управление,

называют также функцией Понтрягина.

Уравнения

H , i = 1, 2, …, n (2.3а)

i	xi
	xi
	2

называются сопряженной системой.

Принцип максимума при закрепленных концах и фиксированном

времени. Для того чтобы допустимая для задачи (2.1) пара (x*(t), u*(t)) была ее решением, необходимо, чтобы существовали такие не обращающиеся

одновременно

нуль

константа

* 0

решение

* * ,..., * T

сопряженной

системы (2.3а) при

x*(t)

и u = u*(t),

что при любом

t [t

, t

], кроме

точек

разрыва

u*(t),

функция

при

H (u) H (x* , u, * , t)

u=u*(t) достигает максимума, т.е. выполняется соотношение

max H (x*, u*, *, t) H (x*, u*, *, t)

(2.3б)

u U

Задача с подвижными концами и нефиксированным временем.

Рассмотрим задачу Больца

x	f	(x,u,t) ,	i = 1, 2, …, n; u U Rr	(2.4а)
i	i
g j [x(t0 ), x(t f ), t0 ,t f ] 0 , j = 1, 2, …, q < 2n;				(2.4б)
			t f
J g0[x(t0 ), x(t f ),t0 ,t f ] f0 (x,u,t)dt min .				(2.4в)
			t0

Принцип максимума при подвижных концах и нефиксированном времени.

Для того чтобы допустимая для задачи (2.4) пара (x*(t), u*(t) была ее решением, необходимо:

1.существование таких не обращающиеся одновременно в нуль

константы * 0 и решения		*	* ,..., * T		сопряженной системы (2.3а)
	0		1	n
при х = x(t) и u = u(t), что при любом t [t0 , t f					], кроме точек разрыва u*(t),
функция	~	при	u =	u*(t)	достигает максимума, т.е.
	H (u) H (x* , u, * , t)

выполняется соотношение (2.3б);

2. выполнение условия трансверсальности

(t0 )

i (t f

)

, i 1,2,...,n,

(t0 )

xi (t f )

G ,

G .

t t0

t t f

t f

Пример 2.1. Определить оптимальное управление в следующей

задаче оптимального управления:

x1 x2 , x2 u ;

a ,

x1 (0) x2 (0) 0 , x2 (10) 0 ,

J x1 (10) min .

Решение. Запишем функцию Понтрягина и сопряженные уравнения.

					H 1x2				2u ;
			1		H 0	,			2	H		1	.
			1		x1				2	x2		1
					x1					x2
Терминант и условия трансверсальности имеют вид
G	0	g		0	x (10) ,		1	(T ) G			1.
	0			0	1		1			x1
										x1

Решив сопряженные уравнения и учитывая условия трансверсальности,

находим

					1 1, 2 C2 t.
В условии max H 1x2			max 2u максимум достигается, когда управление
	u	a		u	a

принимает граничные значения и его знак совпадает со знаком функции 2 .

т.е. при u a sign 2 Так как знак линейной функции может измениться

только один раз, то оптимальным может быть управление

a,	0 t t1 ,	a,		0 t t1 ,
u	t1 t 10,	или u		t1 t 10,
a,	t1 t 10,		a,	t1 t 10,

где t1 – момент изменения знака функции 2 . В частности, если t1 = 10, то это значит, что функция 2 на интервале [0,10] не меняет знак и управление не переключается. Выбор из двух управлений можно сделать исходя из того,

какое из этих управлений обеспечивает выполнение граничных условий. Но в данном примере этот выбор можно сделать на основании физических соображений. По условию задачи нужно повернуть вал двигателя на максимальный угол и остановить за заданное время. Поэтому оптимальным может быть только первое из двух приведенных управлений. Остается определить только момент t1 переключения управления.

Проинтегрируем уравнения объекта при первом управлении с учетом начальных условий:

	x2		at,		0 t t1 ,
	x2		at,		t1 t 10.
		C2	at,		t1 t 10.
Используя непрерывность	x2 (t) , т.е. равенство					at1 C2 at1 ,	находим
C2 2at1 . Поэтому последнее соотношение можно записать в виде
x2		at,			0 t t1 ,
x2				t1 t 10.
	a(2t1 t),			t1 t 10.
Из краевого условия	на	правом			конце	траектории	имеем:

x2 (10) a(2t1 10) 0 . Откуда для момента переключения находим t1 = 5.

Таким образом, оптимальное управление имеет вид

a,	0 t 5,
u*	5 t 10.
a,	5 t 10.
	5

Задача максимального быстродействия. Теорема об n интервалах.

Рассмотрим задачу максимального быстродействия, когда объект является линейным:

		n	r
xi aik xk bij u j						, i = 1, 2, …, n;	(2.5а)
		k 1	j 1
j u j		j ,	j 0 , j			0, j = 1, 2, …, r;	(2.5б)
x (t	0	) x0	, x (t	f	) 0, i = 1, 2, …, n;		(2.5в)
i	0	i	i	f
			J t f	t0 min .			(2.5г)

Эта задача называется линейной задачей максимального быстродействия. В векторной форме уравнения объекта принимают вид

x Ax Bu.

Предполагается, что эти уравнения являются уравнениями в отклонениях, и

поэтому конечное состояние, в которое нужно перевести объект, есть начало координат (х(tf) = 0).

Функция Понтрягина имеет вид

		n		n	r
	T
H	T	( Ax Bu) i		aik xk bij u j ,
H		( Ax Bu) i		aik xk bij u j ,
		i 1	k 1		j 1

где T ( 1 2 ... n ) подчиняется сопряженному уравнению

T H .x

Согласно принципу максимума, оптимальное управление определяется из

условия

	n	n		n	n
max H i aik xk max i bij u j ,
u U	i 1	k 1	u U	i 1	j 1

или

max	n	n		r		n		,
max		b u	j		max u	b		,
		i ij	j			j ij	i
u U	i 1	j 1		j 1	u U	i 1

где

U {u : j u j j , j 1,2,...,r}.

Если выполняется так называемое условие нормальности, то сумма bij i

i 1

обращается в нуль только в изолированных точках. В этом случае из

последнего тождества следует, что координаты u*j ( j 1,2,...,r) оптимального управления u*(t) кусочно-постоянны и принимают крайние значения j , или

j :

			,	n	0,
			,	b	0,
		j		ij i
*				i 1		j 1,2,...,r .
*				i 1
u j				n
			,	bij i	0,
	j		,	bij i	0,
				i 1
В частном случае, когда j		j , имеем
				n
u*j j sign bij i						j 1,2,...,r .

i 1

Для линейных задач максимального быстродействия при выполнении так называемого условия нормальности принцип максимума является не только необходимым, но и достаточным условием оптимальности. Для определения этого понятия введем в рассмотрение ( n n) - матрицы

N[ j] [B j ( AB) j ...(An 1B) j ],

B j ,( AB) j ,...,( An 1B) j – j-е столбцы матриц	B, AB,..., An 1B соответственно.
Условие нормальности. Говорят,	что для объекта x Ax Bu и

выполнено условие нормальности или условие общности положения, если матрицы N[j] не вырождены: det N[ j] 0 (j = 1,2,..,r).

Очевидно, в случае скалярного управления условие нормальности совпадает с условием управляемости. Объект, для которой выполнено условие нормальности, называют нормальным объектом или нормальной управляемой системой.

Пример 2.2. Определить, выполнено ли условие нормальности для

объекта

x1 x2 u1, x2 u1 u2 .

Решение. В данном примере имеем

0	1			1		0			1	1
A		, B					,	AB		.
0	0			1 1					0	0
Матрицы N[j] имеют вид
N[1]		1	1		,	N[2]		0	1	,
N[1]					,	N[2]				,
		1	0					1	0

и обе они не вырождены. Следовательно, условие нормальности выполняется.

Необходимое и достаточное условие оптимальности. Если в линейной задаче максимального быстродействия объект является нормальным, то для того чтобы пара (u*(t), х*(t)) была ее решением,

необходимо и достаточно, чтобы она удовлетворяла принципу максимума.

В оптимальном по быстродействию управлении линейным объектом функции u*j (t) принимают только граничные значения при любых собственных значениях матрицы А, если объект является нормальным. В

общем случае эти функции имеют произвольное число переключений – точек перехода из одного граничного значения на другое. В частном случае справедлива следующая теорема.

Теорема об n интервалах. Если в линейной задаче максимального быстродействия объект является нормальным и характеристическое уравнение

det(A Is) 0

имеет только действительные корни, то компоненты оптимального управления u*j (t) (j = 1,2, ..., r) кусочно-постоянны, принимают только граничные значения и имеют не более n интервалов постоянства, или не более n – 1 переключений.

2.2. Порядок выполнения работы

2.2.1Определить оптимальное программное управление и оптимальные траектории в задачах максимального быстродействия в соответствии с вариантом. В ходе решения задачи определить:

выполнение условия нормальности для объекта управления,

количество интервалов постоянства.

2.2.2Собрать схему оптимальной системы программного

управления.

2.2.3Построить графики переходных процессов по переменным состояния и управляющему воздействию и фазовый портрет системы.

2.2.4По графику x1(t) определить время переходного процесса.

2.3. Содержание отчета

2.3.1Цель работы.

2.3.2Исходные данные для выполнения работы, модель системы,

структурная схема.

2.3.3Расчет оптимального программного управления и оптимальных программных траекторий движения системы.

2.3.4Фазовый портрет и временные характеристики.

2.3.5Выводы по работе.

1 / 21 2 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
07.08.2019658.43 Кб6Лабораторная МПТ 7.doc
#
10.11.201994.21 Кб3Лабораторная работа 1 Windows XP.doc
#
01.06.201522.67 Кб66Лабораторная работа 1.docx
#
26.03.2016182.28 Кб29Лабораторная работа 1.pdf
#
01.06.201520.59 Кб26Лабораторная работа 2.docx
#
26.03.2016597.96 Кб63Лабораторная работа 2.pdf
#
01.06.201519.64 Кб47Лабораторная работа 3.docx
#
26.03.2016148.06 Кб26Лабораторная работа 3.pdf
#
26.03.2016117.14 Кб20Лабораторная работа 4.pdf
#
26.03.2016138.67 Кб37Лабораторная работа 5.pdf
#
26.03.2016130.12 Кб37Лабораторная работа 6.pdf