Лабораторная работа 2
.pdfЛабораторная работа № 2. Принцип максимума Понтрягина
Цель работы: изучение свойств оптимальной по быстродействию системы, синтезированной на основе принципа максимума методом
Понтрягина.
2.1. Теоретические сведения
Во многих прикладных задачах на управление накладывается ограничение типа неравенства. Часто оптимальное управление в таких задачах имеет разрыв. Метод множителей Лагранжа не позволяет определить число и местоположения точек разрыва, и поэтому в этих случаях он не эффективен. Такие задачи легче решаются с помощью принципа максимума Понтрягина.
Задача с закрепленными концами и фиксированным временем.
При отсутствии фазового ограничения задачу оптимального управления с закрепленными концами и фиксированным временем в общем виде можно сформулировать как следующую задачу Лагранжа:
|
|
xi fi (x, u, t) , i = 1, 2, …, n; |
(2.1а) |
||||
|
|
|
|
u U Rr , |
(2.1б) |
||
x (t |
0 |
) x0 |
, |
x (t |
f |
) x f , i = 1, 2, …, n; |
(2.1в) |
i |
i |
|
i |
i |
|
||
|
|
t f |
|
|
|
|
|
|
|
J f0 (x, u, t)dt min(inf) . |
(2.1г) |
||||
|
|
t0 |
|
|
|
|
|
Функции fi (i = 0, 1, …, n) непрерывны по совокупности переменных xi,…,xn, u1,...,ui, t и непрерывно дифференцируемы по xi,…,xn t. Эта задача отличается от задачи оптимального управления классического типа тем, что
1
ограничение задается на управление в виде включения u U , где U –
допустимое множество значений управления. Кроме того, здесь не требуется гладкость (непрерывная дифференцируемость) функций fi (i = 0, 1, …, n) по u.
В данной задаче допустимыми управлениями считаются управления u(t), принадлежащие к классу кусочно-непрерывных функций и принимающие значения из допустимого множества U. Фазовая траектория x(t) называется допустимой, если она является кусочно-гладкой. При допустимом управлении фазовая траектория задачи (2.1) является кусочно-
гладкой: координаты xi(t) (t = 1, 2, ..., n) непрерывны всюду на интервале
[t0,tf], их производные могут иметь разрывы 1-го рода в точках разрыва
управления. Пара |
~ ~ |
называется допустимой для задачи (2.1), если |
|||||
(u (t), x (t)) |
|||||||
~ |
и |
~ |
являются допустимыми управлением и траекторией и |
~ |
при |
||
u (t) |
x (t) |
x (t) |
~ удовлетворяет уравнениям объекта и краевым условиям этой задачи. u u (t)
Рассмотрим функцию
n |
|
H i fi , |
(2.2) |
i 0
которую также называют функцией Гамильтона или гамильтонианом. Но она отличается от одноименной функции классического вариационного исчисления тем, что в них не входит ограничение на управление, имеющее в данном случае вид включения u U . В конкретных задачах ограничение на управление может быть задано в виде неравенства или равенства.
Гамильтониан (2.2), который не включает ограничение на управление, в
отличие от гамильтониана, включающего ограничение на управление,
называют также функцией Понтрягина.
Уравнения
H , i = 1, 2, …, n (2.3а)
i |
xi |
|
|
|
2 |
называются сопряженной системой.
Принцип максимума при закрепленных концах и фиксированном
времени. Для того чтобы допустимая для задачи (2.1) пара (x*(t), u*(t)) была ее решением, необходимо, чтобы существовали такие не обращающиеся
одновременно |
в |
нуль |
константа |
|
* 0 |
и |
решение |
* * ,..., * T |
||||||
|
|
|
|
|
|
|
|
|
|
0 |
|
|
1 |
n |
сопряженной |
системы (2.3а) при |
х |
= |
x*(t) |
и u = u*(t), |
что при любом |
||||||||
t [t |
|
, t |
|
], кроме |
точек |
разрыва |
u*(t), |
функция |
~ |
|
при |
|||
0 |
f |
H (u) H (x* , u, * , t) |
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||
u=u*(t) достигает максимума, т.е. выполняется соотношение |
|
|
||||||||||||
|
|
|
|
|
|
max H (x*, u*, *, t) H (x*, u*, *, t) |
|
(2.3б) |
||||||
|
|
|
|
|
|
u U |
|
|
|
|
|
|
|
|
Задача с подвижными концами и нефиксированным временем.
Рассмотрим задачу Больца
x |
f |
(x,u,t) , |
i = 1, 2, …, n; u U Rr |
(2.4а) |
i |
i |
|
|
|
g j [x(t0 ), x(t f ), t0 ,t f ] 0 , j = 1, 2, …, q < 2n; |
(2.4б) |
|||
|
|
|
t f |
|
J g0[x(t0 ), x(t f ),t0 ,t f ] f0 (x,u,t)dt min . |
(2.4в) |
|||
|
|
|
t0 |
|
Принцип максимума при подвижных концах и нефиксированном времени.
Для того чтобы допустимая для задачи (2.4) пара (x*(t), u*(t) была ее решением, необходимо:
1.существование таких не обращающиеся одновременно в нуль
константы * 0 и решения |
* |
* ,..., * T |
сопряженной системы (2.3а) |
||
|
0 |
|
1 |
n |
|
при х = x*(t) и u = u*(t), что при любом t [t0 , t f |
], кроме точек разрыва u*(t), |
||||
функция |
~ |
при |
u = |
u*(t) |
достигает максимума, т.е. |
H (u) H (x* , u, * , t) |
выполняется соотношение (2.3б);
3
2. выполнение условия трансверсальности
i |
(t0 ) |
G |
, |
i (t f |
) |
|
|
|
G |
, i 1,2,...,n, |
|||||
|
|
|
|
|
|
|
|
|
|||||||
xi |
(t0 ) |
|
xi (t f ) |
||||||||||||
|
|
|
|
|
|
|
|
||||||||
|
|
H |
|
|
G , |
H |
|
|
|
|
|
|
|
G . |
|
|
|
|
|
|
|
||||||||||
|
|
|
|
t t0 |
|
t0 |
|
|
t t f |
t f |
|||||
|
|
|
|
|
|
|
|
|
|||||||
Пример 2.1. Определить оптимальное управление в следующей |
|||||||||||||||
задаче оптимального управления: |
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
x1 x2 , x2 u ; |
|
u |
|
a , |
|||||||
|
|
|
|
|
|
||||||||||
|
x1 (0) x2 (0) 0 , x2 (10) 0 , |
|
J x1 (10) min . |
Решение. Запишем функцию Понтрягина и сопряженные уравнения.
|
|
|
|
|
H 1x2 |
2u ; |
|
|
|
||||
|
|
1 |
H 0 |
, |
2 |
H |
|
1 |
. |
||||
|
|
|
x1 |
|
|
|
x2 |
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
||
Терминант и условия трансверсальности имеют вид |
|
|
|
||||||||||
G |
0 |
g |
0 |
x (10) , |
|
1 |
(T ) G |
1. |
|
||||
|
|
|
1 |
|
|
|
x1 |
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
Решив сопряженные уравнения и учитывая условия трансверсальности,
находим
|
|
|
|
|
1 1, 2 C2 t. |
В условии max H 1x2 |
max 2u максимум достигается, когда управление |
||||
|
u |
a |
|
u |
a |
принимает граничные значения и его знак совпадает со знаком функции 2 .
т.е. при u a sign 2 Так как знак линейной функции может измениться
4
только один раз, то оптимальным может быть управление
a, |
0 t t1 , |
a, |
0 t t1 , |
|
u |
t1 t 10, |
или u |
|
t1 t 10, |
a, |
|
a, |
где t1 – момент изменения знака функции 2 . В частности, если t1 = 10, то это значит, что функция 2 на интервале [0,10] не меняет знак и управление не переключается. Выбор из двух управлений можно сделать исходя из того,
какое из этих управлений обеспечивает выполнение граничных условий. Но в данном примере этот выбор можно сделать на основании физических соображений. По условию задачи нужно повернуть вал двигателя на максимальный угол и остановить за заданное время. Поэтому оптимальным может быть только первое из двух приведенных управлений. Остается определить только момент t1 переключения управления.
Проинтегрируем уравнения объекта при первом управлении с учетом начальных условий:
|
x2 |
|
at, |
|
0 t t1 , |
|
|
|
|
at, |
t1 t 10. |
|
|
||
|
|
C2 |
|
|
|||
Используя непрерывность |
x2 (t) , т.е. равенство |
at1 C2 at1 , |
находим |
||||
C2 2at1 . Поэтому последнее соотношение можно записать в виде |
|
||||||
x2 |
|
at, |
|
|
0 t t1 , |
|
|
|
|
|
t1 t 10. |
|
|
||
|
a(2t1 t), |
|
|
||||
Из краевого условия |
на |
правом |
конце |
траектории |
имеем: |
x2 (10) a(2t1 10) 0 . Откуда для момента переключения находим t1 = 5.
Таким образом, оптимальное управление имеет вид
a, |
0 t 5, |
u* |
5 t 10. |
a, |
|
|
5 |
Задача максимального быстродействия. Теорема об n интервалах.
Рассмотрим задачу максимального быстродействия, когда объект является линейным:
|
|
n |
r |
|
|
|
|
xi aik xk bij u j |
, i = 1, 2, …, n; |
(2.5а) |
|||||
|
|
k 1 |
j 1 |
|
|
|
|
j u j |
j , |
j 0 , j |
0, j = 1, 2, …, r; |
(2.5б) |
|||
x (t |
0 |
) x0 |
, x (t |
f |
) 0, i = 1, 2, …, n; |
(2.5в) |
|
i |
i |
i |
|
|
|
||
|
|
|
J t f |
t0 min . |
(2.5г) |
Эта задача называется линейной задачей максимального быстродействия. В векторной форме уравнения объекта принимают вид
x Ax Bu.
Предполагается, что эти уравнения являются уравнениями в отклонениях, и
поэтому конечное состояние, в которое нужно перевести объект, есть начало координат (х(tf) = 0).
Функция Понтрягина имеет вид
|
|
n |
|
n |
r |
|
|
|
T |
|
|
|
|
|
|
H |
( Ax Bu) i |
aik xk bij u j , |
|||||
|
|||||||
|
|
i 1 |
k 1 |
j 1 |
|
где T ( 1 2 ... n ) подчиняется сопряженному уравнению
T H .x
Согласно принципу максимума, оптимальное управление определяется из
условия
6
|
n |
n |
|
n |
n |
max H i aik xk max i bij u j , |
|||||
u U |
i 1 |
k 1 |
u U |
i 1 |
j 1 |
|
|
или
max |
n |
n |
|
|
r |
|
n |
|
, |
|
b u |
j |
|
max u |
b |
|
|||
|
|
i ij |
|
|
j ij |
i |
|
||
u U |
i 1 |
j 1 |
|
|
j 1 |
u U |
i 1 |
|
|
где
U {u : j u j j , j 1,2,...,r}.
n
Если выполняется так называемое условие нормальности, то сумма bij i
i 1
обращается в нуль только в изолированных точках. В этом случае из
последнего тождества следует, что координаты u*j ( j 1,2,...,r) оптимального управления u*(t) кусочно-постоянны и принимают крайние значения j , или
j :
|
|
|
, |
n |
0, |
|
|
|
b |
||||
|
|
j |
|
ij i |
|
|
* |
|
|
|
i 1 |
|
j 1,2,...,r . |
|
|
|
|
|||
u j |
|
|
n |
|
||
|
|
|
, |
bij i |
0, |
|
|
j |
|||||
|
|
|
|
i 1 |
|
|
В частном случае, когда j |
j , имеем |
|
||||
|
|
|
|
n |
|
|
u*j j sign bij i |
j 1,2,...,r . |
i 1
Для линейных задач максимального быстродействия при выполнении так называемого условия нормальности принцип максимума является не только необходимым, но и достаточным условием оптимальности. Для определения этого понятия введем в рассмотрение ( n n) - матрицы
7
N[ j] [B j ( AB) j ...(An 1B) j ],
B j ,( AB) j ,...,( An 1B) j – j-е столбцы матриц |
B, AB,..., An 1B соответственно. |
Условие нормальности. Говорят, |
что для объекта x Ax Bu и |
выполнено условие нормальности или условие общности положения, если матрицы N[j] не вырождены: det N[ j] 0 (j = 1,2,..,r).
Очевидно, в случае скалярного управления условие нормальности совпадает с условием управляемости. Объект, для которой выполнено условие нормальности, называют нормальным объектом или нормальной управляемой системой.
Пример 2.2. Определить, выполнено ли условие нормальности для
объекта
x1 x2 u1, x2 u1 u2 .
Решение. В данном примере имеем
0 |
1 |
|
|
1 |
0 |
|
|
1 |
1 |
|
A |
|
, B |
|
|
|
, |
AB |
. |
||
0 |
0 |
|
|
1 1 |
|
|
0 |
0 |
||
Матрицы N[j] имеют вид |
|
|
|
|
|
|
|
|
|
|
N[1] |
1 |
1 |
, |
N[2] |
0 |
1 |
, |
|||
|
|
|
|
|
||||||
|
|
1 |
0 |
|
|
|
1 |
0 |
|
и обе они не вырождены. Следовательно, условие нормальности выполняется.
Необходимое и достаточное условие оптимальности. Если в линейной задаче максимального быстродействия объект является нормальным, то для того чтобы пара (u*(t), х*(t)) была ее решением,
необходимо и достаточно, чтобы она удовлетворяла принципу максимума.
8
В оптимальном по быстродействию управлении линейным объектом функции u*j (t) принимают только граничные значения при любых собственных значениях матрицы А, если объект является нормальным. В
общем случае эти функции имеют произвольное число переключений – точек перехода из одного граничного значения на другое. В частном случае справедлива следующая теорема.
Теорема об n интервалах. Если в линейной задаче максимального быстродействия объект является нормальным и характеристическое уравнение
det(A Is) 0
имеет только действительные корни, то компоненты оптимального управления u*j (t) (j = 1,2, ..., r) кусочно-постоянны, принимают только граничные значения и имеют не более n интервалов постоянства, или не более n – 1 переключений.
2.2. Порядок выполнения работы
2.2.1Определить оптимальное программное управление и оптимальные траектории в задачах максимального быстродействия в соответствии с вариантом. В ходе решения задачи определить:
выполнение условия нормальности для объекта управления,
количество интервалов постоянства.
2.2.2Собрать схему оптимальной системы программного
управления.
2.2.3Построить графики переходных процессов по переменным состояния и управляющему воздействию и фазовый портрет системы.
2.2.4По графику x1(t) определить время переходного процесса.
9
2.3. Содержание отчета
2.3.1Цель работы.
2.3.2Исходные данные для выполнения работы, модель системы,
структурная схема.
2.3.3Расчет оптимального программного управления и оптимальных программных траекторий движения системы.
2.3.4Фазовый портрет и временные характеристики.
2.3.5Выводы по работе.
10