Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Лабораторная работа 2

.pdf
Скачиваний:
63
Добавлен:
26.03.2016
Размер:
597.96 Кб
Скачать

Лабораторная работа № 2. Принцип максимума Понтрягина

Цель работы: изучение свойств оптимальной по быстродействию системы, синтезированной на основе принципа максимума методом

Понтрягина.

2.1. Теоретические сведения

Во многих прикладных задачах на управление накладывается ограничение типа неравенства. Часто оптимальное управление в таких задачах имеет разрыв. Метод множителей Лагранжа не позволяет определить число и местоположения точек разрыва, и поэтому в этих случаях он не эффективен. Такие задачи легче решаются с помощью принципа максимума Понтрягина.

Задача с закрепленными концами и фиксированным временем.

При отсутствии фазового ограничения задачу оптимального управления с закрепленными концами и фиксированным временем в общем виде можно сформулировать как следующую задачу Лагранжа:

 

 

xi fi (x, u, t) , i = 1, 2, …, n;

(2.1а)

 

 

 

 

u U Rr ,

(2.1б)

x (t

0

) x0

,

x (t

f

) x f , i = 1, 2, …, n;

(2.1в)

i

i

 

i

i

 

 

 

t f

 

 

 

 

 

 

 

J f0 (x, u, t)dt min(inf) .

(2.1г)

 

 

t0

 

 

 

 

 

Функции fi (i = 0, 1, …, n) непрерывны по совокупности переменных xi,…,xn, u1,...,ui, t и непрерывно дифференцируемы по xi,…,xn t. Эта задача отличается от задачи оптимального управления классического типа тем, что

1

ограничение задается на управление в виде включения u U , где U

допустимое множество значений управления. Кроме того, здесь не требуется гладкость (непрерывная дифференцируемость) функций fi (i = 0, 1, …, n) по u.

В данной задаче допустимыми управлениями считаются управления u(t), принадлежащие к классу кусочно-непрерывных функций и принимающие значения из допустимого множества U. Фазовая траектория x(t) называется допустимой, если она является кусочно-гладкой. При допустимом управлении фазовая траектория задачи (2.1) является кусочно-

гладкой: координаты xi(t) (t = 1, 2, ..., n) непрерывны всюду на интервале

[t0,tf], их производные могут иметь разрывы 1-го рода в точках разрыва

управления. Пара

~ ~

называется допустимой для задачи (2.1), если

(u (t), x (t))

~

и

~

являются допустимыми управлением и траекторией и

~

при

u (t)

x (t)

x (t)

~ удовлетворяет уравнениям объекта и краевым условиям этой задачи. u u (t)

Рассмотрим функцию

n

 

H i fi ,

(2.2)

i 0

которую также называют функцией Гамильтона или гамильтонианом. Но она отличается от одноименной функции классического вариационного исчисления тем, что в них не входит ограничение на управление, имеющее в данном случае вид включения u U . В конкретных задачах ограничение на управление может быть задано в виде неравенства или равенства.

Гамильтониан (2.2), который не включает ограничение на управление, в

отличие от гамильтониана, включающего ограничение на управление,

называют также функцией Понтрягина.

Уравнения

H , i = 1, 2, …, n (2.3а)

i

xi

 

 

2

называются сопряженной системой.

Принцип максимума при закрепленных концах и фиксированном

времени. Для того чтобы допустимая для задачи (2.1) пара (x*(t), u*(t)) была ее решением, необходимо, чтобы существовали такие не обращающиеся

одновременно

в

нуль

константа

 

* 0

и

решение

* * ,..., * T

 

 

 

 

 

 

 

 

 

 

0

 

 

1

n

сопряженной

системы (2.3а) при

х

=

x*(t)

и u = u*(t),

что при любом

t [t

 

, t

 

], кроме

точек

разрыва

u*(t),

функция

~

 

при

0

f

H (u) H (x* , u, * , t)

 

 

 

 

 

 

 

 

 

 

 

 

 

u=u*(t) достигает максимума, т.е. выполняется соотношение

 

 

 

 

 

 

 

 

max H (x*, u*, *, t) H (x*, u*, *, t)

 

(2.3б)

 

 

 

 

 

 

u U

 

 

 

 

 

 

 

 

Задача с подвижными концами и нефиксированным временем.

Рассмотрим задачу Больца

x

f

(x,u,t) ,

i = 1, 2, …, n; u U Rr

(2.4а)

i

i

 

 

 

g j [x(t0 ), x(t f ), t0 ,t f ] 0 , j = 1, 2, …, q < 2n;

(2.4б)

 

 

 

t f

 

J g0[x(t0 ), x(t f ),t0 ,t f ] f0 (x,u,t)dt min .

(2.4в)

 

 

 

t0

 

Принцип максимума при подвижных концах и нефиксированном времени.

Для того чтобы допустимая для задачи (2.4) пара (x*(t), u*(t) была ее решением, необходимо:

1.существование таких не обращающиеся одновременно в нуль

константы * 0 и решения

*

* ,..., * T

сопряженной системы (2.3а)

 

0

 

1

n

 

при х = x*(t) и u = u*(t), что при любом t [t0 , t f

], кроме точек разрыва u*(t),

функция

~

при

u =

u*(t)

достигает максимума, т.е.

H (u) H (x* , u, * , t)

выполняется соотношение (2.3б);

3

2. выполнение условия трансверсальности

i

(t0 )

G

,

i (t f

)

 

 

 

G

, i 1,2,...,n,

 

 

 

 

 

 

 

 

 

xi

(t0 )

 

xi (t f )

 

 

 

 

 

 

 

 

 

 

H

 

 

G ,

H

 

 

 

 

 

 

 

G .

 

 

 

 

 

 

 

 

 

 

t t0

 

t0

 

 

t t f

t f

 

 

 

 

 

 

 

 

 

Пример 2.1. Определить оптимальное управление в следующей

задаче оптимального управления:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x1 x2 , x2 u ;

 

u

 

a ,

 

 

 

 

 

 

 

x1 (0) x2 (0) 0 , x2 (10) 0 ,

 

J x1 (10) min .

Решение. Запишем функцию Понтрягина и сопряженные уравнения.

 

 

 

 

 

H 1x2

2u ;

 

 

 

 

 

1

H 0

,

2

H

 

1

.

 

 

 

x1

 

 

 

x2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Терминант и условия трансверсальности имеют вид

 

 

 

G

0

g

0

x (10) ,

 

1

(T ) G

1.

 

 

 

 

1

 

 

 

x1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Решив сопряженные уравнения и учитывая условия трансверсальности,

находим

 

 

 

 

 

1 1, 2 C2 t.

В условии max H 1x2

max 2u максимум достигается, когда управление

 

u

a

 

u

a

принимает граничные значения и его знак совпадает со знаком функции 2 .

т.е. при u a sign 2 Так как знак линейной функции может измениться

4

только один раз, то оптимальным может быть управление

a,

0 t t1 ,

a,

0 t t1 ,

u

t1 t 10,

или u

 

t1 t 10,

a,

 

a,

где t1 – момент изменения знака функции 2 . В частности, если t1 = 10, то это значит, что функция 2 на интервале [0,10] не меняет знак и управление не переключается. Выбор из двух управлений можно сделать исходя из того,

какое из этих управлений обеспечивает выполнение граничных условий. Но в данном примере этот выбор можно сделать на основании физических соображений. По условию задачи нужно повернуть вал двигателя на максимальный угол и остановить за заданное время. Поэтому оптимальным может быть только первое из двух приведенных управлений. Остается определить только момент t1 переключения управления.

Проинтегрируем уравнения объекта при первом управлении с учетом начальных условий:

 

x2

 

at,

 

0 t t1 ,

 

 

 

 

at,

t1 t 10.

 

 

 

 

C2

 

 

Используя непрерывность

x2 (t) , т.е. равенство

at1 C2 at1 ,

находим

C2 2at1 . Поэтому последнее соотношение можно записать в виде

 

x2

 

at,

 

 

0 t t1 ,

 

 

 

 

 

t1 t 10.

 

 

 

a(2t1 t),

 

 

Из краевого условия

на

правом

конце

траектории

имеем:

x2 (10) a(2t1 10) 0 . Откуда для момента переключения находим t1 = 5.

Таким образом, оптимальное управление имеет вид

a,

0 t 5,

u*

5 t 10.

a,

 

5

Задача максимального быстродействия. Теорема об n интервалах.

Рассмотрим задачу максимального быстродействия, когда объект является линейным:

 

 

n

r

 

 

 

 

xi aik xk bij u j

, i = 1, 2, …, n;

(2.5а)

 

 

k 1

j 1

 

 

 

j u j

j ,

j 0 , j

0, j = 1, 2, …, r;

(2.5б)

x (t

0

) x0

, x (t

f

) 0, i = 1, 2, …, n;

(2.5в)

i

i

i

 

 

 

 

 

 

J t f

t0 min .

(2.5г)

Эта задача называется линейной задачей максимального быстродействия. В векторной форме уравнения объекта принимают вид

x Ax Bu.

Предполагается, что эти уравнения являются уравнениями в отклонениях, и

поэтому конечное состояние, в которое нужно перевести объект, есть начало координат (х(tf) = 0).

Функция Понтрягина имеет вид

 

 

n

 

n

r

 

 

T

 

 

 

 

 

H

( Ax Bu) i

aik xk bij u j ,

 

 

 

i 1

k 1

j 1

 

где T ( 1 2 ... n ) подчиняется сопряженному уравнению

T H .x

Согласно принципу максимума, оптимальное управление определяется из

условия

6

 

n

n

 

n

n

max H i aik xk max i bij u j ,

u U

i 1

k 1

u U

i 1

j 1

 

 

или

max

n

n

 

 

r

 

n

 

,

 

b u

j

 

max u

b

 

 

 

i ij

 

 

j ij

i

 

u U

i 1

j 1

 

 

j 1

u U

i 1

 

 

где

U {u : j u j j , j 1,2,...,r}.

n

Если выполняется так называемое условие нормальности, то сумма bij i

i 1

обращается в нуль только в изолированных точках. В этом случае из

последнего тождества следует, что координаты u*j ( j 1,2,...,r) оптимального управления u*(t) кусочно-постоянны и принимают крайние значения j , или

j :

 

 

 

,

n

0,

 

 

b

 

 

j

 

ij i

 

 

*

 

 

 

i 1

 

j 1,2,...,r .

 

 

 

 

u j

 

 

n

 

 

 

 

,

bij i

0,

 

j

 

 

 

 

i 1

 

 

В частном случае, когда j

j , имеем

 

 

 

 

 

n

 

 

u*j j sign bij i

j 1,2,...,r .

i 1

Для линейных задач максимального быстродействия при выполнении так называемого условия нормальности принцип максимума является не только необходимым, но и достаточным условием оптимальности. Для определения этого понятия введем в рассмотрение ( n n) - матрицы

7

N[ j] [B j ( AB) j ...(An 1B) j ],

B j ,( AB) j ,...,( An 1B) j j-е столбцы матриц

B, AB,..., An 1B соответственно.

Условие нормальности. Говорят,

что для объекта x Ax Bu и

выполнено условие нормальности или условие общности положения, если матрицы N[j] не вырождены: det N[ j] 0 (j = 1,2,..,r).

Очевидно, в случае скалярного управления условие нормальности совпадает с условием управляемости. Объект, для которой выполнено условие нормальности, называют нормальным объектом или нормальной управляемой системой.

Пример 2.2. Определить, выполнено ли условие нормальности для

объекта

x1 x2 u1, x2 u1 u2 .

Решение. В данном примере имеем

0

1

 

 

1

0

 

 

1

1

A

 

, B

 

 

 

,

AB

.

0

0

 

 

1 1

 

 

0

0

Матрицы N[j] имеют вид

 

 

 

 

 

 

 

 

 

 

N[1]

1

1

,

N[2]

0

1

,

 

 

 

 

 

 

 

1

0

 

 

 

1

0

 

и обе они не вырождены. Следовательно, условие нормальности выполняется.

Необходимое и достаточное условие оптимальности. Если в линейной задаче максимального быстродействия объект является нормальным, то для того чтобы пара (u*(t), х*(t)) была ее решением,

необходимо и достаточно, чтобы она удовлетворяла принципу максимума.

8

В оптимальном по быстродействию управлении линейным объектом функции u*j (t) принимают только граничные значения при любых собственных значениях матрицы А, если объект является нормальным. В

общем случае эти функции имеют произвольное число переключений – точек перехода из одного граничного значения на другое. В частном случае справедлива следующая теорема.

Теорема об n интервалах. Если в линейной задаче максимального быстродействия объект является нормальным и характеристическое уравнение

det(A Is) 0

имеет только действительные корни, то компоненты оптимального управления u*j (t) (j = 1,2, ..., r) кусочно-постоянны, принимают только граничные значения и имеют не более n интервалов постоянства, или не более n – 1 переключений.

2.2. Порядок выполнения работы

2.2.1Определить оптимальное программное управление и оптимальные траектории в задачах максимального быстродействия в соответствии с вариантом. В ходе решения задачи определить:

выполнение условия нормальности для объекта управления,

количество интервалов постоянства.

2.2.2Собрать схему оптимальной системы программного

управления.

2.2.3Построить графики переходных процессов по переменным состояния и управляющему воздействию и фазовый портрет системы.

2.2.4По графику x1(t) определить время переходного процесса.

9

2.3. Содержание отчета

2.3.1Цель работы.

2.3.2Исходные данные для выполнения работы, модель системы,

структурная схема.

2.3.3Расчет оптимального программного управления и оптимальных программных траекторий движения системы.

2.3.4Фазовый портрет и временные характеристики.

2.3.5Выводы по работе.

10