Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Дегтярёв Оптимальное управление

.pdf
Скачиваний:
63
Добавлен:
22.03.2016
Размер:
1.68 Mб
Скачать

31

3. Найти кратчайшее расстояние между двумя кривыми:

 

1

 

 

1

 

 

 

 

= ∫

2 → ,

12 = 0,

(0) = 0, (

) − + 2 = 0;

 

 

 

 

 

 

 

1

1

0

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

= ∫ 2

→ ,

2 = 1

, (0) = 0,

( ) = 0;

 

0

 

 

 

0

 

 

 

 

) = 2

и

 

= − 5,

 

 

 

 

) = 2 + 2

и

= .

 

 

 

3. Принцип максимума Понтрягина.

3.1. Вводные замечания.

Рассмотрим исходную постановку задачи оптимального управления,

заключающуюся в поиске такой управляющей функции u(t) и

соответствующей траектории y(t) , удовлетворяющей системе (1.1), (1.2), на которых некоторый функционал J y(t),u(t) достигает минимального значения.

Функции fi (t, y(t),u(t)) в системе (1.1) предполагаются непрерывными по t и дважды непрерывно дифференцируемыми по остальным аргументам.

Оптимальное управление отыскивается в классе кусочно-непрерывных функций с конечным числом точек разрыва, со значением из некоторой замкнутой или открытой выпуклой области Ur – мерного пространства. При

этом фазовые координаты yi (t) в точках разрыва управления остаются непрерывными. В качестве критерия оптимальности рассматривается функционал Майера

n

 

J ci yi (t1 ) ,

(3.1)

i 1

где t1 – заданное конечное время управления. В рассматриваемом случае начальное состояние y0 считается заданным, а y1 - свободным, т.е.

рассматривается задача со свободным правым концом.

32

Если в вариационном исчислении минимум отыскивается среди близких

кривых сравнения ( y - малые по мере

0 или

1 ), то в принципе максимума

вариации управления u могут быть конечными, но из заданной области.

Вводится понятие игольчатой вариации

u

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

u const,

если

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t t

t,t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

u(t)

,

если

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

t t

t,t

u

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

u(t) здесь не малые, но влияние u(t) на

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

управляемое

движение

малое,

т.е.

y(t) ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

обусловленное воздействием

 

мало в силу

 

 

 

 

t0

 

 

 

t t

 

t t1

u

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

малости времени его воздействия t . Малым

 

 

 

 

 

 

 

 

 

Рис. 10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

будет и приращение

I

функционала.

Использование игольчатых вариаций

позволяет получить более сильные условия - необходимые условия абсолютного минимума (максимума).

3.2. Формулировка принципа максимума.

Вводится функция

 

n

 

 

 

H i

fi (t, y,u) ,

(3.2)

 

i 1

 

 

где fi (t, y,u) - правые части

уравнений движения (1.1), i -

множители

Лагранжа, удовлетворяющие уравнениям

 

 

d i

 

 

H

(3.3)

 

d t

yi

 

 

 

с граничными условиями

 

 

 

 

i (t1) ci

(3.4)

Исходная система (1.1), (1.2) может быть представлена в виде

 

 

d yi

 

H ,

(3.5)

 

 

 

 

 

d t

 

 

 

 

 

 

 

i

 

 

yi (t0 ) yi0 ,

(3.6)

yi0 - заданные величины.

33

В соответствие с (3.1) – (3.5) функция H (t, y, ,u) при фиксированных y(t), (t) является функцией управления (H H(u)) и ее можно исследовать на

минимум или максимум.

Будем говорить, что u0 (t) удовлетворяет условию максимума функции

H если при фиксированных (t), y(t) для любого времени t

выполняется

условие

 

 

 

H (t, y(t), (t),u0

(t)) max H (t, y(t), (t),u)

u U

(3.7)

 

u U

 

 

Тогда справедливо следующее утверждение.

Если управление u0 (t) доставляет минимум (максимум) функционалу

(3.1), то оно удовлетворяет условию максимума (минимума) (3.7), где y(t), (t)

определяются из системы уравнений (3.3), (3.4), (3.5), (3.6) при управлении u0 (t) , найденном из условия максимума (3.7).

Из формулировки принципа максимума следует, что принцип максимума является необходимым условием абсолютного минимума. Принцип максимума сформулирован академиком Понтрягиным Л.С.

Принцип максимума позволяет получить замкнутую систему уравнений

(3.2) – (3.7) для определения оптимального управления и соответствующего ему решения.

Следует отметить, что в соответствие с принципом максимума задача минимизации функционала сводится к задаче максимизации функции и решению краевой задачи.

Замечание 1. В том случае, когда время t1 не фиксировано, полученная система соотношений принципа максимума должна быть дополнена условием трансверсальности, которое имеет вид

H t t1 0 ,

которое используется для определения оптимального времени процесса t1 .

Замечание 2. В общем случае принцип максимума дает необходимые условия абсолютного минимума (максимума), можно доказать, что в случае

34

линейных систем с линейным или квадратичным функционалом принцип максимума дает и достаточные условия оптимальности.

Замечание 3. В том случае, когда конечные значения y(t1) заданы

(правый конец несвободен) допустимыми являются не все возможные функции u(t) , а только те из них, которые приводят траекторию в заданное состояние.

Поэтому из доказательства принципа максимума со свободным правым концом не следует его справедливость для систем с фиксированными концами. Тем не менее оказывается, что условия принципа максимума выполняются и в этом случае, за исключением граничных условий для множителей Лагранжа.

Пример 1. Пусть уравнение движения имеет вид

 

d y

a y2

a

 

yu a u2

,

y(t

 

) y

 

 

 

 

2

0

0

 

d t

1

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и минимизируется

 

 

 

 

 

 

 

 

 

 

 

 

 

 

J y(t1), где t1 - некоторое заданное время. В данном случае

 

 

H (a y2 a

2

yu a

 

u 2 )

,

 

 

 

 

 

 

 

 

1

 

 

 

 

3

 

 

 

 

 

 

 

d

(2a1 y

a2u),

 

(t1) 1

 

 

 

 

 

 

 

 

 

d t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Из условия стационарности

 

 

 

 

 

 

 

 

 

 

 

H (a

2

y 2a u) 0

,

 

 

 

 

 

 

 

u

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

следует

u0 a2 y . 2a3

(3.8)

(3.9)

(3.10)

Таким образом, решение сводится к краевой задаче (3.8), (3.9), (3.10) для определения u0 (t) , и соответствующих (t), y(t). Окончательное суждение об оптимальности найденного управления можно сделать по знаку второй

производной 2 H . В нашем случае

u 2

2 H 2 a1 .u 2

35

Если 2a1 0, найденное управление доставляет минимум J .

Пример 2. Пусть уравнение движения имеет вид

 

dy1

ay bu,

 

 

 

y(0) y

0

- задано

 

 

 

 

 

 

ut

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t1

 

 

 

 

 

 

 

 

 

 

J ( y2 u2 ) dt,

0, 0 .

 

0

 

 

 

 

 

 

 

 

 

Вводя новую переменную

 

 

 

 

 

 

 

 

t1

2

 

 

2

 

 

 

 

 

 

y2 ( y

u

 

y2 (0) 0

 

 

 

 

) dt ,

 

0

 

 

 

 

 

 

 

 

 

 

 

 

dy2

y2

u 2

 

 

 

 

 

 

 

 

 

 

 

dt

 

 

 

 

 

 

перейдем от задачи Лагранжа к задаче Майера

J y2 (t1) .

В этом случае

H 1 (ay bu) 2 ( y2 u2 ),

где 1 и 2 удовлетворяют системе управлений с граничными условиями

d 1

 

H 2 y,

(t ) 0 ;

 

dt

y1

1

2

1

1

 

 

 

 

 

 

 

d 2

 

H

0,

(t ) 1.

 

 

 

 

 

 

 

 

dt

y2

2

1

 

 

 

 

 

 

Оптимальное управление находится из условия максимума функции H

по u . Из условия

H

0,

находим

 

u0

 

b 1

 

u

 

2 2

 

 

 

 

 

 

 

 

Так как 1 const , то u

0

 

b 1

, а

- находится из краевой задачи.

 

2

 

 

 

2

1

 

 

 

 

 

 

 

 

 

 

 

 

 

При этом

36

 

2 H

2

 

0 ,

значит найденное управление

доставляет максимум

 

u2

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

функции H и дает решение поставленной задачи.

 

 

Пример 3. Пусть уравнение движения имеет вид

 

 

dy

ay bu,

y(t0 ) y0

- задано, требуется

найти управление u(t) ,

 

 

 

dt

 

 

 

 

 

 

 

 

 

 

 

 

минимизирующее

J y1(t1)

при условии, что t1

-

задано, а управление

ограничено (

 

u

 

1) .

 

 

 

 

 

 

 

 

 

 

В этом случае H (ay bu) . Тогда из условия максимума функции H

по u следует, что

 

 

 

 

 

 

 

1

 

 

при

b 0,

 

 

u0

 

 

 

 

 

 

 

 

b 0,

 

 

 

 

1

 

 

при

 

 

т.е. u0 sign(b ) .

Для определения имеем уравнение

 

 

 

 

d

a ,

(t ) 1.

 

 

 

 

 

 

 

 

 

dt

1

 

 

 

 

 

Пусть a –постоянная положительная величина.

Тогда

(t) ce at . Из условия

(t) 1 ce at1 , следует c e at1 . Тогда

(t) e

a(t1

t)

0 .

 

 

 

 

Так как (t) отрицательна, то

u0 signb

т.е. (t) не влияет на величину оптимального управления, а влияет только на знак его.

3.3. Задача на максимальное быстродействие.

В системе

dy

f (t, yu),

y(t0 ) y0

(3.11)

dt

 

 

 

37

требуется найти управление, переводящее состояния y0 в другое (конечное) состояние т.е. в данном случае

J (t1 t0 ) min

n

систему из одного (заданного) y1 за минимальное время (t1 t0 ),

Рассмотрим решение этой задачи на основе принципа максимума. Для определенности положим t0 0 .

В соответствии с принципом максимума функционал качества

n

необходимо представить в форме Майера: J ci yi (t1 ) .

 

 

 

 

 

 

 

 

 

 

 

i 1

Для этого введем переменную yn 1 t с помощью уравнения

 

dyn 1

1

 

 

 

 

y

n 1

(0) 0

 

 

 

 

 

 

 

dt

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Тогда J yn 1(t1) t1.

 

 

 

 

 

 

 

 

 

 

 

n 1

n

 

Введем функцию H

i fi i

fi n 1 , где множители Лагранжа

 

 

 

 

i 1

i 1

 

удовлетворяют уравнению

 

d i

 

H

с неизвестными начальными и

 

 

 

y

 

 

 

 

 

dt

 

 

 

 

 

 

 

 

 

 

 

i

 

конечными значениями.

 

 

 

 

 

 

 

 

Из структуры H видно, что

 

 

 

 

 

 

 

d n 1

0

n 1

const .

 

 

 

 

 

 

 

dt

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Тогда дальнейшее исследование функции H сводится к исследованию

n

i fi . i 1

Дальнейшее решение проведем для системы, описывающейся уравнением

d 2 y

u .

(3.12)

dt2

 

 

или

38

dy1 y

dt 2 (3.13) dydt2 u

Требуется перевести систему (3.13) из состояния

y1(0) y10

y2 (0) y20

в начало координат

y11 0 за минимальное время.

y21 0

В данном случае

H 1 y2 2u

 

 

y2

,

 

 

 

 

 

 

 

 

 

a2 = 0

где

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

d 1

0

 

 

 

 

 

 

 

 

 

dt

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

d 2

 

 

 

 

 

 

 

 

dt

 

1

 

 

 

 

 

 

 

 

 

 

 

 

0

y1

 

Решая систему уравнений, найдем

 

 

 

 

 

 

 

 

c

const

.

 

 

 

 

 

 

1

1

 

 

 

 

А

 

 

2 c1t c2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Будем считать, что 1 u 1.

 

 

 

 

Рис. 11

 

 

 

 

 

 

 

 

 

 

 

 

Из условия максимума функции H

b2 = 0

 

y2

следует, что

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

u0 1,

если

2 0

.

 

 

В

 

 

 

u0 1,

если

2 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Учитывая, что 2

- линейная

 

 

0

функция, меняющая знак не более одного

 

 

 

 

 

 

 

 

 

 

 

 

y1

раза,

оптимальное управление

может

 

 

 

быть:

u0 1,

u0 1

или

с

одним

 

 

 

переключением.

 

 

 

 

 

 

Рис. 12

39

Предположим, что u0 1, тогда

dy2

1 y

2

t a

 

 

 

 

 

 

dt

 

 

1

 

 

 

 

 

 

 

 

dy

 

 

 

(t a )2

 

1

 

t a y

1

a

2

 

 

 

dt

1

 

1

2

 

 

 

 

 

 

a1, a2 - константы интегрирования.

На фазовой плоскости получим уравнение y1 2 a2 . Различным

y2

2

значениям a2 будут соответствовать различные фазовые траектории

(параболы).

И только при a2 0 фазовая траектория проходит через начало координат. Поэтому с управлением u0 1 можно попасть в начало координат только, стартуя с фазовой траектории 0А.

Пусть теперь u0 1.

В этом случае

 

 

 

 

 

dy2 1 y

2

t b

 

 

 

 

 

 

 

 

 

dt

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

dy

t b y

 

(b t)2

 

 

 

 

 

 

 

 

1

1

b

 

 

 

 

 

 

 

 

dt

 

1

 

1

 

2

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и y y22 b .

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Видно,

что

с

управлением

 

B

U 1

y2

 

 

u0 1

 

 

 

 

 

 

 

 

 

 

 

 

можно

попасть

в

начало

U0 1

 

D

U0

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

координаты

только

стартуя

с точек

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

фазовой траектории B0.

 

 

 

 

 

 

 

 

 

 

y1

Таким

 

образом,

 

фазовая

 

С

 

 

 

A

 

 

 

 

 

 

 

 

 

 

 

 

 

 

плоскость делится линией A0B на 2

 

 

 

U0 1

 

 

части (области D и C).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 13

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Есть старт с точек области D,

 

 

 

 

 

 

то сначала u0 1, затем u0 1.

 

 

 

 

 

 

 

 

40

Если же – c точек области C, то u0 1 u0 1.

Линия A0B – линия переключения.

Так реализуется оптимальное управление в задаче быстродействия.

4. Метод динамического программирования

4.1. Принцип оптимальности Рассмотрим систему

 

dy

f (t, y,u)

t (0,T );

 

 

dt

(4.1)щш

 

 

 

 

y(0) y0 ,

u U

 

и функционал

 

 

 

 

 

T

 

 

 

J ( y,u) dt

 

(4.2)

 

 

0

 

 

который требуется минимизировать. Правый конец фазовых координат является свободным.

Наряду с этой вариационной задачей рассмотрим вспомогательную,

когда процесс рассматривается в интервале ( ,T ) (0,T ) и минимизируется

функционал

 

 

T

 

 

 

 

 

J ( y,u) dt,

(0,T ) .

 

(4.3)

 

 

 

 

 

 

Пусть

сначала

найден минимум J (4.2) и

соответствующее ему

оптимальное управление (рис. 14а):

 

 

 

 

 

u0 u0 (t),

t (0,T )

 

(4.4)

а потом – минимум J

(4.3) и оптимальное управление (рис. 14б):

 

 

u00 u00 (t),

t ( ,T ) .

 

(4.5)

В последнем случае предполагается, что в момент

 

процесс начинается с

состояния

y y( ),

достигнутого к

моменту времени

при оптимизации

процесса в интервале (0,T ) .