Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Цирлин, А. М. Основы оптимального управления конспект лекций

.pdf
Скачиваний:
9
Добавлен:
19.10.2023
Размер:
6.17 Mб
Скачать

i60

 

нескольких

вариантах

такой задачи.

 

 

 

 

 

 

Л р

Если какая-то

из разовых

координат К

или время

^Х^+/

не

входят в функцию

 

, т . е . может принимать произвольное значе­

ние,

то

соответствующая

частная

производная, а

значит

я £££ СТ)

или

 

+ / к1)

равны .нулю,

.что совпадает

с условием (16.7;.

Условия,

оптимальности,

относящиеся

к внутренним

точкам

отрезка

\ 0,Т ;( "не

изменяются, так как последнее слагаемое

в

И ? отлично

от нуля лишь

при

6 - Т.

 

 

 

 

 

 

 

 

 

 

 

•Еункция

в

(16.10)

может быть

векторной

 

 

 

 

и )

+=а о;

 

 

/Ja)

= о,

.

. . / Х ^ > > =

о

 

в этом случав в X? добавится не одно слагаемое, а сумма вида

ГУ!

условия трансверсальности запишутся, как

и означают, что вектор

У

(,Т) может

быть

представлен как сумма

градиентов .функций

. Например, для

J

-

1,2

^ ^ / ^ л е ж и т в той

же плоскости, в которой лежат градиенты

 

и / - 7 - .

Ад. Вместо или наряду

с равенствами

(16.10)

в задачу могут вой­

ти и неравенства

 

 

 

 

 

 

В этом случае, как об этом говорилось в п.15. 3, каждому такому нера­

венству в

соответствует слагаемое

 

причем

Q/У ^

0.

 

А 4 . Частным

случаем условия (16.10)

является условие, наложен­

ное на одну из координат (п+1)-мерного

вектора У (Т), его можно за ­

писать, как

 

 

 

 

/-J

Су =0

U 6 . I 5 )

|Для простоты

считаем,

что

смешанных условии

в форме

(16.10),

(16.14) на J^(T ) не наложено. Тогда условие трансверсальности при­

мет форму

 

 

 

 

 

 

 

 

 

 

 

{;

j

 

fyCTJ

 

= *s£-

 

 

 

 

(16.16)

Таким образом,

если

время

или фазовая

координата

фиксированы, то

Ьоответотвупцая

составляющая

вектора

^ ? ^ / ' о т л и ч я а

от нуля. В

маетности/ для задач

с фиксированным Т и функцией Н,

не зависящей

гот

явно,

на оптимальном

решении Н (. XCU^Jj ^С^У

) равна

некоторой константе,

так как

С^,,, (Т) = ^У^^

.

 

 

Условие

общности положения

распространяется,

конечно, и на

связи

i(I6.I0)."

 

\.Т) и

Т

не

должны быть

"исключительными" точками»

 

Б. Оптимизируемый

функционал зависит от конечного

состояния

[перепишем I в форме

й составим функцию

|оторая отличается от (16 . II) лишь отсутствием множителя в оследнем слагаемом. Таким образом, условия оптимальности совпа­ дет с таковыми для предыдущей задачи с той разницей, что

1?= 1,2» ...v O+I частности, функционал (16.17) может вообще не содержать оервого

аемого ^ э

о

Широкий класс

задач

управления

сводится к

рстижению максимального

значения

одной

из переменных состояния

(Т)

при произвольных значениях

остальных переменных .в момент Т.

этом

случае

 

 

 

в соответствии с

(16.18)

С £ (Т) =+1, а

остальные

составляющие вектора^Т)

равны нулю.

16,3. Условия оптимальности классического вариационного исчисления

Проследим связь между принципом максимума Понтрягина и класси­ ческими вариационными методами на примере задачи о

JSOC/O ./Л(-*<

U; ^Je/J

(16.19)

являющейся основным объектом изучения в вариационном исчислении, функция £ для этой задачи.

Кроме дифференциуемости no «X,

потребуем дифференцируемости

d0 по I*- и сформулируем

условие

оптимальности

как условие

стационарности /S ,

а значит

и &

по У

и ^

. Множество

сравненияйри этом,

конечно,

уже^чем

при использовании

прин­

ципа максимума.- Из условия стационарности следует

 

Э

£<_

Искдючая из этой

оистемы ( / * & ) и учитывая, что ti = У, получим

вдоль оптимальной

траектории

 

Уравнение (16.21)

называется

уравнением Эйлера. Его решенья, удов­

летворяющие граничным условиям vI6 . I9), являются возможными опти­ мальными траекториями.

функцию можно исключить не только после дифференцирования второго из уравнений /16.20/, но и интегрируя первое из них.

 

f6i

Получим

^

так что

/£ц непрерывна по ^ .

Это условие называют условием Эрдмана - ВейерштрассоМножество претендентов на решение в задаче (16.19) можно

сузить, потребовав, чтобы в точке, стационарной по U , функ-»

ция Н достигала

максимума.

Запишем разность между значением

Н на оптимальном

управлении

некотором допустимом U.

и учтем, что в силу условия стационарности £^*можно опреде­ лить из (.16-20).

Получим

Функция Е называется функцией Вейерштрасса. Условие (16.22) должно выполняться для всех И. и Ь .

16.4.Условия, наложенные на промежуточные значения фазовых координат

Условия, аналогичные (16.10), могут быть наложены на на­ чальные или промежуточные значения переменных состояний. В первом случае, поступая совершенно так же, как в п . 16 . 3, мы

получим условия трансверсальности при \_ = 0 . Остановимся

164

на втором случав,

когда условие

 

 

 

 

 

 

 

 

 

 

/ 7 7 ^ - ^ = 0

 

 

 

 

(16.23)

наложено для некоторого м о м е н т а ^ f ,

В остальном не

условия

задачи

совпадают

с п. 1 6 . I .

 

 

 

 

 

 

 

функция

в

соответствии

с

табл.

 

I b . I имеет вид

 

 

 

(?=/

 

'

 

 

 

 

 

 

 

 

Условия

для выбора

£ /

(•£)

не изменятся,

а стационарность

R ао X

приводит

к уравнениям

 

 

^

f7

 

 

 

 

откуда

следует*

что в

точке

£а

 

^ ( ^ м е н я е т с я

скачком, причем

 

 

 

 

 

 

 

 

 

 

 

 

(.16.25)

 

 

 

 

 

 

 

 

 

 

0= I , 2,' . . . п+1

Теперь

рассмотрим

случай ]_

 

t когда

задача

п.16.1 осложнена

условием

 

С(х,*)*о

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

U6.261

для всех

i ^ f o . T j . Скалярная функция

G- (У.

; предполагается

дифференцируемой по совокупности своих аргументов. На первый взгляд

можно было бы ограничиться добавлением в

R

 

слагаемого,

соответ­

ствующего

(16.26), s записать эту функцию в

виде

 

 

 

 

 

 

•?=/

 

х

U

6 .

2

7 ,

оговарив

неположительностьJ(4). Это было бы верно,

если

бы неравен­

ство

(16.26)

выполнялось как равенство на воем

отрезке ,Т']

при

$

-

JC*~

« Но оно выполняется, вообще

говоря,

лишь на подмно-

иестве.

этого

отреака. Обозначим через 9 это

подмножество

 

 

 

 

 

 

 

 

 

165

 

 

 

 

 

 

 

 

 

 

Для

точек

i , d efO, Tji

в которых происходит

переход от неравенства

!с равенству

и обратно, нужно,

как об этом

было

сказано

в п. 15.3,

добавить

в

с 16.27)

слагаемые

типа

^//^ Q (У-)Ь'(4.-~L^i

Чтойы

учесть

такую возможность,

запишем /Qв

форме

 

 

 

 

 

 

|)=/

 

 

 

 

 

 

 

 

 

 

 

(16.28)

Здесь уУ(|-)

-

разрывная

функция

и ее

производная в точках

разры­

ва

~ £ и

равна

 

$f/~

T?J°, на остальных точках мнояе ства

&

,

vo

есть

там,

 

где

Q

(У-)~

О,

^rz" -У69^0; наконец,

вне б?

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

. Уравнения для

сопряженных

переменных

; 5 3 Г

~~ ^

примут форму

 

 

 

Остальные

условия

оптимальности

совпадают

с п . 1 6 . 1 .

 

 

 

 

16.5. Неявная форма

задания

дифференциального уравнения.

 

 

 

 

Сыешанше

ограничения

 

 

 

 

 

 

 

задачи,

рассмотренные выше, были

регулярны

по управления» и

сингулярны

по фазовым координатам

 

В ряде

случаев

задачи

оказываются сингулярны п noi(({). Остановимся на двух

вариан­

тах

такой

постановки.

 

 

 

 

 

 

 

 

 

 

 

 

А . Дифференциальное

уравнение, задано

в форме

 

 

 

 

 

 

У

(У,

tt^XJ-O,

 

 

 

 

 

 

(16.30)

причем

оно имеет

такой

вид, что его

 

нельзя разрешить

относитель­

но J{ . Перепишем

(16.30),

как

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

У

-

U

^

 

 

 

 

 

116 . Ш

(16.32)

Будем очитать, что функционал и условия на границах те же, что и в

п . 1 6 . 1 . Связь

(16.32),

а значит и вся задача сингулярна по всем

входящим

составляющим .решения. Составим функцию £2 ,

считая

для простоты,

что дифференциальные уравнения в явной форме

отсут­

ствуют, функция у/

скалярная. Следует также потребовать

ее не ­

прерывной дифференцируемости по совокупности аргументов. Запишем

для функционала

(16.2), связей (16.31) и iI6.32) -

 

42= JO fa,

«fj7?j*<^у+

<ft/s^Уу?As,у

ъ

Необходимые условия оптимальности для ограниченного замкнутого мно­

жества допустимых управлений

Vu,

 

 

 

Э/2

 

 

Ъ£

Ъ У

 

J

Э К*

 

 

Э U,

 

о

• —

= о

J

 

приводят к

 

 

 

уравнениям

 

 

 

Первые два из них эквивалентны одному

Уравнения (16.33) соответствуют "слабому" принципу максимума, так как предполагаемое решение сравнивается с близкими решэкиями как

по j{

, так и по У% и

Расширить множество функций сравнения

можно,

перейдя

к задаче условного максимума АР.

 

 

 

 

дадим задаче несколько более общую формулировку,

а именно,

потре

буем,

чтобы на

множестве

допустимых управлений

IL

faL

 

достигал

своей

верхней грани

функционал ( 1 6 . 2 )

со

связью

\ . I 6 . J I ) .

Множество

V ^ - пересечение

и множества

значении

ILj,

>

16?

удовлетворяющих С16.32) при Х(^) я J(*(4) . Тогда задача ре ­ гулярна no l i j и Ц^, функция

и уоловия оптимальности приводят к требованиям

т . е . квадратная

скобка в

U6.35) должна

оыть

максимальна при

H l £

^ ,

.

и

J-CUy^^-i)

~

<^

Множество

 

в такой формулировке может учитывать и другие ограничения; от

функции J-

не

требуется дифференцируемости no

 

1Ц.

 

 

Б. Ограничения смешанного

типа

 

 

 

 

 

 

 

 

JCXtK-j-iJ ±0

 

 

 

 

(Ьб.зб)

для

всех

 

 

в

отличие от ограничений

на фазоьые

коор­

динаты, приводят

к сингулярности задачи по U

на

том множестве б>

значений

,

для которых

^

= и. ДЛИ такой

задачи

остается в

силе

прием с

введением Jtf(4ji

использованный

в

пункте

16.4,

однако,

на множестве

 

требование

достижения фушсцией

£

своей

верхней

грани по

Ц. заменяется на

требование неположительности приращения

Qдля малых допустимых вариаций с9 U. ,

16.6.Задача на быстродействие (пример) •

Ряд задач управления сводится к переводу системы из заданного начального состояния в заданное конечное за минимальное время. В технологических процессах режим, онтимальный по быстродействию, соответствует максимальной производительности аппарата при заданное качестве целевого продукта. Критерией оптимальности в таких задача' может быть записан в форме J_ - — ^о/~1

а

 

/6Я

 

j / a

(iCtuJ- - I , и функция H запишется

как сумма только правых

частей

диффарешцшльных уравнений связи на

соответствующие

Рассмотрим в качестве примера простейшую задачу такого рода с объ­

ектом, характеризующимся

уравнением

 

of**-

 

 

 

и ограниченным

управлением

j U M l

. Введем следующие переменные

»У = <fX, и

= Mr^

t

тогда

исходное уравнение связи 2-го по­

рядка представится в виде двух уравнений 1-го порядка через фазовые

координаты v^j- '•

Согласно процедуре

принципа максимума:

 

 

1)

запишем функцию Н для

системы уравнений

связи

 

2)

составим систему уравнений для вспомогательных

переменных, ис­

пользуя условие

-

%f^~.

 

 

 

 

 

 

Решение

этой системы:

= (3/^ •

3)

записываем

условие

принципа

максимума:

 

 

так

-RBR^.-C/J

и первое

слагаемое не зависит

от М,

то

 

 

 

 

 

 

169

Н примет

 

наибольшее

значение„ если при

1)

9^

^

0,Ц.=

+1 -

максимальное значение управления,

2)

у>

 

0 , l i =

 

- I - минимальное значение управления,

'3)

(/s

 

= 0,М_

-

не

определено,

В точке, где функция Ч£ меняет знак с + на - , должно происхо­ дить переключение управления с верхнего предельного значения на нижнее. Так как ^ линейная функция и не равна нулю тождест­ венно, то управление определено почти всюду и равно

Функция S п определяется следующим образом: j " +1^Х>0

Оптимальное управление имеет два интервала постоянства: на одном

из которых оно равно +1, а на другом

-

I .

Оптимальная траектория будет состоять

йз

двух отрезков ( соответ-

.ственно числу интервалов постоянства

оптимального управления):

1-й отрезок

 

 

У I У- У2 ~>- О ±

- отрезок параболы;

2-й отрезок

У, s

_

J

_

y

J +

с <

 

 

 

«2

''

-2

-также отрезок параболы.

На рисунке

16.2

показаны

семейства оптимальных траекторий для

U = +1 и К

=

-

I .