Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Цирлин, А. М. Основы оптимального управления конспект лекций

.pdf
Скачиваний:
9
Добавлен:
19.10.2023
Размер:
6.17 Mб
Скачать

 

 

 

 

 

100

 

 

 

• нал

>S

имеет экстремум по

всем

входящим в

него

переменным,

то

есть

 

 

 

 

 

 

 

 

 

 

 

иди

 

 

 

 

 

г га

~ъги

 

 

 

~Щ~

* 0 j

{ П Л )

с)Afatf,AS

 

 

 

 

 

 

 

~ТЦГ

= 0

J

 

S " " m 0

'

 

( I I . 5 )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

( I I . 6 )

Если

ограничения на

У;

или

Не имеют

вид У4 '* ^У;^У^

(Ui# ^"U . L -

Ui*

1 0

реиение

может находиться и на границе

(см. п. 6.1),

причем

в атом случае

 

 

Щ8^ й ' о . соответственно

 

 

Э И г : " 0 ^ -

т

 

( I I . 8 )

где

и

oili

- вариации, не выводящие Ус

и

за

пределы

Ук

или

V|<_

 

 

 

П . 2 . Прямая

форма связи

 

 

 

Рассмотрим частные одучаи вадания связей и ограничений. Для

прямой

формы

связи

 

 

 

 

и ограничениях на

управление

4(<; £ \/^, уравнения

( I I . 8 )

и ( I I . 6 )

примут

вид

 

 

 

 

 

/О-f

*

э!2Г JBtCc

(ii.io)

 

•4 * Ш + Ж« = 6 7

( п ' щ

Условие (И . 5 ) можно заменить условием абсолютного ыакоицума по Ып , так как управление на последней стадии влияет на функционал I непооредотвенно и не влияет черев переменные состояния. Вводя обозначения

 

М - / / ' Л Щ +4+,АЪУ.;

UiJt

(

П Л 2 )

уравнения (II . 10) и

( I I . I I ) можно переписать

в более

компакт-

пой

форме

 

 

 

 

 

 

9и.

 

 

 

 

 

 

~2U<

~ U

 

 

 

(ИЛОа)

j

D M

i -

0 , 1 ,

2 . . .

 

 

j

 

 

 

 

<• - ТУТ'

„ .

(Ha)

Если

связей ( I I . 2 )

несколько,

то в tS H

U

пояжитоя двойная

сумма

 

<•

 

 

 

 

 

 

 

 

 

 

т .

п.

 

 

 

 

 

 

 

pS * J + Z! 2 4

 

 

' - ^ ^ ' - 1 ; 4 ; )

( П . З а )

Здесь

TTV -

число

связей. Соответствующее

 

суммирование

 

/ и 6

 

 

 

 

 

 

по

V

нужно

будет произвести и в условиях

 

оптимальности

( П .

4)

* ( I I . б ) .

Уравнения ( I I . 9 )

запишутся

 

в

виде

(пункция

V я

Ю2

,

H

- i

,

+Z,b"i-n

J" ,

 

(11.12a)

а условия

оптимальности

(Il.ICja)

и

( I I . Н а )

почти не изме­

нятся

 

 

~ •.

 

 

 

 

 

 

 

 

Ш

^

6

°

 

 

 

 

 

^ К

 

 

 

1 - 0 , 1

л - i

 

Л

'

-

 

 

 

 

 

i =

0,2,

. . . , П ,

J =

1,2

, , . . , m .

Необходимые условия оптимальности в такой форке составляют оодеркание дискретного принципа максимума

Н . Э . Связь, разрешенная относительно управления ;

Условия оптимальности для ограниченных фазовых координат примут вид:

2,1^.

'Л'' о

 

( П Л 4 )

/ЪАО'А;*)

, b/fiyrf.,;

.

)

Последнее условие с учетом ( I I . 14) можно переписать в фор­

ме

15)

щ

Применить необходимые условия

оптимальности (II . 13) или

( I I . 15) оовместно о уравнениями

связи для аналитического оп­

ределения оптимального управления удается сравнительно редко.

Причина этого как в

сложности решения системы нелинейных раз -

ноотных уравнений о

краевыми условиями

д л я ^ х ^

и \Jij

» ~

данными в разных концах интервала, так

и в

том,

что

уоловия

локального максимума или стационарности

W

по

%

выде­

ляют "разветвляющийся" набор претендентов на решение. Однако эти условия можно с успехом использовать для поисковых алго­ ритмов.

ПЛ. Вычисление градиента о использованием функционала Лагранжа

Один из алгоритмов поиска условного максимума, рассмотрен­ ный в п. 7.2, состоял в следующем:

1. Выбирались начальные значения переменных, удовлетво­ ряющие связям.

2.Множители Лагранжа находились таким образом, чтобы в начальной точке функция Лагранжа не изменялась при изменении одной группы переменных (зависимых).

3.Вычислялся градиент функции Лагранжа по переменным

второй

группы (свободным) и делался шаг по ним.

4.

Из уравнений

связи определялись новые значения 'зави­

симых

переменных.

Потом процедура повторялась.

По той же схеме может быть проведен поиск макоимума фун­ кционала I в дискретной задаче оптимального управления.

Так, для прямой формы связи ( I I . 9 ) эта последовательность приводит к таким вычислениям.

 

 

 

 

 

• 104

 

 

 

 

 

 

 

I .

Выбирают

управление

^ U.^ |

возможно более

близкое к

предполагаемому

оптимальному, и по уравнению

связи

и

известному

начальному оостоянию подсчитывают ооответст

 

траекторию

2.

Уравнение

( И Л 1 )

решают

относительно

^ц- ,

 

приняэ

 

№ls

facl,{lkl

'

И

^ n

+ i

=

0.

Получают

последователь­

ность

Jy/Oj'.

 

 

 

 

 

 

 

 

 

 

 

3.

Вычисляют

градиент функционала

^

по управлениям

. А

так как от управления на i-ом

шаге

зависит

только

выражение

Н

( i,^C,

1^, Ji ) , то^одставив

в

выражение (11.12)

ч.

находят

его

градиент

по

К

и новое

приближение

 

 

 

 

 

 

 

 

 

 

 

 

г = 0 , 1 , 2 , . . . . i

 

Ограничения на управления могут быть учтены теми же мето­

дами,

что и в общей задаче

нелинейного

программирования

 

(см. п . 7 . 2 ) .

 

 

 

 

 

 

 

 

 

 

 

4. Из уравнений связи определяют новые значения переменных

состояния

|

J .

 

 

 

 

 

 

 

 

 

 

Не вдаваясь детально в возможные разновидности и модерни­

зации

этого алгоритма, сделаем два замечания:

 

 

 

I .

Не всегда удобно считать управления свободными, а фа­

зовые

координаты

зависимыми

составляющими решения.

 

За свобод­

ные составляющие можно принять, вообще говоря, любой набор из управлений и фазовых координат такой, что оставшиеся управле­ ния и фазовые координаты определяются при их задании уравнениями связей. Естественно, что уравнения для выбора г//± , будут иными Так как при поиске удобнее учитывать ограничения на сгсоодные составляющие, то характер ограничений существенно влияет на

выбор этих составлявших.

Вторым фактором является вид уравнений связей. Желательно, чтобы зависимые составляющие входили туда в явной форме. •Тогда при подстановке свободных составляющих определение за­ висимых не требует решения уравнений.

2. Не обязательно после наждого шага возвращаться на мно­ жество Д, определяя зависимые составляющие из уравнений связей. Если они сложны, их можно заменить линеаризованными уравне­ ниями, проводя уточнение через несколько шагов.

I I . 5 . Алгоритм поиска седловой точки функции ЛагранжаАналогично задаче нелинейного программирования для дискрет­

ной оптимальной задачи ( I I . I ) , ( I I . 2 ) может быть использован алгоритм Эрроу-Гурвица, причем могут быть учтены и ограни­

чения типа

Р(^с,

 

и.,

О

4

О

 

( п . 1 6 )

 

Каждому

такому

ограничению соответствует слагаемое

£i

Р

в функционале

/S

,

причем

множители

@i равны нулю внутри

и

неотрицательны

на

границе множества,

выделяемого

условием

 

( И . 1 6 ) .

 

 

 

 

 

 

 

 

 

 

1-Й шаг. Задаются начальным управлением

j

и тра­

екторией

\^с^

 

'

 

 

Желательно, чтобы

они

были

 

близки к предполагаемому решению. И,во всяком случае,были

 

допустимы

по ограничениям.

 

 

 

 

 

В отличие от предыдущего алгоритмауНеобязательно,

чтобы

 

эти последовательности

были

связаны

друг с другом

уравнениями

( I I . 2 ) . Одновременно

задают

последовательности

\J{1

 

^

О.

 

 

 

 

 

 

 

ТОЬ

2-й

 

шаг. Определяют

градиент функционала

по У,-

,

Ь-1

,

J i n

в окрестности начальной точки. Причем

по

пергым

 

двум переменным

делают шаг по направлению, а по

и

<di

 

против

направления градиента. Получают

следующую

точ-

Частные производные функционала Лагранжа, определяющие градиент, подсчитываются из выражения

1=0 1-0

Частная производная /S по аУ/ и Q обращается в нуль при выполнении соответствующей связи или ограничения.

Упражнение. Получить необходимые условия оптимальности для задания свя8ей(Й!2) в инверсной форме и ограничении на управ­ ление.

Замечание. При использования градиентных методов бывает по ­ лезно введение "зоны нечувствительности" [ 17 ] . При этом из­

меняют переменные лишь для тех

L , для которых величина гради­

ента по модулю превосходит некоторую величину £

. Благодаря

такому подходу на (К +1}-ом нате

можно использовать

результаты,

полученные на К -ом шаге, по тем переменным, для которых гра­

диент оказался мал. После серии из нескольких шагов вновь вы­

числяется

"малый" градиент. Величина £ уменьшается с

прибли- .

жеаием к

экстремуму.

 

Упражнение. Составить блок-схемы алгоритмов этого параграфа

с использованием "зоны нечувствительности" в процессе

поиска.

т

§ 12. Условия оптимальности для дискретных задач оо связями разного типа. Задача на максимум минимумов

Изученная нами задача далеко не исчерпывает возможные ва­ рианты дискретных задач оптимизации. Жизнь выдвигает разно­

образные

условия

и целевые функции, такие их сочетания, ко­

торые

невозможно

предусмотреть заранее. Например,

в рассмот­

ренной выше задаче начальное состояние Уе

очиталось

задан­

ным, а конечное У^свободныы. Спрашивается,

как

изменятся

условия оптимальности, если одно из этих предположений не

выполнено?

 

 

 

 

 

 

 

 

Связи между переменными также могут иметь различный, не

обязательно марковский характер. Наконец? целеван функция

далеко

не

всегда

имеет

форму

( I I . 1 ) . Ниже мы изложин

подход,

позволяющий для различных сочетаний и форм связей,

ограни­

чений

и различных

функций цели записать функционал

Лагранжа

и услсвия

оптимальности.

 

 

 

 

 

1 2 . I .

Аддитивность

функционала

Лагранжа.

Каноническая

 

 

 

форма

связи

 

 

 

 

 

Первым этапом

при

составлении

как.условий

оптимальности,

так и

основанных

на

них численных

алгоритмов

является

состав­

ление

функционала

Лагранжа

8 .

 

 

 

 

Для

решения дискретных задач

со связями разного типа нужно

научиться

составлять функционал $ при произвольном наборе

сгязей.

 

 

 

Также

как в общей задаче нелинейного программирования,

каждой

связи соответствует одно слагаемое в функционале/^.

Однако

в зависимости от структуры связи вид этого слагаемого

окакется

различным. Чтобы найти

слагаемые, соответствующие

щ

разный формам оьязай, мы наметим

такую последовательность дей­

ствий:

 

 

 

 

 

 

 

 

 

 

 

 

1. Выбераи вспомогательную каноническую форму связи между

дискретными переменными.

 

 

 

 

 

 

 

 

2. Найдем вид функционала Лагранжа и условий оптимальнооти для

такой

связи.

 

 

 

 

 

 

 

 

 

 

 

3. Разнообразные формы связи приведем

к

кановичеокому

виду.

Тогда

условия

 

оптимальности, полученные в п . 2, окажутся

примени­

мы для

любого

 

сочетания

"приводимых"

форм

связей.

 

 

В качестве

канонической

формы

связи выберем выражение

 

 

 

 

 

п.

 

V • Ь

J

i 1 -

 

п

 

 

 

 

 

 

I

/

 

 

( I 2 . I )

 

 

 

' = °

 

 

 

 

^

0 , 1 , 2 , . . „ П .

 

 

 

 

 

 

 

 

Эта

свя'зь

завионт

от

параметра

j

и

справедлива

для

любого

его значения

от нуля

до

ft

. Так что,по

сути дела,

она

эквива­

лентна

 

 

связи.

 

 

 

 

 

 

 

 

 

Пусть целевая функция

имеет вид

 

 

 

 

 

 

 

1

=i2-' а

(*1№>

О

 

 

 

 

(12.2)

Составим Функционал Лагранжа для задачи (12.2), (12.1), считая

пока,

что

ограничения

на переменные

отсутствуют. Заметим,

что в

ату задачу

{ и.

U L

входят

совершенно симметрично. Однако,имея

в виду

дальнейшее

изложение,

удобно

разбить переменные на

две

группы.

 

 

 

 

 

Итан^ функционал Лагранжа

 

 

 

j - °

 

 

 

 

 

 

 

 

i09

 

 

 

 

 

 

 

 

 

 

 

Необходимые уоповия оптимальности (ou. п.5.2)

утверждают:

если для

всех

J

 

выполнены уоловия общности полокенип. т . е .

ни

при одной

J

 

решение

Ы,

U*\

не являотоп

зкстреивлыо

<Р* ( J

)

и функции

J

и

J-e

удовлетворяют

уоловияи

дисМд-

ренцируеиооти, то найдется такая последовательность

\<^j^

%

что

щункциоиад

«3^

на \ У* . U* {

достигает

локального

иакоицуиа

на

множестве

 

 

сравнения

Ь

.

 

 

 

 

 

 

 

 

 

Если

свяаей

(12.1) несколько,

£f,

(j

)

= 0,

 

$i.Q)

* О , . . .

 

o / m ( j

)

= 0,

то

в ч/ункщюнале

(12.3)

появится

не

одно, а гп

олагаемых

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

т .

 

 

 

 

 

 

 

 

 

 

 

 

Но нам удобнее

поставить в

соответствие

 

оьпзи

(12.1)

слагаемое

не

в 1рунк:ЛОнале

j3 , а л выражении, стоящим под знаком суммы

этого

1Ду>.кционала.

Перепишем (12.3) в

форио

 

 

 

 

 

 

или, меняя порядок суммирования во втором слагаемом, как

 

1-0

 

 

i'o

 

Выражении, стоящее

в квадратных скобках, полностью опреде­

ляет

^

« Обозначим

его через /2

, а слагаемое, соответствую­

щее

ci-яви г через Qtg

 

. Тип ГП

связей

/У)

& = ^

* < ^ , ^ с ^ ,

 

/12.6/

х / < Если L открыто,условие максимума

на нем приводит

в условию

стационарности.