Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Цирлин, А. М. Основы оптимального управления конспект лекций

.pdf
Скачиваний:
21
Добавлен:
19.10.2023
Размер:
6.17 Mб
Скачать

90

«иных функций J.0u ^

- I . Пара пишем 2 в форме

Так как выбор функции

^

не наруиает равенотва I

и 5

,

то заберем ее так, чтобы макоимум каждого иа влагаемых f?t по

и

»Vi

или

no

U; и <^i-i

не вавиоех о*

 

У{~\

или от У-i

 

ооояветотвенно. Боки такую функцию

 

удается

подобрать,

то мы ликвидируем овязь влагаемых

Qi

друг

о другом для воех

J(i

и

 

, доставляющих уолознын мак­

симум Rv . • ЬюДГ

того,

что по

и

Ui находят макон-

 

кум, а-ox

 

 

этот максимум зависать ие должен, то едни-

отэенная. переменная,

от которой

оя может аазисеть, это аргуменв

L .

Сформулируем условно оптимальности.

 

 

Чтобы последовательноояь

I

* ^U. \

доставляла

абсолют-.

дыд максимум функционалу

I ,

достаточно

существования

такой

(ВУНКПИИ

^ ( i

I X

с

) f

ч»о

 

 

 

 

 

 

 

J

-

H

U

^

^ ^

I

)

=0

 

(10.5)

Величина С i

 

может быть любой в том смысле, что,если

най­

дется

функция

^

( i

 

) , удовлетворяющая

(10.5) для неко-

торой

ограниченной

С

-с

,

то найдется

такая

функция и для

С ( i

)

0.

Повтому

 

примем

С ^~

0,

 

2,.../?, iyKZ

Ввшолиения условия

(10.5)

удобно

требовать

для воех^

 

( - 0 , 1 ,

. . . И, положив

 

^ - / , У _ , ) и л и

^(tbj^J'^S

°*

 

Верхнюю грань квадратной

скобки

в (10.5)

находят по Ci^

a

или по ^ \ . и

U. i

. В первом случав

можно вынеотн

ра знак Si-cp функцию

^Cii^i)

* прийти к выражв-

«•ю

(о учетом С (1 ) •

0):

 

 

 

во втором - 8а анак "Sup можно вынеотн

^C-J, тогда

Алгоритмы определения функции ^ , записанные в форме (10.6) и (10.7), позволяют, реиая на каждом шаге задачу услов­

ного максимума, одновременно

о вычислением

^

найти и ту

последовательность управлений ^ ^ i * J

» которая доставляет

абсолютный максимум

tS

,

а значит,и

 

ЪшЪ.

 

В первом случае расчет проводится'"вперед"

от

t' = 0 к •

L = П. ,

10 втором-от

П. к О.

Еоли

допустимы оба на­

правления

расчета,

то обычно

предпочтительнее

движение "впе­

ред", так как оно позволяет

не задаваться

числом

влагаемых |\ ,

а выбрать его,удовлетворяя определенным дополнительным требо­ ваниям .

Алгоритмы (10.6) и (10.7) решают и вопрос существования

функции . Функция J. ограничена, поэтому при ^^•(.x'-jjsO

 

 

 

92

 

 

 

 

или

^fojMt^)

= о

ограниченными

окааываютоя

и

другие

функции,последовательно вычисляемые,, согласно этим

алгоритмам,

о учетом непрерывности функции J.H „ '

~

 

 

 

Таким" обраэом,

функция

^ (

)

существует,

и

условие

оптимальности, сформулированное выше, не только достаточно, но и необходимо.

10.8. Остановимся теперь на случае, когда связь (10.2) имеет част нув форму

эту форму овязи будем называть прямое. Связь, задвинув в фор­ ме,

 

'

110.90

будем навивать инверсной,

наконец,свявь

 

разрешенной относительно

управления.

 

Ведение форма ОВЯБН определяет в значительной отепенж ва-

правденяе расчета i позволяет перейти от

задача условного к

вадачв безусловного максимума на каждом ваге .

Так, для овнза (10.2а) удобнее использовать алгоритм (10.7), который примет вид

 

 

 

 

 

 

93

 

Здесь уже не приходится реветь задачу уодовного

максимума

по tQ

и

^У,- .

Задаваясь J^ . y , можно дая каждого уп­

равления

иа множества

 

\ / ч , не выводящего У с

а а

пределы

Vy

, найти

величину квадратной окобкх в правой чаоти

выражения

(10.8).

 

 

 

Использование алгоритма (10.6) потребовало бы определения

Усч

по

J^i

и

^

, что для ааданмя овяаи в прямой

форма

затрудняет

решение.

 

Напротив, инверсная форма овяаи ( \0. 2р) предполагает

раочет

функции

^

"вперед"

 

Наконец, о вязь (10.2в) нейтральна

относительно направле­

ния раочета ш особенно удобна

х случае "узких" ограничений

ва фазовые координаты в сравнительно

более

"широких" воз**

нежностях выбора управления.

 

 

 

Перепишем алгоритм (10.6)

о учетом

атой

овязв

J?

C*i, X +i ,

У £

\4_

CI0.I0)

Сравнивая

вырааеяне

(10.8)

о ураввонием оеллмана

(9.8),

полученным

в предыдущем параграфе ва ооново принципа опти­

мальности ,

можно заметить,

что они полностью идентичны, а

ОТнкцин ^ представляет

собой функцию Беллмана задачи

а О Л ) , (10.2а).

 

Однако подход, развиты! а этом параграфе, повволяет не тонко вапноать алгоритм решения для произвольной формы овя- '»ай, но 1 некоторых чаотных олучаях сильно упроотить эти алго­ ритмы, а также для любой формы овнам найти оценки вверху к

оииву предполагаемого

решения.

 

10.4.

Возможности

упрощения

алгоритмов

Упрочение алгоритмов, вытекающих иа уоловий оптимальности

(10.5), овяаано,

как правило,с таким выбором чтобы независимое*i

Ri

от У-i

ИЛЕ

от ^t + |

достигалась не в точке уол'овного

махонмуыа по оотальным двум переменным, а тождественно при

воех

виачениях

этих

переменных.

Так,

для линейной задачи функция

 

 

М

 

+

MUM,'

а уравнение овя8И

 

 

 

Пусть ограничения на переменные состояния отсутствуют.

8ададнм

функцию

^

 

в форме линейной по _)С

и вышшем выражение

для

 

Так как

в ^(ьУ-Опв определена

лишь

последовательность

j)I , то

выберем ее так, чтобы Q.

не

зависело от <У,- ,

 

 

 

95

 

 

 

со eon

 

 

 

 

 

 

J

А/. Г;

 

л*.

 

 

 

Ж~МО)+Л*,М

 

*/

( 1 0

Л 1 )

ори

 

 

 

 

 

 

 

 

 

 

 

 

«У(п+1)

- О

 

 

 

 

Тогда

оптимальное управление aalxotaa на уолова»

 

^ / f e ^ ^ f X f t ^ M ^ H r ) /

l I 0 I 2 .

Уравненыe (10.II)

для

 

определяв* функцн»

 

 

которая,

будучи подставлена в

(10.12), воввоиог

и г а

о м »

 

При ограничениях на фаювыв жоордаватн я веданной на ­

чальной

ооотояяии сУ0 нужно я ооометотвии о (10.8)

учнтм-

i s » не только пряные

ограничения ш управление, во я уоловие

Приме р< Требуе-гоя яантв управление, доотаняюиес максимуа йтикци-

оналу

3

ара у о оовин

 

I t t i / ^ а- > **•

 

Согласно (10.II)

 

Подсчитаем J{3) •= +3; J (2) «• +2 + 8.2

8

У ( ^ г ф 8 - ( - 1 ) - - 7

 

96

Оптимальное управление определится ив (10.12):

достигается при

= - I , уоловне

приводит к

- +1

 

Иэ аналогичных соотношений

получив ^ = +Ц 3 » 0.

Оптимальная последовательность управлений и соответствующая

ей траектория показаны на р я с

ЮЛ.

10.5. Оценка решения

 

Рассмотрим

первоначально связь, заданную в прямой форме (10.2а).

 

Подотавляя

вне ото <У^^

функцию

/ п

, перепишем

функционал

 

S = I

•+ 2

| < № ч / п

tew)]

-

w . y ^ J

+

 

Записанный

л такой форме

функционал 2

равен X

 

лишь при уоловии (10 . 2а) . Можно утверждать,

что для любой функ­

ции

 

 

 

 

 

 

 

 

Действительно, множество, определяемое лишь ограничениями

на

и

 

шире, чем Д. На Э

S

= I

, а значит, равны

их

верхние

грани. Функция

найденная

по условию

(10.8),

 

 

 

 

 

97

 

 

 

 

 

 

замечательна тем, что для нее неравенство в

СЮ.13)

превра­

щается

в равенство, так как <S^pS не аависит

от X,-, для

 

воех У,-

 

€ Vc,

 

в том числе

для

, удовлетво­

 

ряющих

связи.

 

 

 

 

 

 

 

 

 

Таким

образом,

искомый условный максимум

функционала

I

 

 

 

Sa-f

Т

— i^J- S<-<-f>

 

 

 

 

 

 

Неравенство (10.13) позволяет дать оценку сверху предпо­

лагаемого

решение.

 

 

 

 

 

 

 

 

Для этого

нуино

задаться

произвольной функцией ^ ( L,

XL-

)

и составить

функционал

в форме

(10 . 3а) .

Затем

каждое

из

слагаемых этого

функционала

 

 

 

 

 

 

 

_

 

 

 

 

 

г -

1,2,..

.

П -

i .

 

 

максимизировать по ^ ^ и ^ i £ V x , K a K по независимым пе­ ременным. Полученная сумма будет заведомо больше искомого ре - - шения.

Нетрудно заметить, что

здесь

существует

полная аналогия .о

оценкой

задачи нелинейного

программирования

(ом. п. 7.7).

Бее

рассуждения, проведенные

для пряной формы овязи,

справедливы и в других случаях.

Для неявной формы связи процедура получения оценки сводитоя

также к

заданию функции

и

максимизации каждого из

слагаемых

в

(10.5)

по всем

трем

переменным о учетом евнви J-H =0;

в общем

олучае,

когда функция <-f не удовлетворяет уравнения*

сЮ.6),'

(10.7),

значение

 

» обеспечивающее лакоимум

i - те

 

 

 

 

 

 

 

92

 

 

 

 

 

 

 

 

 

слагаемое,

отлично

от значения,

максимизирующего

{I

- I ) - а .

 

Точность оценки, как и для нелинейного программирования,

тем больше,

чем меньше влияют зависимые составляющие на мак-

сш-'ум

/?•

по .свободным

составляющим.

 

 

 

 

 

 

 

Нижней, оценкой

решения

может

служить

величина

функционала

I

на любом допустимом решении. В частности,

неплохую

оценку

в

ряде

задач дает

управление,

получаемое

следующим

образом:

 

1 . Пусть

У0

задано. Ищут

максимум

J.o(Q}

, У 0 |

^ 0

)

по

'Uf,

; получают

 

К0 .

 

 

 

 

 

 

 

 

 

 

2.

По Уд

и

 

находят

. X .

из уравнения

связи,

а по

нему

аналогично

п.1

1^,

 

и т . д .

 

 

 

 

 

 

 

 

 

 

Управление

Цъ

 

оптимально лишь по отношению к первому

слагаемому

целевой

функции

X

без учета

влияния

его

через иsue

нения

состояния на остальные слагаемые.

 

 

 

 

 

 

 

Оценку оптимального значения функционала I снизу можно вы­

числить,

не

получая

решения. Для

этого,

задавшись

некоторой

функцией

 

, нужно подсчитать максимум каждого из слагаемых

 

функционала

S

по

свободным составляющим

и минимум по

зависимым составляющим. Так, для прямой формы связи нужно в

(10 . 3,а)

максимизировать

&^

по

К-с и минимизировать по

J^L-

Доказательство

этого

аналогично

п . 7 . 8 .

 

 

 

 

 

 

 

ц*.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

[ 2 1

4

 

 

 

 

 

 

 

 

о)

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 10 . I

99

§ I I . Необходимые условия оптимальности дискретных задач и следующие из них алгоритмы .

I I . I .

Условия

оптимальности,

полученные в предыдущем па­

раграфе,

приводят

к необходимости

раочета функции

) •

Б общем случае расчеты эти очень трудоемки, особенно сильно растет число вычислений и потребный объем памяти машины о ростом размерности вектора У. .

Ввиду этого желательно получить необходимые условия оптималь­ ности для задачи о максимуме функционала

а

J =Z7o ^ ; ^ A J

( П Л )

при

 

основанные

на сравнении

траектории,

подозрительной

на оптималь­

ность

(Х{

=

=

 

) ,

с траекториями,

близ­

кими к ней.

 

 

 

 

 

 

 

Нам не требуется

выводить

такие

условия. Нужно лишь приме­

нить к

нашей задаче

те условия, которые получены для общей

задачи нелинейного программирования в п. 5.2 и 6.3.

 

Рассмотрим первоначально

случай,

когда ограничений на

 

и VL( отсутствуют.

Образуем функционал

Лагранжа

S =Т+ 2МЛУ ' Ч Х ;

X

V

( п . 8 )

Из

необходимых условий оптимальности

для непрерывных и

дважды

дифференцируемых функций ^ и

следует,

что най­

ду ICRQ/ZC такие, что в точке предполагаемого решения

функцио-