
книги из ГПНТБ / Цирлин, А. М. Основы оптимального управления конспект лекций
.pdf90
«иных функций J.0u ^ |
- I . Пара пишем 2 в форме |
Так как выбор функции |
^ |
не наруиает равенотва I |
и 5 |
, |
||||||
то заберем ее так, чтобы макоимум каждого иа влагаемых f?t по |
||||||||||
и |
»Vi |
или |
no |
U; и <^i-i |
не вавиоех о* |
|
||||
У{~\ |
или от У-i |
|
ооояветотвенно. Боки такую функцию |
|
||||||
удается |
подобрать, |
то мы ликвидируем овязь влагаемых |
Qi |
друг |
||||||
о другом для воех |
J(i |
и |
|
, доставляющих уолознын мак |
||||||
симум Rv . • ЬюДГ |
того, |
что по |
и |
Ui находят макон- |
|
|||||
кум, а-ox |
|
|
этот максимум зависать ие должен, то едни- |
|||||||
отэенная. переменная, |
от которой |
оя может аазисеть, это аргуменв |
||||||||
L . |
Сформулируем условно оптимальности. |
|
|
|||||||
Чтобы последовательноояь |
I |
* ^U. \ |
доставляла |
абсолют-. |
||||||
дыд максимум функционалу |
I , |
достаточно |
существования |
такой |
||||||
(ВУНКПИИ |
^ ( i |
I X |
с |
) f |
ч»о |
|
|
|
|
|
|
|
J |
- |
H |
U |
^ |
^ ^ |
I |
) |
=0 |
|
(10.5) |
|
Величина С i |
|
может быть любой в том смысле, что,если |
най |
||||||||||
дется |
функция |
^ |
( i |
|
) , удовлетворяющая |
(10.5) для неко- |
|||||||
торой |
ограниченной |
С |
-с |
, |
то найдется |
такая |
функция и для |
||||||
С ( i |
) |
0. |
Повтому |
|
примем |
С ^~ |
0, |
|
2,.../?, iyKZ |
||||
Ввшолиения условия |
(10.5) |
удобно |
требовать |
для воех^ |
|
||||||||
( - 0 , 1 , |
. . . И, положив |
|
^ - / , У _ , ) и л и |
^(tbj^J'^S |
°* |
|
Верхнюю грань квадратной |
скобки |
в (10.5) |
находят по Ci^ |
|
a |
или по ^ \ . и |
U. i |
. В первом случав |
можно вынеотн |
|
ра знак Si-cp функцию |
^Cii^i) |
* прийти к выражв- |
|||
«•ю |
(о учетом С (1 ) • |
0): |
|
|
|
во втором - 8а анак "Sup можно вынеотн |
^C-J, тогда |
Алгоритмы определения функции ^ , записанные в форме (10.6) и (10.7), позволяют, реиая на каждом шаге задачу услов
ного максимума, одновременно |
о вычислением |
^ |
найти и ту |
||||||
последовательность управлений ^ ^ i * J |
» которая доставляет |
||||||||
абсолютный максимум |
tS |
, |
а значит,и |
|
ЪшЪ. |
|
|||
В первом случае расчет проводится'"вперед" |
от |
t' = 0 к • |
|||||||
L = П. , |
10 втором-от |
П. к О. |
Еоли |
допустимы оба на |
|||||
правления |
расчета, |
то обычно |
предпочтительнее |
движение "впе |
|||||
ред", так как оно позволяет |
не задаваться |
числом |
влагаемых |\ , |
а выбрать его,удовлетворяя определенным дополнительным требо ваниям .
Алгоритмы (10.6) и (10.7) решают и вопрос существования
функции . Функция J. ограничена, поэтому при ^^•(.x'-jjsO
|
|
|
92 |
|
|
|
|
или |
^fojMt^) |
= о |
ограниченными |
окааываютоя |
и |
другие |
|
функции,последовательно вычисляемые,, согласно этим |
алгоритмам, |
||||||
о учетом непрерывности функции J.H „ ' |
~ |
|
|
||||
|
Таким" обраэом, |
функция |
^ ( |
) |
существует, |
и |
условие |
оптимальности, сформулированное выше, не только достаточно, но и необходимо.
10.8. Остановимся теперь на случае, когда связь (10.2) имеет част нув форму
эту форму овязи будем называть прямое. Связь, задвинув в фор ме,
|
' |
110.90 |
будем навивать инверсной, |
наконец,свявь |
|
разрешенной относительно |
управления. |
|
Ведение форма ОВЯБН определяет в значительной отепенж ва- |
||
правденяе расчета i позволяет перейти от |
задача условного к |
вадачв безусловного максимума на каждом ваге .
Так, для овнза (10.2а) удобнее использовать алгоритм (10.7), который примет вид
|
|
|
|
|
|
93 |
|
Здесь уже не приходится реветь задачу уодовного |
максимума |
||||||
по tQ |
и |
^У,- . |
Задаваясь J^ . y , можно дая каждого уп |
||||
равления |
иа множества |
|
\ / ч , не выводящего У с |
а а |
|||
пределы |
Vy |
, найти |
величину квадратной окобкх в правой чаоти |
||||
выражения |
(10.8). |
|
|
|
|||
Использование алгоритма (10.6) потребовало бы определения |
|||||||
Усч |
по |
J^i |
и |
^ |
, что для ааданмя овяаи в прямой |
||
форма |
затрудняет |
решение. |
|
||||
Напротив, инверсная форма овяаи ( \0. 2р) предполагает |
|||||||
раочет |
функции |
^ |
"вперед" |
|
Наконец, о вязь (10.2в) нейтральна |
относительно направле |
||
ния раочета ш особенно удобна |
х случае "узких" ограничений |
||
ва фазовые координаты в сравнительно |
более |
"широких" воз** |
|
нежностях выбора управления. |
|
|
|
Перепишем алгоритм (10.6) |
о учетом |
атой |
овязв |
J? |
C*i, X +i , |
У £ |
\4_ |
CI0.I0) |
Сравнивая |
вырааеяне |
(10.8) |
о ураввонием оеллмана |
(9.8), |
полученным |
в предыдущем параграфе ва ооново принципа опти |
|
мальности , |
можно заметить, |
что они полностью идентичны, а |
ОТнкцин ^ представляет |
собой функцию Беллмана задачи |
|
а О Л ) , (10.2а). |
|
Однако подход, развиты! а этом параграфе, повволяет не тонко вапноать алгоритм решения для произвольной формы овя- '»ай, но 1 некоторых чаотных олучаях сильно упроотить эти алго ритмы, а также для любой формы овнам найти оценки вверху к
оииву предполагаемого |
решения. |
|
|||||
10.4. |
Возможности |
упрощения |
алгоритмов |
||||
Упрочение алгоритмов, вытекающих иа уоловий оптимальности |
|||||||
(10.5), овяаано, |
как правило,с таким выбором чтобы независимое*i |
||||||
Ri |
от У-i |
ИЛЕ |
от ^t + | |
достигалась не в точке уол'овного |
|||
махонмуыа по оотальным двум переменным, а тождественно при |
|||||||
воех |
виачениях |
этих |
переменных. |
||||
Так, |
для линейной задачи функция |
||||||
|
|
№ |
М |
|
+ |
MUM,' |
|
а уравнение овя8И |
|
|
|
||||
Пусть ограничения на переменные состояния отсутствуют. |
|||||||
8ададнм |
функцию |
^ |
|
в форме линейной по _)С |
|||
и вышшем выражение |
для |
|
Так как |
в ^(ьУ-Опв определена |
лишь |
последовательность |
j)I , то |
выберем ее так, чтобы Q. |
не |
зависело от <У,- , |
|
|
|
95 |
|
|
|
со eon |
|
|
|
|
|
|
J |
А/. Г; |
|
л*. |
|
|
|
Ж~МО)+Л*,М |
|
*/ |
( 1 0 |
Л 1 ) |
||
ори |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
«У(п+1) |
- О |
|
|
|
|
Тогда |
оптимальное управление aalxotaa на уолова» |
|
||||
^ / f e ^ ^ f X f t ^ M ^ H r ) / |
l I 0 I 2 . |
|||||
Уравненыe (10.II) |
для |
|
определяв* функцн» |
|
|
|
которая, |
будучи подставлена в |
(10.12), воввоиог |
и г а |
о м » |
||
|
При ограничениях на фаювыв жоордаватн я веданной на |
|||||
чальной |
ооотояяии сУ0 нужно я ооометотвии о (10.8) |
учнтм- |
||||
i s » не только пряные |
ограничения ш управление, во я уоловие |
Приме р< Требуе-гоя яантв управление, доотаняюиес максимуа йтикци-
оналу
3
ара у о оовин |
|
I t t i / ^ а- > **• |
|
Согласно (10.II) |
|
Подсчитаем J{3) •= +3; J (2) «• +2 + 8.2 |
8 |
У ( ^ г ф 8 - ( - 1 ) - - 7 |
|
96
Оптимальное управление определится ив (10.12):
достигается при |
= - I , уоловне |
|
приводит к |
- +1 |
|
Иэ аналогичных соотношений |
получив ^ = +Ц 4С3 » 0. |
|
Оптимальная последовательность управлений и соответствующая |
||
ей траектория показаны на р я с |
ЮЛ. |
|
10.5. Оценка решения |
|
Рассмотрим |
первоначально связь, заданную в прямой форме (10.2а). |
|||||||
|
Подотавляя |
вне ото <У^^ |
функцию |
/ п |
, перепишем |
функционал |
||
|
S = I |
•+ 2 |
| < № ч / п |
tew)] |
- |
w . y ^ J |
+ |
|
|
Записанный |
л такой форме |
функционал 2 |
равен X |
|
|||
лишь при уоловии (10 . 2а) . Можно утверждать, |
что для любой функ |
|||||||
ции |
|
|
|
|
|
|
|
|
|
Действительно, множество, определяемое лишь ограничениями |
|||||||
на |
1Ц и |
|
шире, чем Д. На Э |
S |
= I |
, а значит, равны |
||
их |
верхние |
грани. Функция |
найденная |
по условию |
(10.8), |
|
|
|
|
|
97 |
|
|
|
|
|
|
|
замечательна тем, что для нее неравенство в |
СЮ.13) |
превра |
||||||||||
щается |
в равенство, так как <S^pS не аависит |
от X,-, для |
|
|||||||||
воех У,- |
|
€ Vc, |
|
в том числе |
для |
, удовлетво |
|
|||||
ряющих |
связи. |
|
|
|
|
|
|
|
|
|
||
Таким |
образом, |
искомый условный максимум |
функционала |
I |
|
|||||||
|
|
Sa-f |
Т |
— i^J- S<-<-f> |
|
|
|
|
|
|
||
Неравенство (10.13) позволяет дать оценку сверху предпо |
||||||||||||
лагаемого |
решение. |
|
|
|
|
|
|
|
|
|||
Для этого |
нуино |
задаться |
произвольной функцией ^ ( L, |
XL- |
) |
|||||||
и составить |
функционал |
в форме |
(10 . 3а) . |
Затем |
каждое |
из |
||||||
слагаемых этого |
функционала |
|
|
|
|
|
|
|
||||
_ |
|
|
|
|
|
г - |
1,2,.. |
. |
П - |
i . |
|
|
максимизировать по ^ ^ и ^ i £ V x , K a K по независимым пе ременным. Полученная сумма будет заведомо больше искомого ре - - шения.
Нетрудно заметить, что |
здесь |
существует |
полная аналогия .о |
|
оценкой |
задачи нелинейного |
программирования |
(ом. п. 7.7). |
|
Бее |
рассуждения, проведенные |
для пряной формы овязи, |
справедливы и в других случаях.
Для неявной формы связи процедура получения оценки сводитоя
также к |
заданию функции |
и |
максимизации каждого из |
слагаемых |
|
в |
(10.5) |
по всем |
трем |
переменным о учетом евнви J-H =0; |
|
в общем |
олучае, |
когда функция <-f не удовлетворяет уравнения* |
|||
сЮ.6),' |
(10.7), |
значение |
|
» обеспечивающее лакоимум |
i - те |
|
|
|
|
|
|
|
92 |
|
|
|
|
|
|
|
|
|
|
слагаемое, |
отлично |
от значения, |
максимизирующего |
{I |
- I ) - а . |
||||||||||||
|
Точность оценки, как и для нелинейного программирования, |
||||||||||||||||
тем больше, |
чем меньше влияют зависимые составляющие на мак- |
||||||||||||||||
сш-'ум |
/?• |
по .свободным |
составляющим. |
|
|
|
|
|
|
||||||||
|
Нижней, оценкой |
решения |
может |
служить |
величина |
функционала |
|||||||||||
I |
на любом допустимом решении. В частности, |
неплохую |
оценку |
||||||||||||||
в |
ряде |
задач дает |
управление, |
получаемое |
следующим |
образом: |
|||||||||||
|
1 . Пусть |
У0 |
задано. Ищут |
максимум |
J.o(Q} |
, У 0 | |
^ 0 |
) |
|||||||||
по |
'Uf, |
; получают |
|
К0 . |
|
|
|
|
|
|
|
|
|
||||
|
2. |
По Уд |
и |
|
находят |
. X . |
из уравнения |
связи, |
а по |
нему |
|||||||
аналогично |
п.1 |
1^, |
|
и т . д . |
|
|
|
|
|
|
|
|
|
||||
|
Управление |
Цъ |
|
оптимально лишь по отношению к первому |
|||||||||||||
слагаемому |
целевой |
функции |
X |
без учета |
влияния |
его |
через иsue |
||||||||||
нения |
состояния на остальные слагаемые. |
|
|
|
|
|
|
||||||||||
|
Оценку оптимального значения функционала I снизу можно вы |
||||||||||||||||
числить, |
не |
получая |
решения. Для |
этого, |
задавшись |
некоторой |
|||||||||||
функцией |
|
, нужно подсчитать максимум каждого из слагаемых |
|||||||||||||||
|
функционала |
S |
по |
свободным составляющим |
и минимум по |
||||||||||||
зависимым составляющим. Так, для прямой формы связи нужно в |
|||||||||||||||||
(10 . 3,а) |
максимизировать |
&^ |
по |
К-с и минимизировать по |
J^L- |
||||||||||||
Доказательство |
этого |
аналогично |
п . 7 . 8 . |
|
|
|
|
|
|
||||||||
|
ц*. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
[ 2 1 |
4 |
|
|
|
|
|
|
|
|
|
о) |
|
|
|
|
|
|
|
|
|
|
|
|
|
Рис. 10 . I
99
§ I I . Необходимые условия оптимальности дискретных задач и следующие из них алгоритмы .
I I . I . |
Условия |
оптимальности, |
полученные в предыдущем па |
|
раграфе, |
приводят |
к необходимости |
раочета функции |
) • |
Б общем случае расчеты эти очень трудоемки, особенно сильно растет число вычислений и потребный объем памяти машины о ростом размерности вектора У. .
Ввиду этого желательно получить необходимые условия оптималь ности для задачи о максимуме функционала
а
J =Z7o ^ ; ^ A J |
( П Л ) |
при |
|
основанные |
на сравнении |
траектории, |
подозрительной |
на оптималь |
||||
ность |
(Х{ |
= |
= |
|
) , |
с траекториями, |
близ |
|
кими к ней. |
|
|
|
|
|
|
|
|
Нам не требуется |
выводить |
такие |
условия. Нужно лишь приме |
|||||
нить к |
нашей задаче |
те условия, которые получены для общей |
||||||
задачи нелинейного программирования в п. 5.2 и 6.3. |
|
|||||||
Рассмотрим первоначально |
случай, |
когда ограничений на |
||||||
|
и VL( отсутствуют. |
Образуем функционал |
Лагранжа |
|||||
S =Т+ 2МЛУ ' Ч Х ; |
X |
V |
( п . 8 ) |
Из |
необходимых условий оптимальности |
для непрерывных и |
|
дважды |
дифференцируемых функций ^ и |
следует, |
что най |
ду ICRQ/ZC такие, что в точке предполагаемого решения |
функцио- |