![](/user_photo/_userpic.png)
книги из ГПНТБ / Цирлин, А. М. Основы оптимального управления конспект лекций
.pdfгде # c i |
=Jj/fr)[xatffr-// |
-/fau, |
|
Jjirr-w<//s |
|||||||
При |
заданном значении _Х\ и ; |
второе слагаемое |
в i I 5 . I 0 ) |
не эа- |
|||||||
внспт |
от варьируемых |
составляющих решения. Выражение |
l i b . I I ) |
для" |
|||||||
дифференцируемой |
tj |
у{) |
можно записать |
в несколько оолее удобной |
|||||||
форме, |
введя |
функцию |
|
|
|
|
|
|
|
||
Получим |
|
|
|
|
|
|
|
|
|
|
|
с & |
|
|
|
|
|
|
|
|
U5 . I3) |
||
Подинтегральное выражение в vI5.U) состоит из двух слагаемых, |
|||||||||||
первое из которых сингулярно и |
содержит только У |
(4), |
второе |
же, |
|||||||
куда входят X и U . |
, регулярно зависит от времени. Так что связь |
||||||||||
регулярна |
по |
1L |
и |
сингулярна |
по У |
. |
|
|
|
||
15.5. |
Интегральные |
уравнения |
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
г |
Ub.14) |
|
Переписав |
У |
( Т |
) |
в форме интеграла, |
получим |
|
|
||||
|
|
|
|||||||||
Слагаемое |
|
-£ |
|
|
|
|
|
|
4 |
|
|
|
|
у |
|
|
|
-/ |
|
|
|
|
|
В частности, для линейного интегрального уравнения, связывающего выходной У и входной Ы. сигналы динамической системы:
i5i
-г,
Для системы автономной, физически реализуемой
£a |
= МШМ |
~ *MAfr- |
VSfto/r |
U 6 . I 7 ) |
|||
Связь |
сингулярна по |
У |
н регулярна до |
. |
|
||
J.t>.t>. Рекуррентные |
соотношения. |
|
|
||||
В некоторых |
задачах |
наряду с переменными, зависящими от непре |
|||||
рывного аргумента, |
встречаются и фу!1кция |
дискретного |
аргумента. |
||||
Ввиду |
того, |
для |
связей |
между такими функциями также |
получим |
||
слагаемые в |
/? |
. Так,для рекуррентного соотношения |
|
о
где |
6 = 0,1, |
. . ., л/. |
|
|
Подилтетральное |
выражение сингулярно из-за наличия |
S-функций, |
||
что |
приводит |
к |
сингулярности связи не только по X, |
но и по I t |
|
отличие от дифференциального уравнения). |
|
||
|
Ра> |
=<y/i+, |
|
Это выралвние совпадает с выражением, полученным в § 12-Дсм.таб
лицу 12.IJ. |
Псе остальные |
слагаемые |
записанные в табли |
|||
це |
12.1, можно получить таким же образом, |
причем |
для |
заяиои из: |
||
в |
канонической |
форме U4.6) |
приходится вводить |
§ - |
функции, а |
это значит, что по переменным, зави'-ящим от дискретного аргумента, задача всегда сингулярна, а значит их следует отнести к переменным второй группы.
15Z
15.7. Таблица слагаемых |
и некоторые формы |
|
|
||
|
критериев оптимальности. |
|
|
|
|
Сведем полученные слагаемые для различных форм связей |
в |
таблицу. |
|||
|
|
|
Таблица |
1 5 . I . |
|
*n.Di |
Связь |
се |
I г р . |
I I TJb |
|
|
|
|
|
I .
о |
при - t^a,^} |
3. |
У |
|
5.
•fj(r)c/r; и
v(r+j- 0
6.
o/T.
Выше для канонической формы |
записи было показано, что |
ограни |
|||||
чениям в функционале |
Лагранжа |
^ |
соответствуют такие |
же сла |
|||
гаемые, как и связям, |
но на знак |
множителя j i |
наложены условия |
||||
неположительности |
(14.26), еоли |
|
соответствувдее ограничение |
||||
С учетом |
этого |
обстоятельства табл. |
15 . I может |
быть ис |
|||
пользована и для задач |
с ограничениями. |
|
|
При формулировке достаточных условий оптимальности в пункте
14.6 использован функционал £ ' • , в |
подиятегральном |
выражении |
ко |
||||||
торого каждой |
связи |
соответствовало |
слагаемое |
1^>. |
По форме |
это |
|||
•слагаемое |
отличалось |
от |
PC g |
только темчто в функцию ji |
вво |
||||
дилась зависимость от переменных задачи. Ввиду этого нет нужды |
|||||||||
находить |
слагаемые |
Q t g |
для |
различных форм связей и составлять |
|||||
отдельную |
таблицу. Можно брать |
/?(^из табл. |
15.1 |
и вместо |
|
||||
подставлять </1 \. |
4 |
) . |
|
|
|
|
|
||
Таблицу (15 |
.IJ можно использовать и при критериях оптимальности, |
||||||||
отличных |
от ( 1 |
4 . I ) . |
В качестве |
примера рассмотрим критерий вида |
|
|
|
4^[0,Т] |
|
|
|
|
|
|
(15.18) |
|
||
Аналогично дискретной |
задаче |
(.см.п. 12.5) |
перепишем |
выражение |
|
||||||||
U5.8) |
в форме |
двух |
условий |
|
|
|
г |
|
|
|
|||
|
S^p |
Т= |
|
|
|
|
|
/фс//} |
|
|
|||
В этих |
условиях |
|
- |
постоянный параметр, |
не зависящией |
от £ |
. |
||||||
Если целевой функции (14.I) |
в R |
соответствовало |
слагаемое |
|
|||||||||
^ 0 = - £ v c / i ^ ' |
т о |
Фуикционзлу |
|
в |
/? |
соответствует |
слагаё- |
||||||
причем , / / о 6 0 ~ |
0, |
а |
^ |
|
меняется в открытой области. Так как |
||||||||
в другие слагаемые |
R |
eg |
параметр |
% |
не входит, |
то условие |
ста |
||||||
ционарности )S> |
по |
~% |
приводит к |
равенству |
|
|
|
||||||
|
|
JJoftjdi- |
|
|
|
|
|
(15.19) |
|
||||
|
|
|
о |
|
|
|
|
|
|
|
|
|
|
Критерий, зависящий от конечного состояния объекта^
может оыть записан в форме (14.I)
Соответствующее этому критерию слагаемое в R
аь.21)
Наконец, критерию общего вида
I |
- f j . W i |
- |
т> |
|
соответствует |
|
|
|
|
|
|
|
(15.22) |
|
Здесь |
функции ^ 0 и |
цредполагаются |
непрерывными по |
совокуп- |
ноотн |
своих аргументов. |
|
|
|
|
Полученные результаты |
удобно свести |
в таблицу, аналогично |
|
табл.... 15. 1м |
|
|
|
|
|
|
|
Таблица 15.2. |
|
& п/п |
Максимизируемый |
#0 |
I r p . |
И г р . |
|
функционал |
|
|
|
|
|
|
|
|
i . |
о |
|
/ . |
|
|
|
|
||
2? |
|
|
и |
У |
о |
|
|
|
|
3. |
|
|
|
|
« |
Ln/CyJJ |
|
|
|
|
4шт] |
|
|
|
При неполь8ованйн табл. 15 . I и 15.2 составляют функднш
причем к переменным первой группы на интервале («//ауФ'Д/ относят лишь те нереиеннне', которые в /?„ и в каждой из ^с^# фигурируют, как переменные первой группы.
§ 16. Задачи со связями в форме дифференциальных уравнений. Необходимые условия оптимальности-:-
В природе очень многие процессы с достаточной точностью опи сываются дифференциальными уравнениями. Работы, посвященные опти мальному управлению объектами, характеризующимися совокупностью дифференциальных уравнений, составляют львиную долю общего числа работ по оптимальному управлению. Остановимся в этом параграфе на необходимых условиях оптимальности в задачах со' связями в форме
дифференциальных |
уравнений. |
|
|
|
|
|
|
||
16.1. Задача |
со свободным правым концом*. |
|
|
|
|||||
Пусть управляемая |
система |
описывается |
уравнениями |
|
|
||||
|
|
|
|
|
|
|
|
416.1) |
|
|
X |
|
^J^J |
|
|
Ра 1,2,.., Л |
|
||
Требуется |
перевести |
систему |
из |
заданного |
начального состояния .Х(О) |
||||
в п-мерном |
пространстве .^Чфазовом пространстве |
системы) |
в |
неко |
|||||
торое нефиксированное заранее состояние |
J^(T) |
за Время |
Т( |
кото |
|||||
рое также |
требуется |
г.тйти, |
|
чтобы функционал |
|
|
|
||
был максимален. Управленце |
|
^замкнутой и ограниченной |
области |
||||||
в ft] -мерном пространс'тве ~Ц~. |
Функции |
у£{ |
0 =* 0 , 1 , . . . rt ) |
предполагаются непрерывными по совокупности своих аргументов и не прерывно дифференцируемыми по У и т£~.
Наряду с системой из ?Z уравнений (16.I) запишем уравнение для (п+1)-й переменной - времени
УПН (TJ- свободно.
|
|
|
f56 |
|
|
для получившейся |
задачи |
запишем функцию |
/4?, пользуясь табл. |
||
I 5 . I . |
|
|
л |
|
|
Здесь вектор |
J/ |
имеет |
размерность (п+I,). Задача регулярна |
по |
|
и сингулярна |
по *Х . Выделим ту часть |
функции z^7 , которая |
зави |
||
сит от управлония |
|
^ |
|
|
функцию Н называют функцией Гамильтона по имени английского ученого использовавшего аналогичную конструкцию в задачах аналитической ме ханики.
Условия стационарности функционала Лагранжа /Sf по У и максиму ма по \4i примут в данном случае вид
у = 1,2,. |
. у / 1 |
U€- Vv |
(16.6) |
Наконец, уравнения связей ^16.1) также можно записать через функ цию Гамильтона
У
Таким образом, необходимые условия § 14 для данной задачи при водят к теореме 16.1 ( принцип максимума Понтрягина). Если У( l6 ) 'оптимальное управление, то существует такая непрерывная ненулевая
вектор-функция |
|
, удовлетворяющая (16.5), |
||
[что для любого |
момента 2Г |
выполнено условие |
(16 . б) . Из непрерыв |
|
ности^ft |
(•£ ) "и условия |
( 7Х ) = 0 |
(ом.табл. 15.1) следует |
|
что на границе |
интервала |
, |
|
yf(Tj= 0 |
а б . 7 ) |
.'5 7
Условие общности положения прииенительное к |
этой задаче означает, |
||||||
что |
множество |
Vu |
и уравнения (16.1) |
должны |
быть |
такими, чтобы |
|
траектория |
не была изолированной. Ее должны |
"окружить" |
допу |
||||
стимые траектории. |
|
|
|
|
|
||
|
Схема решения такова: |
|
|
|
|
||
1) |
из условий |
максимума Н определяется |
*Ц *~ , как функция ^ |
; |
|||
2) |
решав совместно (16.4) с условиями |
(16.7); (16.6) с условиями |
|||||
У(0)=Уи^ (16.5), |
паходят оптимальные и |
|
|
Задача |
|||
эта |
далеко не проста, так как граничные условия для дифференциальных |
уравнений заданы па различных концах траектории.Кроме того, нужно
одновременно с |
решением |
уравнений обеспечивать условие максимума Н |
|||||
по |
£•/ |
, Ниже в специальном параграфе мы остановимся |
подробнее |
на |
|||
вычислительном |
аспекте |
задачи. |
|
|
|||
|
Рассмотрим |
поведение |
функции Н вдоль решения, удовлетворяющего |
||||
необходимым условиям. Обозначим для кратности через |
вектор |
с |
|||||
составляющими |
^ |
, У |
. Из условия (16.5) следует [24 ] |
|
|||
Из |
этих |
неравенств |
получим |
|
|
Так как |
в е к т о р е |
и функция Н непрерывны^при |
Д-*-0) крайние члены |
в (16.8) |
стремятся |
к нулю, а значит к нулю стремится и приращение |
|
функции |
Н на оптимальном решении, что говорит |
о непрерывности Н по |
4 даже в точках разрыва управления.Это можно было предполагать, так как в момент переключения
1S8
Для всех моментов времени, кроме моментов разрыва управления,
функция Н дифференцируема по £. |
, |
прячем |
ее |
полная |
производная |
||
по ~£ |
равна |
частной. Действительно, для |
Н |
(У (U |
*)j^(^/г) |
||
Но из |
условий |
С16.Ъ), записанных |
в |
векторной |
форме |
( ^ а - ^ j j — |
следует, что сумма двух первых слагаемых в этом выражении равна нулю, так что полная производная
для любого допустимого управления при выполнении ^16.5). Иначе,
Pwc. /6. / |
-in- |
t |
Но на оптимальном управлении U. (4) при выполнении условий выбора
Правая же часть этого равенства равна нулю, так как значение функционала I при оптимальном выборе Т= / больше или равно зна чению этого функционала при Т = Т *" - S0 с гt~ И t - t + S t , откуда следует, что С = 0,' а
т
Т |
(?=/ |
, S9
Если, в частности, функции Jo и не зависят явно о* ~£ (система автономна), то на оптимальной траектории функция Гамиль тона тождественно равна нулю. Естественно, что для всех остальных допустимых управлений она неположительна.
16.2. Другие постановки задачи Д. Значение аргумента Т и состояния в конце процесса связаны
друг с другой. |
|
|
В остальном |
задача совпадает с п. 1 6 . I . Уравнение |
связи имеет ' |
вид |
|
|
. |
FfjCCrJ, Г) 'О |
Ц 6 . Ю ) |
Функция F предполагается непрерывной и непрерывно дифференцируе мой по совокупности своих аргументов.Запишем функцию & с учетом (16,10), пользуясь табл. 15.I , 15.2 •
+ |
JSrf- |
т;гм |
( 1 б Л 1 ) |
Здесь |
- ( Л + I ) |
- мерный вектор. Условия ее |
экстремума noJ^ |
С учетом |
того, что при |
-t |
> |
Т ^ |
|
уравнения |
в пределах |
o i |
^ |
s |
Т_до |
условиям |
|
|
|
|
|
|
у,(Т>) |
= Л Ъ |
У р |
|
( ^ « О , ннтегрироввниз этого * Т.,. приводи к краевым
(16.12)
|
|
|
р =1,2, .. |
|
Геометрически эти условия |
означают, что вектор W |
ъ момент Т |
||
ноллинеарвй |
градиенту функции F |
.Вектор же градиента нормален к |
||
поверхности |
уровня (16.10) |
функции |
Z 7 . |
|
Таким образом, PfTj$вжзв нормалей к поверхности |
=0. Условия |
|||
(16,12) называют условиями |
трансверсальности. Остановимся на |