![](/user_photo/_userpic.png)
книги из ГПНТБ / Осипов В.М. Математические основы кибернетики. Начала вариационного исчисления и элементы теории оптимального управления учеб. пособие
.pdf
|
|
|
- 83 - |
|
т |
т |
|
|
|
è' " |
С |
П |
*ft-(*+tx>û+ ^V -А(*'й> 1и р/£ • |
|
[ I л^Н- ^: |
J |
|||
Преобразуем интеграл |
слева. Очевидно, |
|||
с/" |
*хі = |
Г |
" |
| Vi fài • |
Зі^Ч |
J-, |
П <Ѣ + |
||
Гавтѳгрнруя в тех же пределах |
найдем: |
|||
|
Г |
т |
|
тп |
откуда |
|
|
|
|
|
|
|
|
|
г |
|
. |
Г |
г „ |
|
|
|
J X vi А ^ » Ъ Л;- / - J £ ^ А |
|
|
||||||
ледозательно, |
|
_ |
|
|
|
|
||
|
T |
T |
|
' |
|
|
|
|
|
te |
|
|
-6) |
|
|
|
|
Рассмотрим выражение в левой |
части |
равенства |
|
|
||||
|
*, |
*»' |
|
|
|
|
|
|
£x{tj*0 |
fi '- *Лі-п), |
левый конец закреплен , |
|
|||||
|
^г/ - " Q |
согласно граничного |
условия на правом конце |
|
||||
л S |
- приращение функционала S, |
обусловленное |
вариацией |
управ |
||||
|
ления в |
районе оптимального, т . е . л S - отклонение от |
||||||
|
экстремального |
значения. |
|
|
|
|||
Таким образом, |
^ |
|
|
|
|
|
||
-AS'H |
Vi A dt * Il |
Vi [f( |
(x+tx. Û+fa. t)-к |
Ix, Ü, ij] |
dt |
Предполагая малость вариации <fx , разложим выражение в скоб ках в ряд Тейлора, ограничиваясь линейными членами:
/г (x+àx, |
J+iïu. |
|
t)-fi(x~,Û,i)*(£,u+tu,i)-fi(x,U,i)*. |
|
t У — — r |
|
OX; . |
|
|
получим главную часть приращения по траектории. |
||||
ІІодиятегральная функция теперь запишется в |
виде |
|||
л |
|
|
п |
|
-fc(x-,û,é;] |
+ l L |
Vi — |
^ * / |
• |
Исли теперь учесть, что (в силу уравнения Эйлера для Ф,- )
то |
выражение для |
/і S |
можно представить так |
|
|||||||
à |
S |
-- |
f I |
ъ [fi |
(x,u+£u,tj-fi(x,ü, |
|
iß dt |
- |
|||
- |
I |
I |
f ^ è |
[hl£,u+tu,t}-fit£At)]<tx. |
|
|
dt |
||||
Предположим для простоты, |
что |
J- (£,Û,iJ |
есть линейная функ |
||||||||
ция относительно |
-X |
, |
т . е . |
|
|
|
|
||||
тогда |
|
|
|
|
|
|
|
|
|
||
|
|
|
|
дх~; |
|
|
|
|
|
|
|
|
|
|
|
"7 |
|
|
|
|
|
|
|
и второй интеграл |
в выражении |
для |
Л S |
будет |
равен нулю. |
||||||
Для оассматоиваемого |
случая à. S получает вид |
|
|||||||||
|
|
|
Ï я |
ifi |
fr |
о* |
<tu, éJ-J |
(£, |
ü, |
ißdt |
|
|
|
|
|
i» "!
или, если учесть, что
n
Н(х\ V, u,tj "g-Vi/i fa и, ij,
получим
i S - - [ [И |
fa % û*(ft/ti) |
- M fa. К à, tj] |
di |
|
и |
|
|
|
|
Это выражение |
справедливо |
для любого интервала |
Т- to |
в том |
числе к для весьма малого, поэтому знак интеграла должен сов- „ падать ос знаком шдинтегральной функции в любом случае. До
статочным |
условием минимума целевого функционала |
5 |
является |
|||
требование |
^ $>0 |
4 а для |
втого необходимо |
чтобы |
|
|
\ |
ß |
Г g |
независимо от |
знака |
Л / |
, а |
\L это означает, что оптимальное
—* управление и доставляет макси- х(3}?',<и,г/ мум гамильтониану А"'
|
|
HfoffitimJ |
И - Wax. |
Я. |
|
||
|
|
f \ |
Наоборот; |
если требуется |
макси |
||
|
|
|
мизировать |
целевой функционал, |
|||
|
|
" |
то |
для этого |
необходимо |
требова- |
|
. |
„ |
PSG.I5 |
|
|
|
|
|
ние 4 - |
<и t |
что приводе? к |
условию |
|
|
|
|
M |
fa |
¥,ü+ fa. é/~ |
Ufa |
Ф, Û, éj |
•» О, |
|
т . е . в этом случае оптимальное управление доставляет минимум гамильтониану. (Рис.15)
Заметим, что эти вывода сохраняются полностью и для случая не линейных дифференцйельнж сравнений. Доказательства в этом слу чае оказываются весьма сложными и мы их опустим, итак мы полу чили следующую теорему, выражающую знаменитый принцип максиму ма ШнтрягЕка:
"Если управление иfi J минимизирует (максимизирует) функционал
S~ У Ct Я; (fj |
, 2 о оно удовлетворяет условию максимума (минк- |
мука) функции |
Гамильтона". |
Рассмотрим |
простейший примеL. |
|
- |
86 - |
|
Пусть требуется |
найти управление |
U.{tj г доставляющее мн- |
|
нимум ааігегралу |
g- jfx'+i/Jc/i, |
если уравнекке объекта шв- |
|
ет вид |
0 |
|
|
|
|
|
|
х*-ах:+и. |
x(ûj |
= х0? |
а на управление не наложено никаккх ограничений (т . е . об ласть допустимых управленай - неограничена)»
Введем новые переменные Z'., ~ X та
О
врезультате получаем систему
=- ах, + U - Л
Задача сводится к минимизации конечного значения координаты
Хг т . е . S= xt(rj.
Таким образом, в згой задаче
С,--О J G?/ .
Составляем гамильтониан (сначала сопряженную систему для У )
*=-44-У>-тагУг =d%~ХіЧ>г |
> |
*г10)~-0 |
Поскольку % °ß , |
т . е . |
•Canst „ то Vi--/ |
Условие максимума гамильтониана дает |
||
. Vf -Ù -- О |
т . е . |
й- УѴ |
|
|
|
- |
87 - |
|
|
Подет&эляя |
s |
уравнения |
объекта |
вместо U |
его значение, |
|
пожрчш систему |
<* - a so, * у, ; |
|
||||
|
|
X, |
|
|||
Решен»® имеет |
вид |
|
|
|
|
|
где Р) |
в |
ß |
- |
корни |
характеристического уравнения |
Такны образом, оптимальное управление определено
Û •- Vi '^е*** |
Di*** |
Постоянные Jr, , rfs s J>f ; |
1>г могут быть определены из гра |
ничных условий. Эта простейшая задача может быть решена обыч ным гпособоы, без использования принципа максимума, т.к. вся кие ограничения на управление отсутствуют.
Преимущества принципа максимума немедленно обнаруживаются при ааднчш органнчений на управления. В этом случае обычный под ход, основанный на классическом вариационном исчислении не применим,, в то время как принцип максимума остается справед ливым. Пры наличии ограничений на управления типа неравенств максимум гамильтониана достигается на границах множества до пустимых управлений и оптимальное управление принимает свои
граничные |
значения. |
В частности, |
это всегда имеет место, если |
|
s систему |
уравнений |
задачи |
функции U1,uti . . ^ в х о д я т линейно. |
|
Пусть, например, уравнения |
задачи |
имеют вид; |
х,--,лі,Vи, |
* cht --ft{X,, xt J*иг , |
|
|
|
|
- |
88 |
- |
|
|
|
|
а |
функции |
Lit |
и |
Ui |
ограничены по иодудюі, т . е . №<І й Mg |
|||||
и |
/(Уг/ ^ Mг . |
т . е . мнонество допустимых управяежяй - арямо- |
||||||||
уголышк. Гамильтониан имеет вид |
|
|
|
|||||||
|
U = 4*,/ /'•«'о -^А |
Уі /г (Xf.xJ* |
M |
* Щ Ug |
|
|||||
Поскольку |
У*, я |
% |
ш' C/f |
ш С/г есть функция времеш„ |
го |
|||||
ясно, что вяахсимум |
/ / |
по |
Ui ж Uf достнгаатсЯ(,коГА& |
CJ./ |
||||||
к |
„ а |
акже |
Ut |
ж |
% |
даеют |
одинаковые заакш,, щие- |
|||
том U, ы |
и. |
достигают |
своах иаксималькж: значений,, оя©- |
|||||||
дозательно |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Uс -Ma Signez • |
|
||
|
|
|
|
|
|
|
Таким образом,, те з а а д о т о с - |
|||
|
|
|
|
|
|
|
ты от того как ие&явтся во вр&- |
|||
|
|
|
|
|
|
|
меыш |
% ш % „ фуывдщв |
|
|
|
|
|
|
|
|
|
|
Е |
/ е / ûsorys ?ольв» |
|
|
-M, |
|
|
|
|
|
м пераклшатьслв о одаюгс |
гра |
||
|
|
|
|
|
|
ничного тшшзмия на другое. |
||||
|
|
|
|
|
|
|
Всиовюгатзлькое ёушщш ^ Д Ѵ
Рис.16
к fyfij определяют только моманти перекяючгкияо Щтщв шксяыума, вообще говоря, является необходвдш усжшуаш ош-
тгшальиостн. В одном вадндм частном случаи, когда урашеша задачи линейнш относніально коордшат, г. е.
и
J:f t *
принцип кадсішуша является se только необаодшым, ш и до статочный условием оптимальности.
-89 -
3.Принцип максимума для задач, в которых время движения не фиксировано заранее
Впредыдущем случае мы предполагали, что время, за которое нужно осуществить оптимальный процесс фиксировано,
т . е . |
правый конец каадои иэ кривой х< (t) |
, XißJ . . . . x„(i) |
может |
скользить по вертикальной прямой ~і-Т |
. Полученные |
резузьтаты должны, очевидно, оставаться в силе а в том слу
чае |
, когда время |
Т |
заранее |
se фиксируется. Действитель |
||||
но, |
если оптимальное |
время Т0 |
существует, |
то мокко |
рас |
|||
смотреть задачу |
с фиксированным временем |
Г* |
Т0 |
, что |
||||
свело бк задачу |
к |
предыдущей. Однако, поскольку |
велкчиыа |
иеЕзвзстка, необходимо ещё одно условие, которое позволило бк опред&дать Та
Из зарнационнсгс ясчжслѳкнк известно, что есле правый конец экстремаан за эакрезден, то вариация функционала обусловлен ная перемещением правого конца равна нулю. В нашем случае получаем ДДЕ Х- Сij ;
<f |
|
|
|
Пасколазу <f£ a |
d'xj |
~ произвоЕЬЕЫ, то |
получаем 2 равен |
ства |
|
|
|
Переходя к вавокЕчесхш переменЕнм будем иметь |
|||
H'lf*jXjjitr |
LVj |
(Щ (*(TJ, U(rjJ |
= О ; |
т . е . 4>.(r}*-Cj |
(j*i.*.---nj |
||
Это условие мы уже использовали- |
|
||
Итак, если |
время не фиксировано, |
то г&ѵмльтониан в конце |
|
движения должен быть равен нулю |
|
||
И = £ Ч>, (rjsc;(rj |
sc., (rj*- (с, à(rjj« о , |
||
т . е . векто |
скорость si? (Tj |
в конце двгыкенжк должен Зкть |
|
ортогонал! t направляющему вектору |
С „ Это значат„ чяо |
<?'
ІУ. ЗАДАЧА О МАКСИМАЛЬНОМ МгТРОДЕЙСШИ
I . Постановка задачи. Решение иеесдом аранцииа г*зйсимумао
Пусть задан объект „ описываемый систерязй дафйзретщаньшх ypasнений
Требуется найти такое управление из облас?Е довуеташк, soroрое переводило бы объект из начального состояния sefto/s^:9 в конечное se(7j-sz' за минимальное аремя. Требуемся, яакш образом, минимизировать функционал У - j dt
Очевидно, условие экстремума этого функцкоиаяа остаекоя преж
ним, |
если |
его запишем s |
зидз |
|
|
|
|
d |
felt |
|
|
где |
Ы. - |
некоторое положительное чжсло (К |
. |
||
|
Введем новую фазовую координату ssmi |
=«.< j |
аЛК |
||
|
= |
и добавим к системе уравнений |
ещё одшо |
гн
-У1 -
Функционал получав? вид
следовательно. Г,, |
= Сг |
= .... |
Сп |
= Oj |
С^, |
= |
1 . |
|
||||
Задача |
отличается |
от іфедыдущих„ тем что конечное состояние |
||||||||||
о б ы ж т |
заданор а |
время |
не фиксировано. |
|
|
|
|
|
|
|||
Находим вспомогательные |
переменные |
|
|
|
|
|
|
|||||
^ ' . „ Т Ѵ . М |
(\*{.г,...п) |
Ф„.,--0; |
|
--Ccast |
|
|||||||
7 |
tri |
1 ?*/ |
' |
|
|
|
|
|
|
|
|
|
|
|
|
|
m |
|
|
|
|
|
|
|
|
Граничные |
условия. УѴ'"- ^/ 0 = |
п- |
|
У н е |
н е |
имеют |
||||||
место, т.к. они получены для свободного правого |
конца |
у |
нас |
|||||||||
зе |
он фиксирован. |
Но граничное условие |
% * t (TJ = -i |
- - |
СП,/ |
|||||||
сохраняется т.к. |
правый конец координаты |
Х П |
І 1 |
как |
|
|||||||
функции времени остается |
свободным. Найдем |
гамильтониан |
|
Оптяшдькое управление найдется из условия максимума гамиль тониана
-moss. Й иеЦ
т^е. |
вС можно не учитывать (т . е . можно не учитывать |
хпН |
) , |
||
а граничные условия кмеют вид |
|
|
|||
х(Ь) |
*х° І |
X(TJ --xr, |
Z Vi (TJft [x(r/M(rJ, |
rj*et |
|
или |
ß-/(rj |
>0, |
|
|
|
т.к. произвольное числа oL>0 . |
|
|
|||
Рассмотрим пример. |
Объект управления описывается урав |
||||
нением |
|
|
|
|
- 92 -
Требуется найти алгоритм управления,, переводящий объект из
положения |
x(oJ' = о, |
x(ûj=0 |
|
(т . е . из состояния |
покоя) в |
|||||
положение |
х(т)'• |
x r |
; |
x(Tj s |
о |
за |
минимальное |
врелет.. |
||
Ils управление U |
наложено |
ограничение- |
/и/ * |
t-'max |
. За |
|||||
пишем уравнение |
объекта |
в |
виде |
системы |
( X, = х |
) |
|
или |
|
. |
* |
ь |
и |
|
|
jf-l-J. |
1 - -h9Lt ! ' |
|
|
ê-l |
• |
||
|
ai |
ail |
|
|
' |
G>J |
|
Находим вспомогательные |
переменные |
|
|
||||
Ъ -'К |
?x~t |
Г г |
Эя, |
- |
а, Ъ |
|
|
ИЛИ
Ч>=-Ж-Чч |
J -- / / |
_ St j |
|
L |
at •' |
Составляем характеристическое уравнение для полученной системы
\ Р ~Wl |
I - pfP- |
: рг- |
+ -L- -О |
Характеристическое уравнение можно получить из характеристичес кого уравнения объекта, если у коэффициента при Р изменить знак.
Пусть корни характеристического уравнеші/.- будут /і и Ѣ