книги из ГПНТБ / Васильев Ф.П. Лекции по методам решения экстремальных задач
.pdf260 МЕТОДЫ М И Н И М И З А Ц И И В Ф У НКЦ И О НАЛ ЬНЫ Х ПРОСТРАНСТВАХ [Гл. в
Подставляя полученное выражение в |
(15) |
и используя |
функцию |
||||||||||||
Н ( х , ф, и , |
t ) = — f ° ( x , |
и , *) + (Ф. f ( x> и> 0 )> |
получим |
следующее |
|||||||||||
представление для приращения функционала: |
|
|
|
|
|
||||||||||
|
|
т |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
A J ( u ) = — ^ [ Я ( х + Ал:, ф, u + |
h , |
t ) — Н ( х , |
ф, и , t ) \ d t + |
|
||||||||||
|
|
*0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
+ |
j*( |
дн{х’ 2 * u, |
t) |
’ |
Ax')d t + Rl- |
|
|
(17) |
|||||
|
|
to |
|
|
|
|
|
|
|
|
|
|
|
|
|
Из формулы конечных приращений следует |
|
|
|
|
|
|
|||||||||
|
|
Н(х-\- Ах, ф, |
u + |
h, |
t) = |
H(x, ф, и, |
t)-f- |
|
|
|
|||||
^ d H (x + Q A x , |
ц + |
е/г, t) |
|
|
|
^ дН (х + 6Д х, |
ф , u + Qh, |
t) |
^ |
||||||
О < 0 < 1 . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Подставим это равенство в |
(17); будем иметь |
|
|
|
|
|
|
||||||||
|
AJ |
(“) = — ]" ( - |
dH(x(t), |
ф (<), |
ц (0, t) |
, |
hittydt + |
R, |
(18) |
||||||
|
|
|
ди |
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
где |
R = R 1 + R2 + RS |
|
|
|
|
|
|
|
|
|
|
|
|
||
^ |
_ |
Г / д Н ( х + 8Ах? ф , |
и+ М, t) |
|
дН (х, ф , |
и, t) |
д \ |
^ |
|||||||
|
2 |
J \ |
|
дх |
|
|
|
|
|
|
дх |
’ |
|
J |
|
|
|
^0 |
|
|
|
|
|
|
|
|
|
|
|
|
(19) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
^ |
^ ^ д Н ( х + В Ь х , ф , |
и + №, t) |
, дН (х, ф , |
и, t) ^ ^ |
^ 0 ) |
|||||||||
Оценим остаточный член в формуле (18). Так как |
|
|
|
||||||||||||
|
|
|
|
дх |
|
дх |
|
дх |
’ |
|
|
|
|
|
|
то с учетом условий Липшица (6 ), (7) |
имеем |
|
|
|
|
|
|||||||||
|
|
|Д. I < |
(1 |
+ \ Ш L J |
( I Ах I2 + I Аде IIАI) dt, |
|
|
|
|||||||
|
|
|
|
|
|
to |
|
|
|
|
|
|
|
|
|
где [ф||с= |
sup |ф(£, ы )| < оо |
в |
силу |
непрерывности |
ф(/, |
и) на |
|||||||||
§ |
3] |
Задача |
оптимального |
управления со свободным |
правым |
концом |
261 |
|
|
|
|
|
|
|
|
||
[4 |
, Т] (напоминаем, |
что |
в наших рассуждениях |
u = u ( t ) |
— |
|||
фиксированное управление из UCZL%*[t0, Т]. |
Аналогично, с уче |
|||||||
том условий |
(8 ), (9) из |
(20) |
будем иметь |
|
|
|
||
|Я3| <( 1 + № b ) A j ( | A * | | A | + |/i|2)<#.
*0
Следовательно,
|Я |<А |Д *(Г)|2 +(1+||ф||с)А j(\Ax(t)\ + \h(t)\)*dt. (2 1 )
to
Для дальнейшей оценки остаточного члена R формулы (18) нам понадобится одна лемма, которая часто приводится в курсах лекций по обыкновенным дифференциальным уравнениям и из вестна как лемма Гронуолла.
Л е м м а |
1. Если |
функция <p(^)^Li[4, |
7] |
и |
удовлетворяет |
||||||
неравенствам |
|
|
|
|
|
|
|
|
|
|
|
0 < |
Ф (t) < |
а + |
b j |
cp (г) dr, |
t0 < t < T , |
a, b — const > 0, |
(22) |
||||
то верна |
оценка |
и |
|
|
|
|
|
|
|
|
|
|
Ф(t) < aeW -U , |
|
|
|
|
|
|
||||
|
|
о < |
*0 < * < 7 ; |
|
|
|
(23) |
||||
если же |
|
|
г |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0 < ф ( 0 < а + |
6 j<p(t)dT, ■ / „ < * < 7 a, b = |
const> 0 , |
(24) |
||||||||
то верна оценка |
t |
|
|
|
|
|
|
|
|
||
0 < |
Ф( 0 < а е 6<г-'>, |
t0 < t < T . |
|
|
|
(25) |
|||||
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
t |
|
|
|
|
Д о к а з а т е л ь с т в о . Обозначим R(t) = |
b ^ y (x )d x . |
С учетом |
|||||||||
|
|
|
|
|
|
|
*0 |
|
|
|
|
(22) имеем R = bq>(t) ^ .b ( a + R ( t ) ) , или R— b R ^ a b . |
Умножая обе |
||||||||||
части этого неравенства на е_6(<—<о), |
получил! |
|
|
|
|
||||||
|
|
|
|
(Re~b^i~i^) ■< аЬегьУ—*°). |
|
|
|
|
|||
Интегрирование этого |
неравенства |
от to до |
t с учетом |
R (to)—0 |
|||||||
приводит к оценке |
|
|
|
|
|
|
|
|
|
||
0 < R (t) er-W-M |
а — ае— |
#0)> ИЛИ о < R (t) < аеь^-^ — а . |
|||||||||
3 6 2 МЕТОДЫ М И Н И М И З А Ц И И В Ф У НКЦ И О НАЛ ЬНЫ Х ПРОСТРАНСТВАХ [ Г л . 6
Отсюда |
и-из |
(2 2 ) сразу |
получаем |
(23). |
Оценка (25) |
выводится |
||||||||
из (24) |
аналогично с помощью функции |
|
|
|
|
|
||||||||
|
|
|
|
|
|
г |
|
|
|
|
|
|
|
|
|
|
|
|
R (t) = |
Ь J |
ф (т) dx. А |
|
|
|
|
||||
|
|
|
|
|
|
t |
|
|
|
|
|
|
|
|
Продолжим доказательство теоремы 1. Из соотношений (14) для |
||||||||||||||
Лх (t) с |
учетом условия (4) |
имеем |
|
|
|
|
|
|
|
|
||||
|
|
|
t |
|
|
|
|
|
t) — f(x , |
и, /)]<#!< |
|
|||
|
|Да-(0 |
1= |
[ J |
[/(а- + |
A.v, и + |
А, |
|
|||||||
|
|
|
*0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
<L^ \ & x{t)\ dt + L^\h(t)\dt. |
|
|
|
||||||||
Приняв в (22), |
(23) |
tО |
|
|
|
|
^0 |
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
г |
|
|
|
|
|
|
|
Ф (0 = |
|Лл-(0|, |
a = |
L^\h{t)\dt, |
b — L, |
|
|
|||||||
придем к оценке |
|
|
|
|
|
to |
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
т |
|
|
|
|
|
|
|
|
|
|
|
I А *(9 |
К |
Ci §\h(t)\dt, |
C ^ L e ^ |
- ' •>, |
t0 < t < T . |
(26) |
|||||||
Воспользуемся |
неравенством |
Коши — Буняковского |
и |
перепишем |
||||||||||
оценку |
(26) в |
виде |
|
|
|
|
|
|
|
|
|
|
|
|
|
|Дл- (/) ||с = |
шах |
|Дл- (0 |
1< |
Сх V T |
- 101|h (t) |(r). |
(27) |
|||||||
Подставим полученную оценку в |
(21) |
и окончательно получим |
||||||||||||
|Я| < С .2|h ( t ) f L(r). |
Таким образом, |
в формуле (18) для прира |
||||||||||||
щения функционала |
первое |
слагаемое — линейный |
относительно |
|||||||||||
h(t) ограниченный функционал на |
|
|
Т\, |
а второе слагаемое |
||||||||||
имеет порядок ||M9f |
Согласно |
определению 1.1 |
это |
означа- |
||||||||||
|
|
|
|
l 2 |
|
|
|
|
|
|
|
|
|
|
ет, что функционал ( 1) при условиях (2 ), (3) дифференцируем и
его градиент имеет вид ( 1 0 ). А |
|
||||
Итак, для вычисления градиента функционала |
(1) при усло |
||||
виях |
(2 ) в точке |
u = u ( t) ^ U нужно последовательно решить две |
|||
задачи |
Коши: (2) |
и |
(12), (13), и найденные при |
этом x(t) = |
|
= х |
(t, |
и), ф (^)=ф (£, |
и) подставить в (10). При решении упомя |
||
нутых задач Коши можно использовать различные приближенные методы [2 0 ].
Формулы градиентов функционалов в задачах оптимального управления, связанных с системами обыкновенных дифференци
§ 3] Задача оптимального управления со свободным правым концом 263
альных уравнений, содержащих параметры и запаздывающие ар гументы, можно найти в работе [35].
2. |
Зная формулу |
градиента, |
нетрудно |
расписать |
метод |
|||||||||||||
пп. 1— 5 из § 2 применительно к задаче |
(1) — (3). |
|
|
|
|
|
|
|
||||||||||
Например, |
метод проекции |
градиента |
здесь |
будет иметь вид |
||||||||||||||
|
|
|
|
|
|
дН (х (t, иП), |
т|з(<, ип), |
un (t), |
t) |
> |
|
|
||||||
ип+ 1( 0 = |
Ри ( и п (i) + ап |
|
|
|
ди |
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
п = 0, 1, |
.... где а „ > 0 |
выбирается, как в п. 2 § 2. Пусть здесь |
|
|
||||||||||||||
U = |
{u = |
u(t) 6 l£> Ro, |
Т ]: ос; (/) < u£(t) < р; (0, |
tb < |
t <7\ |
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(28) |
|
где |
рi(t) — заданные кусочно-непрерывные функции, |
|
|
|
||||||||||||||
^]р,-(/), |
|
|
t'='l, 2,..., |
г. Нетрудно видеть, |
что множество |
U |
||||||||||||
выпукло, замкнуто и ограничено в |
L 2r)[t0,( |
Т] |
и, |
следовательно, |
в |
|||||||||||||
силу теоремы 1.2 слабо компактно |
в 4 г) |
Т\- |
Проектирование |
|||||||||||||||
на множество |
U осуществляется очень просто: если функция |
|
|
|||||||||||||||
|
|
|
z(t) = |
(z4t), . . . , |
2T (t))eL ir)[t0, |
Т], |
|
|
|
|
|
|
||||||
то ее проекция |
Риг = |
{px{t), |
..., |
pr(t)} |
на |
множество |
U |
имеет вид |
||||||||||
|
z£(t), |
если |
щ (^) < 2/(/) < |
Р; (t), |
|
|
|
|
|
|
|
|
|
|||||
Р; (0 = |
a.i{t), |
если |
z£{t)<^ai(t), |
|
|
|
|
|
|
|
|
|
(29) |
|||||
|
М 0 > |
если |
2 *'(0 > P i ( 0 . |
|
|
|
|
i |
= l |
, 2 , . . . , |
г. |
|
||||||
Так же нетрудно выписать для множества (28) явное выражение |
||||||||||||||||||
для un (t) = {и'„(t), . . . |
, urn (t)} |
в методе условного |
градиента |
|
|
|
||||||||||||
|
|
|
- „ i ( 0 = | |
“ ><')• |
если |
|
|
|
|
. |
|
|
|
(30) |
||||
|
|
|
|
I |
Pi (0. |
если |
Ji(if) < |
o |
j |
|
|
|
|
|
|
|||
Л ( |
о |
- |
- |
|
»- )■%«) . о | |
u < t < T ' |
i = |
l |
j 2 .......... r . |
|||||||||
Для решения задачи (1) — (3) при каких-либо дополнительных условиях на фазовые координаты можно использовать метод штрафных функционалов. Например, если правый конец траекто-. рии закреплен, т. е. х(Т)=х\, то в качестве штрафа для такого ограничения часто берут Ph(u) = k\ x(T , u)-^xr| , если же имеются
264 МЕТОДЫ М И Н И М И З А Ц И И В ФУНКЦ И ОНАЛЬНЫ Х ПРОСТРАНСТВАХ [Гл. 6
фазовые ограничения Ai ^ .x i (t, и ) ^ В {, Л{, В и t = l , . 2 , |
— |
||||
известные константы, то штрафом |
может служить функционал |
||||
|
Т m |
|
|
|
|
Я* (и) = |
- j L ' J ^ exp {£(**(*, |
u) — Bt)(x!(t, и) — Л;)} dt |
|||
|
fo 1=1 |
|
|
|
|
Если функции f, f°, Ф удовлетворяют условиям теоремы 1 |
и P ft(u) |
||||
дифференцируем при условиях (2 ), (3), |
то функционал |
Д (ц ) = |
|||
= / (ы )+ Р й(ы) |
также дифференцируем при условиях (2), (3), и |
||||
для получения |
выражения для градиента |
Л ( “) |
можно |
восполь |
|
зоваться рецептами теоремы 1 . |
|
|
|
|
|
Следует сказать, что дифференцируемость |
функционала (1) |
||||
при условиях |
(2 ), (3) в теореме |
1 доказана при довольно жест |
|||
ких ограничениях на данные задачи. Очевидно, теорема 1 остает
ся справедливой, |
если |
в правых |
частях |
«неравенств |
(5) — (9) |
|||
вместо |Дх| взять |
о(1), |
вместо |
|Ди| |
взять |
|Ды|т, 0 < y = c o n s t^ l. |
|||
В этом случае для остаточного члена R формулы (18) нетрудно |
||||||||
получить оценку |
R = о(||Л|| (г>). |
В практических задачах |
такую |
|||||
оценку для R вачастую удается получить и при меньших ограни |
||||||||
чениях на исходные данные. |
|
|
|
|
|
|||
3. |
Приведем достаточные условия для того, чтобы |
гради |
||||||
функционала ( 1) |
при условиях |
(2 ), (3) |
удовлетворял |
условию |
||||
Липшица, которое фигурирует во многих теоремах различных ме
тодов минимизации. |
|
|
|
|
|
|
|
|
|
||
Т е о р е м а |
2. |
Пусть |
выполнены |
все |
условия |
теоремы |
1, и |
||||
пусть, кроме того, |
|
|
|
|
|
|
|
|
|
|
|
|/(*. и, |
0 I < A |
+ A I * I , |
|
Л , |
Л = const > |
0 , |
|
(31) |
|||
а множество U (3) имеет вид |
|
|
|
|
|
|
|
||||
|
U = { u = u ( t ) e L p [ t 0, |
|
T ]:u (t)e V (t) |
|
|
|
|
||||
почти всюду при |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(32) |
где V(t) — заданное множество из Ег, такое, что V0 = |
U |
V(t) |
|
||||||||
|
|
|
|
|
|
|
|
и<t<T |
при |
||
замкнуто и ограничено в Ег. Тогда градиент функционала |
(1) |
||||||||||
ограничениях |
(2) |
удовлетворяет условию |
Липшица на множест |
||||||||
ве (32). |
|
|
|
|
|
|
|
|
|
|
|
Д о к а з а т ел ь с т в о.. |
Распишем формулу ( 1 0 ) |
для градиента |
|||||||||
с учетом определения |
( 1 1 ) |
функции Н(х, ф, |
и, t): |
|
|
|
|
||||
|
д/°(*(<, |
и), u{t), t) |
^ |
^ |
. df (x (t, |
u), |
u(t), |
t) |
|
||
|
|
|
du■ |
|
|
' |
|
du |
|
|
|
u = u {t)£ U .
Задача оптимального управления со свободным правым концом |
265 |
Пользуясь условиями (8 ), (9), отсюда имеем |
|
||||||
|j' (и + h) - |
J ’ (и) |< L ( 1 + 1|ф(t, |
и) Iс) ( I Л* (О I + |
I h (t) |) + |
||||
df(x(t, |
u + h), u (t )+ h ( t ), t) J |
|^ |
+ |
u)(> |
|||
+ |
|
du |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
u(t), |
u(t) + |
h(t)£ U. |
|
|
|
Так как (a + |
b)2< 2 (a2 + b2), |
to |
|
|
|
|
|
||Г (u + |
h ) - |
J ' (и)Цг) < |4L2 (1 |
+ |
«Ц (t, |
и )H 2£ ( |b x (t) |2 + |
||
|
|
|
|
|
|
<0 , |
|
+ \h(t) \2) d t + 2 ^ 1
^0
d/(x(*’ u + ®' u + h ' t] |2 1Ife (t, u + h) —ij# , и) \Ч^'Ш
|
|
(33) |
Из этого неравенства видно, что |
для доказательства |
теоремы |
достаточно получить оценки |
|
|
\\x(t, и )В о < С „ |
\№(t, и)\\с<С3, |
(34) |
|ЧК<, u + h ) - y ( t , |
и )|Ь<С 4 ||/г(01^, |
(35) |
|
*0 |
|
где С2, С3, С4 — положительные константы,-независящие от выбо
ра и, u + h ^ U . В |
самом деле, тогда множество |
G = {(x , и, t) i |
|
]л:|^ С 2, ищ У 0, |
to^t^LT} |
ограничено и замкнуто |
в E nX E TXEi. |
Поэтому |
|
|
|
|
sup d f( х, |
и, t) < М < + оо, |
|
вда
иподставляя оценки (27), (34), (35) в неравенство (33), получим условие Липшица для градиента.
Приступим к доказательству оценок (34), (35). Из условий
(2), (31) имеем
|
t ■- |
|
|
|
|x(t, и)\ = |
\х0 + § f(x (x , |
и), и(х), |
т) dr К | 1 + |
|
|
to |
|
|
|
|
|
|
t |
|
+ |
A1( T - t 0) + |
A2 |
$\x(x, |
u)\dx. |
|
|
|
10 |
|
Полагая в (22), (23) cp(?)=s|;e(*, и)|, a = .|л:0 14 -Л 1 (Т— /0), Ь = А 2,
266 МЕТОДЫ М И Н И М И З А Ц И И В Ф У НКЦ И О НАЛ ЬНЫ Х ПРОСТРАНСТВАХ [Гл. 5
сразу придем к первой из оценок (34) с С2 = ( |л:01+ A i(T — ^0))ехр (А2(Т— 10)) независимо от выбора u = u ( t ) e U .
Далее, из (12), (13) имеем
И?(*. « )1 |
= |
|
дФ (х (Т , и)) |
i f f |
д/° (х (т , и), и (г), т) |
|
||||
|
дх |
+ J [ |
|
дх |
|
|
||||
|
|
|
|
|
|
|
||||
|
|
— 1|з(т, и) |
Гд/(х(т, и), и (т), х) |
йт\ |
|
|
||||
|
|
|
дх |
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
Так как |
непрерывные функции |
дФ I |
1 d f0 1 |
IIJ L |
ограниче- |
|||||
|
|
|
|
|
|
дх |* |
1 дх Г |
II дх |
|
|
следует |
|
|
|
|
|
|
|
|
|
|
|
IФ {t, |
|
|
|
|
т |
u)\dx. |
|
|
|
|
ы )| < М (1 |
+ Т - д + М | | ф ( т , |
|
|
||||||
|
|
|
|
|
|
|
t |
|
|
|
Полагая в (24), |
(25) |
<р(0 = |
|ф(^, и)\, а = М ( \ + Т — t0) , b = M , полу |
|||||||
чим вторую оценку (34). Наконец, полагая Дф (£)=ф (£, |
u + h ) — |
|||||||||
— ф(£, и) |
из |
(12), |
(13) с |
учетом |
неравенств |
(5)— (7) |
и |
ограни- |
||
ченности |
^ |
^•< М на G, будем иметь |
|
|
|
|
||||
|
дх |
|
|
|
|
|
|
|
|
|
|AiKOI<L|Ax(T)| + L (l + | Ж t, и)Цс). J ( I Ajc(0 I + IА (О I) ^ -h
м ||А Ф(*)| dr.
Подставляя сюда оценки (26), (34), придем к неравенству
| Аф ( 01 < С 6 j \ h { t ) \ d t + M J /Aife(x) |dr.
Для получения оценки (35)' остается принять в (24), (25)
ф(0 = |Дф(0|, |
a = C5 $\h(t)\dt, Ь = М . А |
|
*0 |
4. Воспользуемся некоторыми формулами, полученными при |
|
доказательстве теоремы |
1, и дадим простое доказательство прин |
ципа максимума Понтрягина для задачи (1) — (3), (32).
§ 3] |
Задача оптимального управления со |
свободным правым концом |
267 |
|
Т е о р е м а 3. Пусть функции f°, |
f, Ф непрерывны по совокуп |
|
ности своих аргументов вместе со своими частными производными
по переменной х и удовлетворяют условиям |
(4) — (7), |
и пусть |
|||||||||||
множество V(t) |
из (32) |
не зависит от t : V(t) = V, |
t0^ .t^ .T . Пусть |
||||||||||
управление u ( t ) e U |
и соответствующая траектория x ( t ) ^ x ( t , и), |
||||||||||||
t o ^ t ^ T , образуют |
оптимальное |
решение задачи |
|
(1)»— (3), |
(32). |
||||||||
Тогда |
|
|
|
|
|
|
|
|
|
|
|
|
|
H (x{t); |
ф(*), |
u(t), |
t) = |
max H{x{t), |
ф(*), |
и, |
f), |
|
(36) |
||||
|
|
|
|
|
|
|
uSV |
|
|
|
|
|
|
где H(x, ф, u, t ) = —f°(x, u, |
t) + |
(ty, f(x, u, t)), а ф(^) является ре |
|||||||||||
шением задачи |
(12)— (13). |
|
|
|
|
|
|
|
|
|
|
||
Д о к а з а т е л ь с т в о . |
Подставим в формулу |
(17) |
разложение |
||||||||||
щ х + Ах, ф, u + h , t) — H (х, ф, u + h, t) + |
|
|
|
||||||||||
+ ^дН(х + B bx.J. u + h , |
t) > Axy |
o < |
0 < |
1. |
|
|
|||||||
Получим |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
T |
|
|
|
ф (t), |
|
|
|
|
|
|
|
|
AJ (u) = |
— ^[H (x(t), |
U(t) + h(t), t) — |
|
|
|
|
|||||||
|
to |
|
|
|
|
|
|
|
|
|
|
|
|
—H{x(t), |
ф(£), u(t), t)]dt + R, |
|
|
|
|
|
(37) |
||||||
где R = R i + R 2, R i в з я т о |
и з |
|
(16), |
R2 определяется |
формулой вида |
||||||||
(19). Справедлива оценка |
|
|
|
|
|
|
|
|
|
|
|||
|R |< L |Ах (Г) |2 + |
(1 + |
|ф||с)L J ( |Ах (t) |2 + |Ах (t) |\h{t)\)dt, |
|||||||||||
|
|
|
|
|
|
|
to |
|
|
|
|
|
|
получаемая так же, как и оценка |
(2 1 ). Используя |
оценку. |
(26), |
||||||||||
имеем |
|
|
|
|
|
|
|
|
|
|
|
|
|
т |
|
t j , |
|
св = |
LC\ + (1 +IIФlb) [с? (Г- g |
+ |
l . |
||||||
IR I< Сву |h it)Id |
|
||||||||||||
to |
|
|
|
|
|
|
|
|
|
|
|
|
(38) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Доказательство |
равенства |
(36) |
проведем в |
предположении,, |
что |
||||||||
u(t) — кусочно-непрерывна на [ д |
Г] (для определенности можно |
||||||||||||
считать |
|
|
|
|
|
|
|
|
|
|
|
|
|
и(*о) = и(*о + |
0), |
|
u ( t ) = u ( t — 0), |
t0< t * £ T ) . |
|
|
|||||||
Пусть равенство (36) не имеет |
места при некотором т е [ д |
Г ]. |
|||||||||||
Тогда существуют такие »e |
F и |
а = const> 0 , что |
|
|
|
|
|
||||||
Н (х (т), ф (т), v, т)— 2а > Н (х (т), ф (т), и (т), т).
268 |
МЕТОДЫ |
М И Н И М И З А Ц И И В Ф У НКЦ И О Н АЛ ЬН Ы Х ПРОСТРАНСТВАХ |
[Гл. 6 |
Так |
как u(t) |
кусочно-непрерывна, a x(t), гр(^), Н(х, гр, и, |
t) не |
прерывные функции своих аргументов, то |
|
||
g(t)&=H(x{t), ф(0 , v, t) — H(x(t), т|з(0 , и (0 , t ) > a
на некотором отрезке t i ^ t ^ t 2, содержащем т. Возьмем прира щение h(t) специального «игольчатого» вида h ( t ) = v — u(t) при и h ( t ) = 0 вне [*i, t2]. Тогда из оценки (38) с помощью
неравенства Коши— Буняковского будем иметь
<. |
' |
и |
При этом можно считать t2— ^ > 0 столь малым, что
Св ||/г(0 1 3 ^ < а .
Из (37) тогда получим
А/(и) = — j g(t) dt + / ?< — о ( 4 — У + |Я| < (* * — У X
|
х [ - а |
+ |
Св||Л (012^ ] < 0 , |
|
|
||
что, однако, противоречит |
оптимальности управления u = u (t). |
||||||
Аналогично |
доказывается |
равенство |
(36), |
если |
|||
u = u ( t ) ^ L 2) [to, Г ], |
u (< )eK , |
|
но |
u(t) |
необязательно |
||
кусочно-непрерывно. |
В этом |
случае |
условие |
u (t)^ V |
и равенство |
||
(36)следует понимать в смысле почти всюду на [То, Т]. Д
5.Остановимся на следующей задаче оптимального управ
ния, связанной с линейными системами: минимизировать функ ционал
|
|
J (и) = |
J /° (X, и, |
t)dt + Ф[(х (Т)) |
(39) |
||
при условиях |
|
|
|
|
|
|
|
|
x = A (f)x + |
B (t)u + - f(t), |
t0 < C t< T , |
x(t0) = x0, |
(40) |
||
|
|
|
u = |
u ( t ) e U ^ L V [ t 0, Т], |
|
(41) |
|
где х = |
(х1, . . . |
, хп), |
и = |
(и1, . . . , |
ur), U — заданное множество |
из |
|
Vp\tо. |
п |
|
|
|
|
|
|
A (t), B(t) — |
заданные |
матрицы |
порядка пХ п |
и п Х г соответст |
|||
|
Задача оптимального управления со свободным правым |
концом |
26ST |
|
венно, |
f(t) — известная вектор-функция; моменты t0, |
Т и началь |
||
ная точка Хо заданы. |
|
|
||
Т е о р е м а |
4. Пусть f°(x, и, t), Ф (х) определены при х е £ п, |
|||
и ^ Е г, |
Т], |
непрерывны по совокупности своих |
аргументов |
|
вместе с частными производными по переменным х и и, и выпол нены условия Липшица (5), (7), (9); пусть компоненты матриц A(t), B(t) и вектор-функции /(.*) кусочно-непрерывны на [£0, Т]. Тогда функционал (39) при условиях (40) непрерывно дифферен
цируем в L p [ t 0, Т], |
и его градиент /'(«) |
в точке |
|
|
|||||||
|
|
|
u = u ( t ) £ L 2{ |
[t0, Т] |
|
|
|||||
вычисляется по формуле |
|
|
|
|
|
|
|
||||
|
J ' ( u ) = |
^ °(*(0 . |
и(Ц, |
t)----- t0 < t < T , |
|
(42) |
|||||
|
|
|
|
ди |
|
|
|
|
|
|
|
где x(t) = |
x(t, и) |
решение задачи |
(40) при u = u(t), ф(г!) = |
ф(г!, и)— |
|||||||
решение задачи |
|
|
|
|
|
|
|
|
|
|
|
Ц = |
u(i)> |
----- АГт , |
t0 < t < T , |
$ ( T ) = - - |
дф(* (Т)) - . |
||||||
|
дх |
|
|
|
|
|
|
|
|
|
дх |
|
|
|
|
|
|
|
|
|
|
|
(43) |
матрицы |
A *(t), |
B*(t) |
получены |
транспонированием |
матриц |
||||||
A(t), B (t). Кроме того, |
градиент |
Г {и) |
удовлетворяет |
условию |
|||||||
Липшица на Lir)[t0, Т]. |
|
|
|
|
|
|
|
|
|||
Д о к а з а т е л ь с т в о . |
Справедливость формулы (42) |
устанав |
|||||||||
ливается |
дословным |
повторением |
доказательства |
теоремы 1. |
|||||||
Далее, из формулы (42) по аналогии с (33) здесь получим |
|||||||||||
\J' (u + h) - |
J' (и) Ц г) < |
{4U J |
( |Дх ( 0 12 +| h (t) Р) di + |
||||||||
|
|
|
|
|
|
|
to |
|
|
|
|
|
|
+ |
2su p rl|5*(0IP ||Аф(0 |
Р ^ } 7'. |
|
|
|||||
|
|
|
|
|
|
|
to |
|
|
|
|
Отсюда видно, что |
для |
|
доказательства |
выполнимости |
условия |
||||||
Липшица для градиента /'(и) достаточно получить оценки (26), (35). Оценка (26) для |Дх(£)|, очевидно, справедлива и здесь, причем в качестве константы Сь как нетрудно проверить, можно
взять Ci = Дша^ехр (Лт ах (Т— /0)), |
где |
|
|
Апах ” sup |
IIA (t) II, |
Bmax = |
sup IIВ (t) ||. |
(0« < Г |
|
|
/0 |
Далее, для Дф(/)==i|)(£, |
u + h ) — ф(£, и) |
из (43) с учетом условия |
|
(7) будем иметь |
|
|
|
