книги из ГПНТБ / Иоффе, А. Д. Теория экстремальных задач [учеб. пособие]
.pdf§ 2.4. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА |
151 |
Для уравнения
X = ф (t, X, 1>)
разрешима в окрестности точки (т, лс*{т)), вектор-функ ция xk(t) определена и на отрезке [т — X, т], если X до статочно мало.
Коль скоро управление ы*(0 непрерывно в точке т, оно непрерывно и в некоторой ее ^-окрестности. Поэто
му и Xz(t) непрерывна в этой |
окрестности и, следова |
||
тельно, |
|
|
|
** (т) = |
X' (т — к) + |
Хх, (т — X) + |
о (X) = |
= |
xt (т — X) + |
А,ф(т — X, х„ (т — X), и,(х — X)) -(- о (X). |
Точно так же
xk( x ) = x t (т — X) + Яф(т — X, Х ' ( т — Х), v) +о(А).
Отсюда следует, что предел
Х 1 (т) — А, (т)
у(т) == lim
л^ о
существует и равен
г/(т) = ф(т, xf (x), v )— ф(т, .г,(т), u , ( t )). |
(18) |
На отрезке [т, t\)I иих*(. (-•), , ииххлгх(-()-) удовлетворяют урав нению
х = q>(t, х, н,(0)-
Из теоремы о непрерывности и дифференцируемости решения дифференциального уравнения по начальным данным следует, что при достаточно малых X > 0 век тор-функции xk(t) определены на [т, Л], сходятся равно мерно к х*(/) и предел
|
|
y{t) = lim |
хк(0 — X, (t) |
|
||
|
|
|
_ |
|
||
|
|
к+ о |
|
|
|
|
существует при |
всяком / е |
[т, ^]. Имеем при t > т |
||||
|
|
|
t |
|
|
|
|
Xl(t) = |
Xk{x )+ |
J ф(5, |
xx(s), |
u,(s))ds, |
|
|
|
|
t |
|
|
|
bUJJ |
x, (0 = |
-V. (т) + |
J |
Ф(s, |
X, (s), |
u, (s)) ds, |
|
|
T |
|
|
|
|
|
|
|
|
|
|
152 ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
так |
что |
|
|
|
^ (0 - *. (О |
|
|
|
|
|
X |
t |
|
|
|
xx ( t ) — X, (т) |
qp(s, хк (S), и, (s)) — ф (s, х„ (s), и, (s)) |
^ |
|
— |
t С |
|||
Я |
+ J |
X |
a s ' |
|
|
|
X |
|
|
Переходя к пределу при А | 0, получаем
t
y(t) = У (т) + J Ф* (s, х. (s), и. ($)) у (s) ds. X
(Переход к пределу под знаком интеграла возможен, поскольку ф непрерывно дифференцируема по х, а u„(t)— ограниченная вектор-функция.) Таким образом,
у{1) есть на [т, решение уравнения
У= ф*0> *„(0» и * ( ( ) ) У
сначальными условиями (18).
Имеем при t ^ т
4 г (Р (О IУ (0) = |
(р (0 I у (0) + (р (0 I у (0) = |
|
|
||||
= - |
(ф; 0, |
(0, |
и. |
(0) р (0 I у (0) + (/, 0, ** (0, н* (0) I у щ + |
|||
+ |
(р (0 1ф, 0, |
*, (0. «, (0) р W) = Их 0. х, (0, |
«. (0) IУ (0), |
||||
т. е. поскольку |
p(/i) = 0, |
|
|
|
|||
|
(р (0 IУ (0) = |
— Jи (f* (S, |
л:, (S). «* («)) IУ (Л) ds■ |
|
|||
|
|
|
|
t |
|
|
|
В частности, согласно (18) |
|
|
|
||||
(р(т)|ф(т, |
х,(т), |
ы»(т) ) — фЛ> |
**Ы, «)) = |
|
|
||
|
|
|
|
л |
|
|
(19) |
|
|
|
|
= J (Л0. *,0). и,(0) 1р(О) |
|||
|
|
|
|
г |
|
|
|
Далее, поскольку |
(х„ (/), н, (()) — оптимальный |
процесс, |
|||||
|
Пт А"1[ Д М |
■), « * (• ) ) - ■ ? (*.(•), м . ( - ) ) ] > 0 . |
|
||||
|
Я+0 |
|
|
|
|
|
|
|
|
|
§ 2.4 |
ПРИ Н иИ П МАКСИМУМА ПОШРЯГИНА |
153 |
||||||||
Вычислим |
этот предел. |
Он, |
очевидно, равен |
|
|||||||||
|
|
X |
|
|
|
|
|
|
|
|
|
|
|
Пт л 1 |
[[/(/, |
xk{t), v ) — f(t, |
x,{t), ut (t)) ] dt -f- |
|
|||||||||
A\K> |
|
* |
|
|
|
|
|
|
|
|
|
|
|
|
t—К |
U |
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
||
+ lim A,-1 |
|
xk(t), |
|
|
|
|
x,(t), |
u,{t))]dt = |
|||||
|
|
= |
/( T, X, (t ), |
v )— f( T, X, (t), Ы. (t )) + |
|
||||||||
|
|
|
|
|
|
|
+ |
J |
ifx (t, |
X, (/), |
и. (/)) I у (t)) dt. |
||
|
|
|
|
|
|
|
|
T |
|
|
|
|
|
Отсюда, используя равенство |
(19), получаем |
|
|||||||||||
(р(т)|<р(т, |
х. (т), |
u,(x)))— f(x, |
х. (т), |
и. (т ))> |
|
||||||||
|
|
|
|
|
>(р (т)| ф (т, |
х. (т), |
v))— f( т, х+(т), и). |
||||||
Но |
|
т — произвольная |
точка |
непрерывности |
управ |
||||||||
ления |
м*(/) и |
v — произвольный |
элемент |
множества U. |
|||||||||
Отсюда |
следует, |
что |
соотношение |
(15) |
выполняется |
||||||||
во всех точках непрерывности управления и*(/), чт0 и |
|||||||||||||
требовалось. |
|
|
максимума |
и |
вариационное |
исчисле |
|||||||
2.4.3. |
Принцип |
||||||||||||
ние. Принцип максимума Понтрягина содержит необхо |
|||||||||||||
димые |
условия (первого порядка) |
в классическом ва |
|||||||||||
риационном исчислении. Мы покажем сейчас, как из |
|||||||||||||
принципа максимума можно получить уравнение Эй |
|||||||||||||
лера |
и |
условия Вейерштрасса, а также |
канонические |
||||||||||
уравнения |
и |
условия |
Вейерштрасса — Эрдмана, |
о ко |
торых мы ранее не упоминали. Ограничимся простейшей вариационной задачей. Читатель при желании может проделать соответствующие выкладки для задач более общего вида.
Итак, рассмотрим простейшую задачу
и предположим, что функция х*(/) (непрерывно диффе ренцируемая) доставляет сильный минимум в этой за даче. Можно переписать задачу в форме задачи
154 |
|
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ |
|
||||
оптимального |
управления следующим образом: |
||||||
|
|
и |
|
|
|
|
|
|
|
) А (/, |
х, и) dt-+ inf; |
|
|||
|
|
*0 |
|
|
|
|
|
|
х — и, u e R , |
x(t[j) = |
x0, |
x(t[) = |
x |
||
Тогда, |
если |
положить |
ut (t) = |
xt (t), то |
управляемый |
||
процесс |
(**(•),»*(•)) |
оптимален |
в |
последней задаче. |
|||
Имеем |
|
// = ри — l 0L (/, |
.т, |
и). |
|
||
|
|
|
Сопряженное уравнение имеет вид
Р = А0Аа. (/, xt {t), X' (/)),
а из принципа максимума следует (поскольку ограни чения на и отсутствуют), что
Hu = P - h L |
i {x^ Ut(tt) = |
0 |
(20) |
почти везде. Но поскольку |
управление |
ut (t) |
непрерыв |
но, написанное соотношение должно выполняться при
всех t. Если бы >„0 равнялось нулю, то |
в силу (20) |
и |
|||
p(t) равнялась бы тождественно нулю, |
что невозможно. |
||||
Поэтому можно считать, |
что ).0 = |
1, и |
мы |
приходим |
к |
уравнению Эйлера |
|
|
|
|
|
P(() = - ^ Lx(t, x,(t), |
u,(t)) = |
Lx (t, |
x,(t), |
xjt)). |
|
Далее, из принципа максимума следует, что почти при всех t
т а x(p (t)u — L(t, xjt), и)) = р (t) ujt) — L (t, x jt), ujt)). U
Это равенство, очевидно, выполняется во всех точках непрерывности функции н*(0> т. е. при всех t. Прини мая во внимание формулу (20), получаем
L(t, xjt), u) — L(t, xjt), xjt)) —
— (и — i (t)) Lx (t, x. (t), x, (0) > 0
при всех t и и. Мы пришли к условию Вейерштрасса. Эти рассуждения позволяют, в частности, сделать
вывод о том, что обычно используемое в вариационном
§ 2.4. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА |
155 |
исчислении требование непрерывной дифференцируемо сти экстремальной функции является излишним. Те же соотношения выполняются (но уже не при всех, а только почти при всех t), когда экстремальная функция абсо лютно непрерывна, а ее производная ограничена.
В частности, с помощью условия принципа максиму ма легко получаются необходимые условия Вейерштрасса — Эрдмана для так называемых ломаных экс тремалей. Действительно, если сильная минималь х*(/) имеет кусочно-непрерывную производную, то уравнение
Эйлера и |
условие |
Вейерштрасса должны |
выполняться |
|
в каждой |
точке |
ее непрерывности. |
Пусть при t — т |
|
функция |
x*(t) не дифференцируема |
(т. е. |
ее производ |
ная терпит разрыв первого рода). Во всех точках не прерывности i* (0 верна формула
x,{t)L k(t, х:,(/), x J t))— L(t, xt (t), x,(t)) = |
|
= |
x,(t), P(t)). |
Согласно принципу максимума, гамильтониан непреры вен, отсюда следует, что
i . (т — 0) Lk(т, х, (т), х, (т — 0)) — L (т, х, (т), х, (т — 0)) =
= X, (т + 0) L* (т, X, (т), X, (т + 0)) — L (т, |
х„ (т), |
х, (т + 0)). |
Точно так же, поскольку функция/?( / ) = |
Lk(t, |
(/),i*(/)), |
будучи решением сопряженного уравнения, непрерывна,
U (т, лг. (т), X, (т — 0)) = Lk (т, х, (т), X, (т + 0)).
Эти два соотношения называются условиями Вейер штрасса — Эрдмана. Они характеризуют возможные значения разрывов производных у ломаных экстрема* лей. Для простейшей векторной задачи условия Вейер штрасса— Эрдмана пишутся совершенно аналогично.
В заключение скажем несколько слов о канониче ских уравнениях. Мы уже отмечали, что в задаче опти мального управления фазовая траектория и решение сопряженного уравнения удовлетворяют системе урав нений
х |
дИ |
|
дН |
|
др |
Р = |
дх • |
||
|
156 |
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ |
|
Предположим теперь, что лагранжиан L простейшей задачи вариационного исчисления дважды непрерывно дифференцируем и удовлетворяет усиленному условию Лежандра: Lkk > 0, т. е., в частности, — это выпуклая функция по последнему аргументу. Тогда по теореме о неявной функции в окрестности каждой точки
(/, x*(t), i * ( / ) ) уравнение
p = Li(t, х, и)
однозначно разрешимо относительно и, т. е. суще ствует такая непрерывно дифференцируемая функция u(t, х, р), что
p = Lk {t, х, u(t, х, р)),
где |
u(t,xt (t),p{t)) = |
i* (0 . P(t) = Lt{t,x,(t),x*(t)). |
|||
В |
точке |
и — u(t,x,p) |
производная |
функции |
и->ри — |
— L(t, х, и) — Н (t, х, и, р) равна нулю. Коль |
скоро эта |
||||
функция |
вогнута, она |
достигает |
максимума |
в точке |
|
u(t, х, р), |
т. е. |
|
|
|
II {t, х, a(t, х, р), р) =
= ри (I, х, р) — L (t, х, и (t, х, р)) = Ж (t, х, р).
Последнее соотношение определяет так называемое
преобразование Лежандра функции L по последнему ар
гументу. |
Обобщение |
этого |
преобразования — преобра |
||||||
зование |
Юнга — Фенхеля — мы |
будем |
подробно изу |
||||||
чать в следующей главе. Имеем |
|
|
____ |
||||||
|
дЖ_ _ д И _ |
|
дН_ди_ _ |
дН_ , ( |
г \ ди |
||||
|
дх |
их |
' |
ди |
дх |
дх |
' у |
|
х’ дх |
Но на экстремали p = |
Lk {t, |
xt (/), |
*,(/)). |
Поэтому |
|||||
|
дЖ (t, xt {t), |
p (t)) |
dH (t, х„ (t), xt (Q, |
p (Q) |
|||||
|
|
дх |
|
|
|
|
dx |
|
|
Аналогично |
|
|
|
и из |
(21) |
следует, |
что **(•) и |
р(-) являются решениями такой системы уравнений:
дЖ . дЖ
Х==Т ^ ' Р = - ~ д 7 -
Полученная система уравнений первого порядка, оче видно, эквивалентная уравнению Эйлера, называется
§ 2,4 ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА |
157 |
||
канонической формой уравнения |
Эйлера |
или |
просто — |
канонической системой. |
|
в классическом |
|
2.4.4. Некоторые иллюстрации. Как и |
|||
вариационном исчислении, при |
решении |
задач опти |
мального управления с помощью принципа максимума можно встретиться с самыми различными ситуациями. Для линейных задач с ограниченным множеством управлений типична ситуация, когда существует един ственный допустимый управляемый процесс, удовлет воряющий принципу максимума, и этот процесс
оптимален. |
1. |
В задаче |
|
|
|
|
|||
П р и м е р |
|
|
|
|
|||||
|
|
I |
|
|
|
|
|
|
|
|
J х dt - > |
in f; |
х = |
и, | и \^ |
1, |
х (0) = |
0, |
||
|
о |
|
|
|
|
|
|
|
|
принципу |
максимума |
удовлетворяет |
только процесс |
||||||
(x(t) = |
— t, u(i) = — 1 ) , |
очевидно, являющийся опти |
|||||||
мальным. |
В самом деле, в этой задаче |
|
|||||||
|
|
|
|
|
Н = |
ри — х, |
|
|
|
сопряженное уравнение имеет вид |
|
|
|
||||||
|
|
|
|
|
|
Р = 1> |
|
|
|
откуда |
(так |
как |
мы |
рассматриваем задачу со свобод |
|||||
ным правым |
концом |
н, |
значит, |
/7(1) = 0) |
(/) = / — I |
и максимум функции Н достигается при ц = — 1. Вообще же, в задачах оптимального управления
можно столкнуться с теми же ситуациями, что и в вариационном исчислении: отсутствие решения, суще ствование множества допустимых процессов, удовлетво ряющих принципу максимума и являющихся или не являющихся оптимальными и т. д. Тот факт, что в за дачах оптимального управления часто рассматривают ог раниченные множества допустимых управлений, может породить (и порой порождает) иллюзию, будто реше ния в таких задачах непременно существуют и всегда могут быть найдены с помощью принципа максимума. Эго, конечно, неверно. Для иллюстрации рассмотрим пример, который позволит нам заодно обратить внима ние на весьма важное явление — скользящие режимы.
158 |
|
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ |
|
|
|
|
||||||
П р и м е р |
2. С к о л ь з я щ и й |
ре жи м . |
Рассмотрим |
|||||||||
такую задачу |
|
|
|
|
|
|
|
|
|
|
||
I |
|
|
|
|
|
|
|
|
|
|
|
|
J х- dt -> inf; |
х — |
и, |
! и [ = 1, |
х(0) = |
а, |
*(1) = |
0. |
|
||||
о |
|
|
|
|
|
|
|
|
|
|
|
|
При |а| |
> |
1, очевидно, |
не существует |
ни |
одного |
до |
||||||
пустимого управляемого |
процесса. |
При |
|сс| = |
1 |
такой |
|||||||
процесс |
единствен |
и |
соответствует |
управлению |
u(t) = |
|||||||
= siVn |
ос. Пусть |
теперь |
ос = 0. Легко |
понять, |
что лю |
|||||||
|
|
|
|
|
бому |
допустимому |
управ |
|||||
|
|
|
|
|
ляемому |
процессу |
соответ |
|||||
|
|
|
|
|
ствует |
положительное |
зна |
|||||
|
|
|
|
|
чение |
функционала. |
Вместе |
|||||
|
|
|
|
|
с тем на последовательно |
|||||||
|
|
|
|
|
сти -МО, x2(t), *з(t).......... |
|||||||
|
|
|
|
|
изображенной |
на |
рис. |
8, |
||||
|
|
|
|
у у функционал стремится к ну |
||||||||
|
Рис. 8. |
|
|
лю. Заметим, что здесь по |
||||||||
|
|
|
следовательность |
фазовых |
||||||||
мерно, а |
|
|
|
|
траекторий |
сходится равно |
||||||
последовательность управлений, |
наоборот, |
ни |
к чему не сходится. Такие последовательности назы ваются скользящими режимами.
Итак, задача не имеет решения. Предлагаем чита телю проверить, что ни один управляемый процесс не
удовлетворяет принципу |
максимума (при |
ос ~ 0 ) . |
|
||||
§ 2.5. Доказательство принципа максимума |
|
||||||
Напомним, что мы рассматриваем |
следующую |
||||||
задачу: |
|
|
|
|
|
|
|
У{ х ( - ) , |
«(•)) = |
[ f(t, |
х, |
и) dt -> inf; |
(1) |
||
|
* = |
ф {t, х, |
и), |
|
|
(2) |
|
|
|
и |
U , |
|
|
|
(3) |
Ло(*о. |
*(*<>)) = |
0, |
hAtu |
*(<■)) = |
<). |
(4) |
Мы не можем воспользоваться здесь правилом множи телей Лагранжа из-за ограничений, наложенных на уп равления, и из-за невозможности дифференцирования
%2.5. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА |
159 |
по и. Наше доказательство опирается на экстремальный принцип для гладко-выпуклых задач. Связь его с зада чей оптимального управления не столь очевидна, как, скажем, связь правила множителей Лагранжа с клас сической задачей Лагранжа, да и вывод принципа мак
симума |
Понтрягипа |
из экстремального |
принципа |
для |
|||
гладко-выпуклых задач требует больших усилий. |
|
||||||
Первым шагом в наших построениях будет редукция |
|||||||
задачи |
(1) — (4) к эквивалентной в некотором смысле |
||||||
гладко-выпуклой задаче. Мы |
сделаем |
это с |
помощью |
||||
предложенного А. Я. Дубовицким и А. А. Милютиным |
|||||||
приема, использующего замену времени. |
|
|
процесс |
||||
2.5.1. |
Редукция задачи. |
Пусть управляемый |
|||||
(х*Н), м*(0). определенный на отрезке [/о*,/и], опти |
|||||||
мален в задаче (1) |
— (4). Выберем |
неотрицательную, |
|||||
ограниченную и измеримую |
на отрезке |
[0, 1] |
функцию |
||||
у, (т), подчиненную условию |
|
|
|
|
|
||
|
1 |
|
|
|
|
|
|
|
j |
vt (x)dx = |
tlt— /0„ |
|
|
|
(5) |
|
о |
|
|
|
|
|
|
н положим
т
/= Ч (т ) = /<>.+ |Ч ( £ ) ^ .
о |
(6) |
Д (VJ = (т е [0, 1]|и. (т) > |
0}. |
Зафиксируем далее измеримую г-мерную вектор-функ цию ш*(т), принимающую значения в U и почти всюду на множестве А (и*) удовлетворяющую равенству
W. (т) = И, (/. (т)), |
(7) |
||
Теперь мы можем сформулировать ту редукционную |
|||
задачу, о которой говорилось в начале параграфа: |
|
||
I |
|
|
(8) |
J vf(t, |
у, w, (T))dr->inf; |
||
и |
vcp(t, |
у, w,(т)), |
(9а) |
y' = |
|||
|
t' = |
v, |
(96) |
|
v > 0 , |
(10) |
|
А0(/(О), !/(0)) = 0, |
А,(/( 1), //(!)) = 0 |
(11) |
|
К И Ш |
|
|
|
(штрихами обозначены производные по т),
160 |
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ |
Это тоже задача оптимального управления, и управ ляющим параметром в ней служит скаляр и. В каче стве допустимых управлений в этой задаче мы будем брать всевозможные неотрицательные, ограниченные и измеримые функции v(x), каждая из которых обра щается в нуль на одном пз
множеств
вида (6). Пусть функция чена и измерима на отре
Л* = {т<=[0, 1]Цш,(т)|>/г)
(fe = 0, 1, . . . ) |
■ |
(своем для каждой функ ции). Множество таких функций обозначим бук вой Т.
Положим
У. (*) = х, (t, (т)),
где /*(т) определяется фор
мулой |
(6). |
|
1. |
|
|
|
Л е м м а |
|
Управляе |
||||
мый |
процесс |
(/*(т), |
г/*(т), |
|||
и*(т)) допустим |
в |
задаче |
||||
(8) — (11) и |
доставляет ей |
|||||
локальный минимум. |
|
|||||
Для |
доказательства лем |
|||||
мы |
нужно |
более |
подробно |
|||
рассмотреть |
преобразования |
|||||
(т) неотрицательна, |
огранн- |
|||||
е [0,1] |
(рис. |
|
9,а). |
Положим |
t ( T) = t(0) + |
J y(n) dr\, |
|
о |
А( ц ) ={ т <=[0, |
1]| а (т) > 0}. |
Функция /(т) непрерывна и не убывает. Обратная функция тоже не убывает, но может, вообще говоря, иметь разрывы первого рода в не более чем счетном множестве точек |2, ... (рис. 9,6). Положим для определенности
т(/) — min (т е [0, 1]Щт) = Л, если /=^/(1), т ( / ( 1) ) =1 .