Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Иоффе, А. Д. Теория экстремальных задач [учеб. пособие]

.pdf
Скачиваний:
16
Добавлен:
22.10.2023
Размер:
15.51 Mб
Скачать

§ 2.4. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА

151

Для уравнения

X = ф (t, X, 1>)

разрешима в окрестности точки (т, лс*{т)), вектор-функ­ ция xk(t) определена и на отрезке [т — X, т], если X до­ статочно мало.

Коль скоро управление ы*(0 непрерывно в точке т, оно непрерывно и в некоторой ее ^-окрестности. Поэто­

му и Xz(t) непрерывна в этой

окрестности и, следова­

тельно,

 

 

 

** (т) =

X' (т — к) +

Хх, (т — X) +

о (X) =

=

xt (т — X) +

А,ф(т — X, х„ (т — X), и,(х X)) -(- о (X).

Точно так же

xk( x ) = x t (т — X) + Яф(т — X, Х ' ( т — Х), v) +о(А).

Отсюда следует, что предел

Х 1 (т) — А, (т)

у(т) == lim

л^ о

существует и равен

г/(т) = ф(т, xf (x), v )— ф(т, .г,(т), u , ( t )).

(18)

На отрезке [т, t\)I иих*(. (-•), , ииххлгх(-()-) удовлетворяют урав­ нению

х = q>(t, х, н,(0)-

Из теоремы о непрерывности и дифференцируемости решения дифференциального уравнения по начальным данным следует, что при достаточно малых X > 0 век­ тор-функции xk(t) определены на [т, Л], сходятся равно­ мерно к х*(/) и предел

 

 

y{t) = lim

хк(0 — X, (t)

 

 

 

 

_

 

 

 

к+ о

 

 

 

существует при

всяком / е

[т, ^]. Имеем при t > т

 

 

 

t

 

 

 

 

Xl(t) =

Xk{x )+

J ф(5,

xx(s),

u,(s))ds,

 

 

 

t

 

 

 

bUJJ

x, (0 =

-V. (т) +

J

Ф(s,

X, (s),

u, (s)) ds,

 

 

T

 

 

 

 

 

 

 

 

 

152 ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ

так

что

 

 

 

^ (0 - *. (О

 

 

 

 

X

t

 

 

 

xx ( t ) — X, (т)

qp(s, хк (S), и, (s)) — ф (s, х„ (s), и, (s))

^

t С

Я

+ J

X

a s '

 

 

X

 

 

Переходя к пределу при А | 0, получаем

t

y(t) = У (т) + J Ф* (s, х. (s), и. ($)) у (s) ds. X

(Переход к пределу под знаком интеграла возможен, поскольку ф непрерывно дифференцируема по х, а u„(t)— ограниченная вектор-функция.) Таким образом,

у{1) есть на [т, решение уравнения

У= ф*0> *„(0» и * ( ( ) ) У

сначальными условиями (18).

Имеем при t ^ т

4 г (Р (О IУ (0) =

(р (0 I у (0) + (р (0 I у (0) =

 

 

= -

(ф; 0,

(0,

и.

(0) р (0 I у (0) + (/, 0, ** (0, н* (0) I у щ +

+

(р (0 1ф, 0,

*, (0. «, (0) р W) = Их 0. х, (0,

«. (0) IУ (0),

т. е. поскольку

p(/i) = 0,

 

 

 

 

(0 IУ (0) =

Jи (f* (S,

л:, (S). «* («)) IУ (Л) ds■

 

 

 

 

 

t

 

 

 

В частности, согласно (18)

 

 

 

(р(т)|ф(т,

х,(т),

ы»(т) ) — фЛ>

**Ы, «)) =

 

 

 

 

 

 

л

 

 

(19)

 

 

 

 

= J (Л0. *,0). и,(0) 1р(О)

 

 

 

 

г

 

 

 

Далее, поскольку

(х„ (/), н, (()) — оптимальный

процесс,

 

Пт А"1[ Д М

■), « * (• ) ) - ■ ? (*.(•), м . ( - ) ) ] > 0 .

 

 

Я+0

 

 

 

 

 

 

 

 

 

§ 2.4

ПРИ Н иИ П МАКСИМУМА ПОШРЯГИНА

153

Вычислим

этот предел.

Он,

очевидно, равен

 

 

 

X

 

 

 

 

 

 

 

 

 

 

 

Пт л 1

[[/(/,

xk{t), v ) — f(t,

x,{t), ut (t)) ] dt -f-

 

A\K>

 

*

 

 

 

 

 

 

 

 

 

 

 

 

t—К

U

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

+ lim A,-1

 

xk(t),

 

 

 

 

x,(t),

u,{t))]dt =

 

 

=

/( T, X, (t ),

v )— f( T, X, (t), Ы. (t )) +

 

 

 

 

 

 

 

 

+

J

ifx (t,

X, (/),

и. (/)) I у (t)) dt.

 

 

 

 

 

 

 

 

T

 

 

 

 

 

Отсюда, используя равенство

(19), получаем

 

(р(т)|<р(т,

х. (т),

u,(x)))— f(x,

х. (т),

и. (т ))>

 

 

 

 

 

 

>(р (т)| ф (т,

х. (т),

v))— f( т, х+(т), и).

Но

 

т — произвольная

точка

непрерывности

управ­

ления

м*(/) и

v произвольный

элемент

множества U.

Отсюда

следует,

что

соотношение

(15)

выполняется

во всех точках непрерывности управления и*(/), чт0 и

требовалось.

 

 

максимума

и

вариационное

исчисле­

2.4.3.

Принцип

ние. Принцип максимума Понтрягина содержит необхо­

димые

условия (первого порядка)

в классическом ва­

риационном исчислении. Мы покажем сейчас, как из

принципа максимума можно получить уравнение Эй­

лера

и

условия Вейерштрасса, а также

канонические

уравнения

и

условия

Вейерштрасса — Эрдмана,

о ко­

торых мы ранее не упоминали. Ограничимся простейшей вариационной задачей. Читатель при желании может проделать соответствующие выкладки для задач более общего вида.

Итак, рассмотрим простейшую задачу

и предположим, что функция х*(/) (непрерывно диффе­ ренцируемая) доставляет сильный минимум в этой за­ даче. Можно переписать задачу в форме задачи

154

 

ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ

 

оптимального

управления следующим образом:

 

 

и

 

 

 

 

 

 

 

) А (/,

х, и) dt-+ inf;

 

 

 

*0

 

 

 

 

 

 

х — и, u e R ,

x(t[j) =

x0,

x(t[) =

x

Тогда,

если

положить

ut (t) =

xt (t), то

управляемый

процесс

(**(•),»*(•))

оптимален

в

последней задаче.

Имеем

 

// = ри — l 0L (/,

.т,

и).

 

 

 

 

Сопряженное уравнение имеет вид

Р = А0Аа. (/, xt {t), X' (/)),

а из принципа максимума следует (поскольку ограни­ чения на и отсутствуют), что

Hu = P - h L

i {x^ Ut(tt) =

0

(20)

почти везде. Но поскольку

управление

ut (t)

непрерыв­

но, написанное соотношение должно выполняться при

всех t. Если бы >„0 равнялось нулю, то

в силу (20)

и

p(t) равнялась бы тождественно нулю,

что невозможно.

Поэтому можно считать,

что ).0 =

1, и

мы

приходим

к

уравнению Эйлера

 

 

 

 

 

P(() = - ^ Lx(t, x,(t),

u,(t)) =

Lx (t,

x,(t),

xjt)).

 

Далее, из принципа максимума следует, что почти при всех t

т а x(p (t)u — L(t, xjt), и)) = р (t) ujt) — L (t, x jt), ujt)). U

Это равенство, очевидно, выполняется во всех точках непрерывности функции н*(0> т. е. при всех t. Прини­ мая во внимание формулу (20), получаем

L(t, xjt), u) — L(t, xjt), xjt)) —

— (и — i (t)) Lx (t, x. (t), x, (0) > 0

при всех t и и. Мы пришли к условию Вейерштрасса. Эти рассуждения позволяют, в частности, сделать

вывод о том, что обычно используемое в вариационном

§ 2.4. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА

155

исчислении требование непрерывной дифференцируемо­ сти экстремальной функции является излишним. Те же соотношения выполняются (но уже не при всех, а только почти при всех t), когда экстремальная функция абсо­ лютно непрерывна, а ее производная ограничена.

В частности, с помощью условия принципа максиму­ ма легко получаются необходимые условия Вейерштрасса — Эрдмана для так называемых ломаных экс­ тремалей. Действительно, если сильная минималь х*(/) имеет кусочно-непрерывную производную, то уравнение

Эйлера и

условие

Вейерштрасса должны

выполняться

в каждой

точке

ее непрерывности.

Пусть при t — т

функция

x*(t) не дифференцируема

(т. е.

ее производ­

ная терпит разрыв первого рода). Во всех точках не­ прерывности i* (0 верна формула

x,{t)L k(t, х:,(/), x J t))— L(t, xt (t), x,(t)) =

 

=

x,(t), P(t)).

Согласно принципу максимума, гамильтониан непреры­ вен, отсюда следует, что

i . (т — 0) Lk(т, х, (т), х, (т — 0)) — L (т, х, (т), х, (т — 0)) =

= X, (т + 0) L* (т, X, (т), X, (т + 0)) — L (т,

х„ (т),

х, (т + 0)).

Точно так же, поскольку функция/?( / ) =

Lk(t,

(/),i*(/)),

будучи решением сопряженного уравнения, непрерывна,

U (т, лг. (т), X, (т — 0)) = Lk (т, х, (т), X, (т + 0)).

Эти два соотношения называются условиями Вейер­ штрасса Эрдмана. Они характеризуют возможные значения разрывов производных у ломаных экстрема* лей. Для простейшей векторной задачи условия Вейер­ штрасса— Эрдмана пишутся совершенно аналогично.

В заключение скажем несколько слов о канониче­ ских уравнениях. Мы уже отмечали, что в задаче опти­ мального управления фазовая траектория и решение сопряженного уравнения удовлетворяют системе урав­ нений

х

дИ

 

дН

др

Р =

дх

 

156

ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ

 

Предположим теперь, что лагранжиан L простейшей задачи вариационного исчисления дважды непрерывно дифференцируем и удовлетворяет усиленному условию Лежандра: Lkk > 0, т. е., в частности, — это выпуклая функция по последнему аргументу. Тогда по теореме о неявной функции в окрестности каждой точки

(/, x*(t), i * ( / ) ) уравнение

p = Li(t, х, и)

однозначно разрешимо относительно и, т. е. суще­ ствует такая непрерывно дифференцируемая функция u(t, х, р), что

p = Lk {t, х, u(t, х, р)),

где

u(t,xt (t),p{t)) =

i* (0 . P(t) = Lt{t,x,(t),x*(t)).

В

точке

и — u(t,x,p)

производная

функции

и->ри

L(t, х, и) — Н (t, х, и, р) равна нулю. Коль

скоро эта

функция

вогнута, она

достигает

максимума

в точке

u(t, х, р),

т. е.

 

 

 

II {t, х, a(t, х, р), р) =

= ри (I, х, р) — L (t, х, и (t, х, р)) = Ж (t, х, р).

Последнее соотношение определяет так называемое

преобразование Лежандра функции L по последнему ар­

гументу.

Обобщение

этого

преобразования — преобра­

зование

Юнга — Фенхеля — мы

будем

подробно изу­

чать в следующей главе. Имеем

 

 

____

 

дЖ_ _ д И _

 

дН_ди_ _

дН_ , (

г \ ди

 

дх

их

'

ди

дх

дх

' у

 

х’ дх

Но на экстремали p =

Lk {t,

xt (/),

*,(/)).

Поэтому

 

дЖ (t, xt {t),

p (t))

dH (t, х„ (t), xt (Q,

p (Q)

 

 

дх

 

 

 

 

dx

 

 

Аналогично

 

 

 

и из

(21)

следует,

что **(•) и

р(-) являются решениями такой системы уравнений:

дЖ . дЖ

Х==Т ^ ' Р = - ~ д 7 -

Полученная система уравнений первого порядка, оче­ видно, эквивалентная уравнению Эйлера, называется

§ 2,4 ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА

157

канонической формой уравнения

Эйлера

или

просто —

канонической системой.

 

в классическом

2.4.4. Некоторые иллюстрации. Как и

вариационном исчислении, при

решении

задач опти­

мального управления с помощью принципа максимума можно встретиться с самыми различными ситуациями. Для линейных задач с ограниченным множеством управлений типична ситуация, когда существует един­ ственный допустимый управляемый процесс, удовлет­ воряющий принципу максимума, и этот процесс

оптимален.

1.

В задаче

 

 

 

 

П р и м е р

 

 

 

 

 

 

I

 

 

 

 

 

 

 

 

J х dt - >

in f;

х =

и, | и \^

1,

х (0) =

0,

 

о

 

 

 

 

 

 

 

 

принципу

максимума

удовлетворяет

только процесс

(x(t) =

t, u(i) = — 1 ) ,

очевидно, являющийся опти­

мальным.

В самом деле, в этой задаче

 

 

 

 

 

 

Н =

ри х,

 

 

 

сопряженное уравнение имеет вид

 

 

 

 

 

 

 

 

 

Р = 1>

 

 

 

откуда

(так

как

мы

рассматриваем задачу со свобод­

ным правым

концом

н,

значит,

/7(1) = 0)

(/) = / — I

и максимум функции Н достигается при ц = — 1. Вообще же, в задачах оптимального управления

можно столкнуться с теми же ситуациями, что и в вариационном исчислении: отсутствие решения, суще­ ствование множества допустимых процессов, удовлетво­ ряющих принципу максимума и являющихся или не являющихся оптимальными и т. д. Тот факт, что в за­ дачах оптимального управления часто рассматривают ог­ раниченные множества допустимых управлений, может породить (и порой порождает) иллюзию, будто реше­ ния в таких задачах непременно существуют и всегда могут быть найдены с помощью принципа максимума. Эго, конечно, неверно. Для иллюстрации рассмотрим пример, который позволит нам заодно обратить внима­ ние на весьма важное явление — скользящие режимы.

158

 

ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ

 

 

 

 

П р и м е р

2. С к о л ь з я щ и й

ре жи м .

Рассмотрим

такую задачу

 

 

 

 

 

 

 

 

 

 

I

 

 

 

 

 

 

 

 

 

 

 

 

J х- dt -> inf;

х

и,

! и [ = 1,

х(0) =

а,

*(1) =

0.

 

о

 

 

 

 

 

 

 

 

 

 

 

 

При |а|

>

1, очевидно,

не существует

ни

одного

до­

пустимого управляемого

процесса.

При

|сс| =

1

такой

процесс

единствен

и

соответствует

управлению

u(t) =

= siVn

ос. Пусть

теперь

ос = 0. Легко

понять,

что лю­

 

 

 

 

 

бому

допустимому

управ­

 

 

 

 

 

ляемому

процессу

соответ­

 

 

 

 

 

ствует

положительное

зна­

 

 

 

 

 

чение

функционала.

Вместе

 

 

 

 

 

с тем на последовательно­

 

 

 

 

 

сти -МО, x2(t), *з(t)..........

 

 

 

 

 

изображенной

на

рис.

8,

 

 

 

 

у у функционал стремится к ну­

 

Рис. 8.

 

 

лю. Заметим, что здесь по­

 

 

 

следовательность

фазовых

мерно, а

 

 

 

 

траекторий

сходится равно­

последовательность управлений,

наоборот,

ни

к чему не сходится. Такие последовательности назы­ ваются скользящими режимами.

Итак, задача не имеет решения. Предлагаем чита­ телю проверить, что ни один управляемый процесс не

удовлетворяет принципу

максимума (при

ос ~ 0 ) .

 

§ 2.5. Доказательство принципа максимума

 

Напомним, что мы рассматриваем

следующую

задачу:

 

 

 

 

 

 

 

У{ х ( - ) ,

«(•)) =

[ f(t,

х,

и) dt -> inf;

(1)

 

* =

ф {t, х,

и),

 

 

(2)

 

 

и

U ,

 

 

 

(3)

Ло(*о.

*(*<>)) =

0,

hAtu

*(<■)) =

<).

(4)

Мы не можем воспользоваться здесь правилом множи­ телей Лагранжа из-за ограничений, наложенных на уп­ равления, и из-за невозможности дифференцирования

%2.5. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА

159

по и. Наше доказательство опирается на экстремальный принцип для гладко-выпуклых задач. Связь его с зада­ чей оптимального управления не столь очевидна, как, скажем, связь правила множителей Лагранжа с клас­ сической задачей Лагранжа, да и вывод принципа мак­

симума

Понтрягипа

из экстремального

принципа

для

гладко-выпуклых задач требует больших усилий.

 

Первым шагом в наших построениях будет редукция

задачи

(1) — (4) к эквивалентной в некотором смысле

гладко-выпуклой задаче. Мы

сделаем

это с

помощью

предложенного А. Я. Дубовицким и А. А. Милютиным

приема, использующего замену времени.

 

 

процесс

2.5.1.

Редукция задачи.

Пусть управляемый

(х*Н), м*(0). определенный на отрезке [/о*,/и], опти­

мален в задаче (1)

— (4). Выберем

неотрицательную,

ограниченную и измеримую

на отрезке

[0, 1]

функцию

у, (т), подчиненную условию

 

 

 

 

 

 

1

 

 

 

 

 

 

 

j

vt (x)dx =

tlt— /0„

 

 

 

(5)

 

о

 

 

 

 

 

 

н положим

т

/= Ч (т ) = /<>.+ |Ч ( £ ) ^ .

о

(6)

Д (VJ = (т е [0, 1]|и. (т) >

0}.

Зафиксируем далее измеримую г-мерную вектор-функ­ цию ш*(т), принимающую значения в U и почти всюду на множестве А (и*) удовлетворяющую равенству

W. (т) = И, (/. (т)),

(7)

Теперь мы можем сформулировать ту редукционную

задачу, о которой говорилось в начале параграфа:

 

I

 

 

(8)

J vf(t,

у, w, (T))dr->inf;

и

vcp(t,

у, w,(т)),

(9а)

y' =

 

t' =

v,

(96)

 

v > 0 ,

(10)

А0(/(О), !/(0)) = 0,

А,(/( 1), //(!)) = 0

(11)

К И Ш

 

 

 

(штрихами обозначены производные по т),

160

ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ

Это тоже задача оптимального управления, и управ­ ляющим параметром в ней служит скаляр и. В каче­ стве допустимых управлений в этой задаче мы будем брать всевозможные неотрицательные, ограниченные и измеримые функции v(x), каждая из которых обра­ щается в нуль на одном пз

множеств

вида (6). Пусть функция чена и измерима на отре

Л* = {т<=[0, 1]Цш,(т)|>/г)

(fe = 0, 1, . . . )

(своем для каждой функ­ ции). Множество таких функций обозначим бук­ вой Т.

Положим

У. (*) = х, (t, (т)),

где /*(т) определяется фор­

мулой

(6).

 

1.

 

 

Л е м м а

 

Управляе­

мый

процесс

(/*(т),

г/*(т),

и*(т)) допустим

в

задаче

(8) — (11) и

доставляет ей

локальный минимум.

 

Для

доказательства лем­

мы

нужно

более

подробно

рассмотреть

преобразования

(т) неотрицательна,

огранн-

е [0,1]

(рис.

 

9,а).

Положим

t ( T) = t(0) +

J y(n) dr\,

 

о

А( ц ) ={ т <=[0,

1]| а (т) > 0}.

Функция /(т) непрерывна и не убывает. Обратная функция тоже не убывает, но может, вообще говоря, иметь разрывы первого рода в не более чем счетном множестве точек |2, ... (рис. 9,6). Положим для определенности

т(/) — min (т е [0, 1]Щт) = Л, если /=^/(1), т ( / ( 1) ) =1 .

Соседние файлы в папке книги из ГПНТБ