Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Иоффе, А. Д. Теория экстремальных задач [учеб. пособие]

.pdf
Скачиваний:
61
Добавлен:
22.10.2023
Размер:
15.51 Mб
Скачать

§ 2 3 ЗАДАЧА ЛАГРАНЖА

H I

и (13) следует, что p{t) удовлетворяет уравнению

p ( t ) + f

ktia{x)dx — j А’ (т)р(т)йт + rUi = 0. (15)

t

t

Подставив в (15) t — tQ и воспользовавшись выра­ жением для а в (13'), получим:

 

 

 

Р {to) — iVo.

 

 

 

 

 

Если положить t =

tu то

мы придем к равенству p{t,)=

= — Г?/,.

Наконец,

продифференцировав (15),

приходим

к уравнению:

Р (t) =

А'р (0 —

 

(t).

 

 

 

 

 

 

 

Соотношения (2'), (З7) доказаны. Подставив теперь

вместо d\i(t)

в формулу для 3?и выражение p(t)dt, по­

лучим, что

линейный

функционал

в

пространстве

Сг([/0, ^])

вида

U

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

% и(г*) и (•) = | (кф {t) -

В* (0 р (0 |и (/)) dt

равен нулю.

По теореме Рисса отсюда следует, что

 

 

 

B'(t)p{t) = kQb{t).

 

 

 

 

Соотношение (47), а вместе с

ним

и

теорема

1 дока­

заны.

Изопериметрическая

задача.

 

 

2.3.2.

Изопериметриче-

ской задачей в вариационном исчислении называют та­

кую проблему минимизации:

 

 

 

 

 

 

 

У (х (•)) = | /о (t, X,

х) dt

 

inf;

 

 

11

 

*0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(16)

 

J fiit, x,

x) dt =

a,,

j =

1, .

.

m,

 

 

 

u

h0{x (t0)) =

Нфх(ti)) =

0,

 

 

 

 

 

 

 

 

 

fi : R X R " X R “ ->R,

/ = 0,.

 

m,

 

hi-

/ = 0, 1.

142

ГЛ.

2. НЕОБХОДИМЫЕ УСЛОВИЯ

 

Если

положить

 

 

 

 

 

и1=

xl,

i =

1.........

п,

 

xl+n =

fj(t, X, и),

/ =

1.........

т,

то получится такая задача Лагранжа:

Применив теорему 1 к этой задаче, приходим к сле­ дующему результату.

Т е о р е м а 2. Для того чтобы вектор-функция х*(0 доставляла слабый локальный минимум в задаче (16), необходимо, чтобы нашлись такие множители Лагранжа

kj <= R, 0 ^ ^ ш,

Uе RS(',

г = 1,

2,

не все равные

нулю, что для лагранжиана

m

 

 

 

 

 

 

L (t,

x, x) =

hfi (/,

x,

x)

выполнено уравнение Эйлера

при этом удовлетворяются следующие краевые условия:

L* \Xt fta) = (xt (to))to,

L ^ x , u l) = = ~ !l o’

Можно предложить читателю в виде упражнения получить вид необходимого условия в задаче со старшими производными:

t,

*(> 0)=io .

=

0 < / < я - 1 .

сведя ее к задаче Лагранжа. Кроме того, непосредственно из тео-

§ 2.1 ПРИНЦИП МАКСИМУМА ПОНТ РЯГИНА

143

ремы 1 § 1.1 легко вывести необходимое условие для задачи с фа­ зовыми ограничениями, например, для такой:

f■ R X R" X Rn -> R. Ф: R X R" -> Rm. m < n.

Для того чтобы обеспечить регулярность, достаточно потребовать выполнения условия

rank Ф* (t. х (t)) = т,

t е [/а, /,].

Необходимое условие в этой задаче будет также иметь вид уравнения Эйлера для лагранжиана

/. = /(/, л, х ) - ( р (/)|Ф(Л х)).

§ 2.4. Принцип максимума Понтрягина. Формулировка и обсуждение

Этот параграф посвящен формулировке и обсужде­ нию основного необходимого условия экстремума в тео­ рии оптимального управления — принципа максимума Понтрягина. Мы приводим здесь также элементарное доказательство принципа максимума для специального случая задачи со свободным правым концом. Доказа­ тельство принципа максимума в полной общности со­ держится в § 2.5. Мы ограничиваемся в этой главе задачей оптимального управления без фазовых ограни­ чений, отложив обсуждение задач с фазовыми ограни­ чениями до гл. 5.

2.4.1.Формулировка принципа максимума. Задача

оптимального управления без фазовых ограничений, как следует из объяснений, данных в § 2.1, формули­ руется следующим образом:

О (x( • ) ,

и ( )) = | / (/, x, и) dt -> inf;

( 1)

 

* = <p(t, X, u),

(2)

 

u<=U

c= Rr,

 

(3)

hn (to,

x (^)) =

0,

/г, (/,,

x (t,)) = 0

(4)

(/: R X R " X R r-+R, ф:

R X

R" X

Rr->- R",

 

h0 R X R B - » R \ i = 0 , 1).

144 ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ

Предполагается, что все входящие в условие задачи функции и множества удовлетворяют условиям, указан­ ным в п. 2.1.2. В качестве допустимых управлений, как уже отмечалось, рассматриваются ограниченные изме­

римые вектор-функции

u{t),

принимающие значения в

U, а в понятие «локальный экстремум» или «оптималь­

ный процесс» вкладывается

тот

же

смысл,

что и в

п. 2.1.4.

 

 

 

 

 

 

 

 

Мы сформулируем принцип максимума в двух экви­

валентных

формах — «гамильтоновой» и «лагранже-

вой». Начнем с гамильтоновой формы.

 

 

Рассмотрим функцию

 

 

 

 

H(t,

х,

и, р,

Л0) =

(р|ф(/, д;,

u)) — Xaf(t,

х, и)

(где р ^

R",

/.о е

R+),

которую

мы

будем

называть

функцией Понтрягина. Переменные, обозначаемые бук­ вой р, обычно называются импульсами. Наряду с функ­ цией Понтрягина введем функцию

Ж (t, ,v, р, l 0) = sup Я (t,

и,

р,

10),

 

ue=U

 

 

 

называемую гамильтонианом.

 

в

гамильтоновой

Т е о р е м а

1 (принцип максимума

форме). Пусть

(x*(t), u*(t)) — оптимальный управляе­

мый процесс в задаче (1) — (4),

определенный на от­

резке [/о*, tu]. Тогда существуют не равные одновремен­

но нулю число Яо ^ 0, векторы /0 е

RSo,

/i е RS| и век­

тор-функция p(t) такие, что

 

 

 

 

 

а) вектор-функция p(t) удовлетворяет сопряженному

уравнению

 

 

 

 

 

 

р = — н х— — ф; (t, х, (t), U t (t)) p + K0fx (t,

x, ((), «. (/))

(5)

и условиям трансверсальности

 

 

 

 

 

p {to*) =

hox(to„ xt (to*)) lo,

1

 

 

 

p(ti*)=

h\x {tu, xt (t\,))l\',

J

 

 

 

б) почти при всех t из [/о., Л*]

 

 

 

 

 

H{t, xt (t), u,{t), p(t),

X0) = max H (t,

xt (t),

u,

p(t),

Я0) =

 

 

«ell

 

 

 

 

 

 

= ЖЦ, X,(t),

p(t),

КУ,

(7)

 

§

2.4.

ПРИНЦИП

МАКСИМУМА ПОНТРЯГИНА

 

145

 

в)

гамильтониан Mtt,

xt (t),

p(t),

Я,,) непрерывен

на

отрезке [to,,

/1*]

и на концах

его

удовлетворяет

соотно­

 

шениям

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ж {to,,

xt (to*),

р (to*),

Яо) =

(hot (to,.,

xt (t0,))

I/0),

}

 

M(t\„

xt (tu),

p(ti*),

ho) =

(hu(tu,

x* (ti,)) I/ 1).

j

 

Отметим выражение для гамильтониана

 

 

 

Ж (t, х. (t), р (t), Я0) = (hu (tu, x. (/,.)) I /,)

+

 

 

 

 

 

 

 

 

 

 

f,

 

 

 

 

 

 

 

 

 

(8a)

 

 

 

 

 

+ J Ht (l, x,(l), ut (l),

p(l),

K)dl,

 

 

 

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

получающееся в процессе доказательства, а также еди­

 

нообразную

гамильтонову

запись

х — Нр,

р = Нх

 

уравнений (2) и (5).

 

 

 

 

 

 

 

 

 

 

 

Перейдем к описанию лагранжевой формы принци­

 

па максимума. Напишем функцию Лагранжа задачи

 

(1) — (4), такую же, как и в § 2.3:

 

 

 

 

Jп Ldt,

 

& =

(/„I ^

(tQ, х (to))) + (/, I h, (tu

x (/,))) +

 

где

 

 

 

 

 

 

 

 

 

 

 

 

u

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

L (t, x,

x,

и,

p,

Я0) =

(p \x — qp (t, x, u)) +

Xaf (t, x, u)

 

•— лагранжиан задачи

(1) — (4).

 

 

 

в

лагранжевой

 

Т е о р е м а

 

Г

(принцип

максимума

 

форме).

Пусть

*(/),«*(/)) — оптимальный

управляе­

 

мый процесс

в задаче

(1)

(4),

определенный

на от­

 

резке [/о*, /i*].

Тогда существуют не равные одновремен­

 

но нулю

число Яо ^ 0,

векторы

/0 е

Rs°,

/, s

R*'

и не­

 

прерывная п-мерная вектор-функция p(t),

при которых

L

а)

почти

всюду

на

отрезке

[То*, ^1*] лагранжиан

удовлетворяет уравнению Эйлера по х:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

------

О

 

 

 

(50

 

 

 

 

 

 

 

 

 

*=*. (11

 

 

 

 

 

 

u = u , { t )

икраевым условиям

==(A)*j х* (A),)) lo,

/г*

L>x

==

x*

l\‘,

( 6 0

 

146 ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ

б)

почти при всех t из [/0„

Л*]

лагранжиан L

дост

гает минимума по и при и =

и. (t)\

 

 

 

 

 

 

 

L(t, x.(t),

x.(t),

u.(t),

p(t),

A0) =

 

 

 

 

 

 

 

 

 

 

 

 

= min L (0

(О, X .

(0,

U ,

P

(t), A0);

(7')

 

 

 

 

U

E ( j

 

 

 

 

 

 

 

 

 

 

 

 

 

в)

функция

Лагранжа

3

дифференцируема

no t

справа в точке to,,

по t\

слева в точке t\* и

 

 

 

 

 

OS’

 

 

=

0,

дзе

 

 

 

= 0,

 

 

( 8' )

 

 

dt$ Ч- 0

 

 

с)t,

— О

 

 

 

 

где через

 

д

0

соответственно

dt ^о) ооозначены пра-

 

dt +

вая (левая) производные.

 

 

 

 

 

 

 

 

 

 

 

Проверка

эквивалентности

обеих

 

формулировок

принципа максимума не представляет труда. Действи­

тельно,

 

 

 

 

 

L = (p\x) Н.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Поэтому

соотношения

(5)

и

(50,

(6)

 

и

(60

и

(7)

н

(70 попарно эквивалентны. Осталось проверить эквива­

лентность соотношений

(8) и

(80Отметим, что непре­

рывность гамильтониана не является независимым ус­

ловием. Она вытекает из (5)

и (7)

(это

будет видно из

доказательства) и, следовательно, из (50

и (70-

Далее,

в силу (70

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

& Vo, U, X. (•), ... ) =

(/о Ih0 do, X. (/„))) +

(/, |/г, (/„ -V. (0 )))+

 

 

 

+ Jt, {(p (t)\ x .(t))-M (t,

x.(t), P(t),

K)\dt.

 

 

 

 

*0

 

 

 

 

 

 

 

 

 

 

 

 

 

Поэтому

при e >

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3? (to, + e,

t\, . . 0

— 3

(to*,

t\, . . .) =

 

 

 

 

 

 

 

 

(to

| ho (to, +

e,

x, (to,

-f- e)) — ho

(to*,

x* (to,)))

1

 

*o* +e

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

-

j

[(P (t)

IX, (t))

-

m (t, X,

(t),

p ( t ) ,

A0)] d t

=

 

*a*

 

=

e ( / 0 I/го.» (to,,

x, (to,)))

+

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(

* 0 * + 8

\

/

lo\hoc(to„ x,(t0*))

 

 

+ 6 2@(to., x* (to,),

p (to*),

Ao)

J

-j-

^0*+E

\

x,*(t) dt I— (p(/o*)

+

о (e) =

 

§ 2.4. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА

147

силу первого

равенства в

(6))

 

=

£ [(/о Ihot {to-,

Хь^О:))) + Ж (to.-., .V, (/,),), р (ф*)> А,о)] + о(е).

Полученное равенство влечет

эквивалентность

первых

соотношений в (8) и (8'). Аналогично проверяется и эквивалентность вторых соотношений.

Теорема Г и, следовательно, принцип максимума Понтрягина, является еще одной реализацией сформу­ лированного во введении принципа Лагранжа, соглас­ но которому необходимые условия экстремума в задаче с ограничениями совпадают с необходимыми усло­ виями экстремума функции Лагранжа при ограниче­ ниях, не включенных в эту функцию. В самом деле, если множители Лагранжа Яо, /о, h, p(t) фиксированы, то функция Лагранжа 3? зависит от трех групп перемен­ ных: фазовых траекторий x(t), управлений u(t) и мо­ ментов времени to, А- Если теперь отрезок [4, Б] и уп­ равление u(t) зафиксировать, то задача о минимуме функции Лагранжа по x (t ) имеет вид классической за­

дачи

Больца, а утверждение а)

теоремы Г означает,

что x*(t) удовлетворяет необходимому

условию мини­

мума

функции Лагранжа по x(t)

при

фиксированных

u(t) =

u#(t) и to = to*, ti — Б*-

 

 

Точно так же, утверждение б) теоремы V необходи­ мо и достаточно для того, чтобы функция Лагранжа до­ стигала минимума по всем допустимым управлениям

(это единственное ограничение, не включенное в функ­ цию Лагранжа, поскольку оно не носит функциональ­

ного характера!) при фиксированном отрезке

[ф*, Б*] «

траектории x*(t) в точке u (t)— u*(t). (Это

утвержде­

ние следует из интуитивно очевидной формулы

 

и

t,

inf Г g(t, и (t)) dt =

f inf g(t, u) dt,

U(t)fEU f

U<S(J

строго доказанной в гл. 9 при значительно более общих предположениях.)

Отметим

далее, что вектор-функции

x*(0> и*(0 и

p (t) можно

продолжить левее точки ф*

и правее точки

Б* так, чтобы функция Лагранжа стала дифференци­ руемой по to и tx в точках ф* и Б* соответственно. Для

148

ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ

этого нужно, чтобы х*(/) и p{t) оставались непрерыв­ ными, а «*(0 удовлетворяла соотношениям

lim Hit, x,{t), и* {(), p(t), Я0) = Ж (to,, х» (/0«), р (к,), Я0),

о*

 

lim Н (/, х*(/), «,(/)> р(0. Я0) =

(/ft*, х. (<1«), р(!ч*), Я0).

<46*

 

В этом случае из приведенной выше выкладки следует,

что

в

силу (8')

производные функции Лагранжа

по ta

и

в

точках ^о*

и liif соответственно равны нулю.

Дру­

гими словами, утверждение в) теоремы 1 ' означает, что моменты времени /0* « удовлетворяют необходимым условиям минимума функции Лагранжа по /0 и ti.

Выше мы отметили, что единственным ограничением, не включенным в функцию Лагранжа в теореме 1', было условие (3). Однако в конкретных случаях в функ­ цию Лагранжа можно не включать и некоторые другие ограничения, главным образом граничные условия тина закрепленных концов и закрепленного времени. При этом соответствующие условия трансверсальности ис­ чезают и (снова в подтверждение принципа Лагранжа) оставшиеся соотношения совпадают с необходимыми условияхми минимума функции Лагранжа при ограниче­ ниях, которые в эту функцию не были включены. Дей­ ствительно, если, например, h0 — х — х0 (закрепленный левый конец), то первое условие в (6) означает, что р (/„)== /о; если ho = t а (закрепленный левый момент времени), то первое условие в (8) принимает вид

Ш= — /0 и т. д. Таким образом, множители Ла­

гранжа, соответствующие закрепленным концам, сов­ падают со значениями p(t), а множители Лагранжа, соответствующие закрепленным моментам времени, — со значениями гамильтониана в соответствующих точ­

ках и

не

несут

более никакой

информации.

Если

р(/) =

0,

то

и все

эти множители

равны нулю.

Мы не

коснулись

условий,

гарантирующих

неравенство

Яо Ф 0.

Они очень громоздки и обычно проще непосредственно проверить, что Яо Ф 0.

До сих пор мы говорили о задаче с интегральным функционалом. В задаче с терминальным функционалом

§ 2.4. ПРИНЦИП МАКСИМУМА ПОНТРЯГ'ИНА

149

ф(/ь x{ti))

функция Лагранжа имеет вид

 

2? = (/01А0

*Ш + {hIА|(*„ л(/,))) +

 

 

+ А,0ф(^, х (tt)) + Jh(/?(/) — qp(t, х,

и)) dt,

и все соотношения принципа максимума получаются из нее так же, как и в теореме Г. Соответствующее дока­ зательство ничем, по существу, не отличается от дока­ зательства принципа максимума для задач с интеграль­ ными функционалами.

2.4.2. Элементарное доказательство принципа макси­ мума для задачи со свободным правым концом. Рас­ смотрим задачу оптимального управления со свобод­ ным правым концом и закрепленным временем:

« ( • ) ) = J f(t,

X, и) dt -> inf;

(9)

*0

 

 

 

* = ф (/,

X,

и),

(10)

U€EU,

 

(11)

X ( t 0) =

x0.

 

(12)

Принцип максимума для такой задачи доказывается совсем просто, если предположить, что оптимальное уп­ равление кусочно-непрерывно.

Прежде всего выясним, что мы должны доказать. Пусть управляемый процесс (x*(t) , w*(f)) оптимален, причем управление «*(/) кусочно-непрерывно. Тогда по теореме 1 должны существовать не равные одновремен­

но нулю число 70 0 и вектор-функция p(t)

такие,

что

а) вектор-функция

p(t)

удовлетворяет

дифферен­

циальному уравнению

(5)

и второму

краевому условию

в (6), принимающему в данном случае вид

 

 

 

Р(*д =

0;

 

 

(13)

б) почти при всех

t

выполнено

соотношение

(7).

Если бы Хо равнялось нулю, то p(t) была

бы реше­

нием уравнения

 

 

 

 

 

 

i f О '

Р = — Ф*(^> *.(0, ut (t))p

(14)

150 ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ

Сусловиями (13), т. е. p(t) должна была бы тождест­ венно равняться нулю. Поэтому случай Яо = 0 исклю­ чается, и без ограничения общности можно считать, что

/•и — 1- Таким образом, нам нужно проверить, что ра­ венство

« ! Ф(t, х,

(/), и. (/))) -

f (/,

лс. (0,

и, (/)) =

 

 

=

тах[(р(/) |ф (/,

x,(t),

u)) — f(t,

*.(/), «)]

(15)

 

iK^U

 

 

 

 

 

 

выполняется почти всюду на [/о, Л],

если

p { t ) реше­

ние сопряженного уравнения

 

 

 

 

Р = — ф* U, х, (0,

и. (/)) P +

fx (/, х, (t), и.(0)

(16)

с конечным условием p(t\) = 0.

 

выполняется в каж­

Л\ы докажем, что равенство (15)

дой точке непрерывности управления и*(/), принадлежа­

па

щей

интервалу

(t0, ti).

 

Доказательство

осно­

 

вано

на

непосред­

 

ственном

применении

 

«игольчатых» . вариа­

 

ций

управления

»*(/)

 

п, по существу, пред­

 

ставляет

собой

моди­

 

фикацию

доказатель­

 

ства

условия

Вейер-

 

 

 

 

 

штрасса,

которое

было

Итак, пусть

т — точка

изложено

в

§ 2.2.

непрерывности

управления

«*(/). Зафиксируем некоторый элемент

 

 

и

рас­

смотрим управление

 

 

 

 

 

 

 

 

и (/; т, Я) =

их (t) =

u,(t),

если

t ф.[х — Я,

т),

(17)

и,

 

если

1 е [ т — Я,

т)

 

 

 

 

 

— игольчатую

вариацию

 

управления

м»(/)

(рис. 7).

Обозначим

через x\(t) =

x(t; т, Я)

решение уравнения

(10) с начальными

условиями (12), соответствующее

управлению

ux(t).

По

условию

X\(t) — x*(t),

если

— Я.

Кроме того, поскольку

задача

Коши

Соседние файлы в папке книги из ГПНТБ