Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Иоффе, А. Д. Теория экстремальных задач [учеб. пособие]

.pdf
Скачиваний:
16
Добавлен:
22.10.2023
Размер:
15.51 Mб
Скачать

 

§

5.1. ЛОКАЛЬНО

ВЫПУКЛЫЕ ЗАДАЧИ

 

241

Из (10) и (13) сразу следует,

что taj + а/ (0 > 0

при

всех t <= (0, *],

так что

 

 

 

 

 

 

 

 

Ф(х,

ta-\- а (t)) — F(х, v (х,

ta +

а (/))),

 

откуда,

полагая

 

 

 

 

 

 

 

 

 

 

x(t) = X' +

tx +

x (/),

й (/) =

v(x (t),

ta + а (/)),

 

получаем в силу

(9)

 

 

 

 

 

 

 

 

 

 

 

 

F(x(t),u(t)) =

0.

 

 

(16)

С другой

стороны,

из

второго

неравенства в усло­

вии б г )

следует,

 

что

при 1 е [ 0 ,

/]

и всех

1 — 0,

п

Й (0 Х Ы *(0 . «0 +

 

 

 

 

 

 

 

т

 

 

 

 

 

 

 

 

 

 

 

+

2

+

а у ( 0 ) (fi {х( 0 , « ; )

ft ( * ( 0 ,

« . ) ) +

 

 

/= 1

 

 

 

 

 

 

 

 

 

 

 

 

 

+

б

(||

+

х

( 0 1| +

2

( / а / +

а ,

( / ) ) ) .

(1 7 )

Согласно (10)

и (13)

*-1 ||л:(/) 11<сг. Поэтому

в силу

(12)

при 0 < t ^ min (t,

а )

 

 

 

 

 

 

 

 

ft(■х (t),

и ) <

f, (*..

м.) + * (ft(х

*) + с).

(18)

Сопоставляя далее соотношения (10), (13) и (15) и учи­ тывая, что x ( t ) - > X ' при t >-0, получаем

т

2 (ta{ +

a, (t)) (ft (х (t), й/) —ft (t), и,)) =

 

 

т

 

 

 

 

= t 2 а

j(ft(x„

« ; ) — fl(X„

« . ) ) +

 

 

J = 1

 

 

 

 

 

т

 

 

 

 

+

2 « /

(0 (/< (*.,

й,) ft (х„

и.)) +

 

т

/=1

 

 

 

 

 

 

 

 

+

2

(taj + ajitytfiixit), йj) ft (х„ й,) —

 

/=!

 

 

 

 

— fi(x(t), U.) + ft(Xt, « .)]<

242

ГЛ. 5. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ

Наконец, согласно (10) ц (14)

 

т

a.i -f- t-1 (и^(0н+ Si «/(о ill <

^ ^6

|х |-f- S

 

 

 

 

 

V

/=1

 

/.

Из (17)—(20) следуют неравенства

 

 

 

f i ( x ( t ) , zi ( О Х / г (*.>

«.) + t [/• (*,, и\ *) +

 

 

 

т

 

 

 

 

 

 

 

 

 

 

+ S

О/ (/; (*.,

й,) — / г (л:,,

и,)) +

Зс] + о (t),

справедливые при

всех г =

0,

1,

п,

/<=[0, min(F, о)].

Если

то

согласно

(11),

 

 

 

 

 

ft (х (t),

й (0) < U {х„ и,) — tc +

o (t)

(21)

при достаточно малых /. Если же k-\-\

 

то

 

lim fi (x(t),

й (0) <

fi (**, a.)

<

0.

(22)

Соотношения (16),

(21)

и (22)

показывают, что при

достаточно малых

/ > 0

пара

(x{i),

u{t))

допустима

в задаче

(1)—(4)

и f0(x(t),

u ( t ) ) < f 0{x„

«.)•

Поскольку

x(t)~ *xt

при /->

0,

это значит,

что

точка

{х„ u j не

может быть точкой локального экстремума, в противо­ речии с условием теоремы.

Таким образом, осталось проверить, что при O econvC

найдутся х ^ Х , й , е £ / , . . . , Um^ U и aj > 0, . . . , ат> 0,

удовлетворяющие соотношениям (5)—(7). Если O econvC,

Т Л П А А П П Р 7 Т < + 7 Т Р Н 1 П А Л У И Т О Р Т П У Т Л Т V . (= . У 1!~. £ = I I

i — 0, . . . , k.

 

§ 5.1. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ

243

Далее,

коль скоро 0 е

int В, как

и

в

§

1.4, можно

выбрать

векторы х х<= X

и у х, . . . ,

yt

из

сот F (xt, U)

таким образом, чтобы линейная оболочка множества L0\){yx.........Vi) совпадала с У и

 

 

 

Fx(*., и.) х, + ух+ . . .

+ г/, = 0.

 

 

Тогда для каждого

номера

s = l ,

. . . .

I найдутся числа

ysI >

0, . . . .

ysms >

0,

в сумме

равные единице, и точки

us.......... usms

из и

такие, что

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ms

 

 

 

 

 

 

 

 

 

 

 

 

iJs='%i VsiF(x.,

us]).

 

 

 

Поэтому линейная

оболочка множества

 

 

 

 

Д) U iF (*..

usj) l-s = 0,

. . . .

 

/;

/ =

1.........ms)

 

совпадает

с

У и

 

 

 

I

m s

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Fx (*.. «.) ^ 1 + 2

2 YsjF (х„

usj) = 0.

(25)

 

 

 

 

 

 

 

 

S=1

/= 1

 

 

 

 

 

 

Наконец, воспользовавшись соотношением (24) и

не­

прерывностью функций х -* -/'(х >(

м ; х), можно выбрать

такое

число е >

0,

что

при

всех

/ = 0, 1, . . . ,

k

 

 

 

 

 

 

 

 

т 0

 

 

 

 

 

 

 

 

f'i (*.>

h

+ ex,) +

2

То/ (fi (*.>

ti0j) — fi (*„ «.)) +

 

 

 

 

 

 

 

 

l

m s

 

 

 

 

 

 

 

 

 

 

 

 

+

e 2

2

Уsi (fi (*„> «*/) — fi (*,-

«.)) <

o.

 

 

 

 

 

 

S=1

/= 1

 

 

 

 

 

 

 

При этом

в силу (23) и (25)

 

 

 

 

 

 

 

 

 

 

 

 

 

т о

 

 

 

 

 

 

 

 

Fx (х,,

и,) (х0+ ех,) +

2

Уо1 (F (х.,

u0J) F (х„ «,)) +

 

 

 

 

 

 

 

 

г

 

 

 

 

 

 

 

 

 

 

 

 

 

+

е 2

2 ySi( F( x„ Usj) — F(x„

и . )) =

0.

 

 

 

 

 

 

s=l

/=1

 

 

 

 

 

 

 

Таким

 

образом,

набор,

образованный

вектором

Xo +

exi, точками

«оь •••, Щт,

из

U и числами у01, . . .

•••>

Yom9'

еУц’ •••>

8Y/OT/i

Обладает

требуемыми свой­

ствами (5) — (7).

Теорема полностью доказана.

 

 

244

ГЛ. 5. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ

§ 5.2. Задачи оптимального управления с фазовыми ограничениями

Этот параграф содержит формулировку и обсужде­ ние принципа максимума Понтрягина для задач опти­ мального управления с фазовыми ограничениями. Дока­ зательство приводится в следующем параграфе.

5.2.1. Формулировка принципа максимума. Рассмот рим сначала задачу оптимального управления с закреп­ ленным временем:

 

 

ч

 

 

 

3

(•), и (•)) =

J / (t, х,

и) dt - » inf;

(1)

 

х = ф(/,

х, и),

 

(2)

 

и е

U,

 

(3)

 

М *('о)) =

М *(М ) =

0,

(4)

gi(t,

x(t))*^ 0, / е

[/„,/,],

fe.

(5)

На протяжении этого и следующего параграфов, за ис­ ключением специально оговариваемых случаев, пред­ полагается, что функции

/: R X R" X Rr —> R,

gr R X R " - > R

и отображения

 

Ф: R X R rtX R r - > R n, hp

R“ -*R*i ( / = 1 , 2)

непрерывны и непрерывно дифференцируемы по х. (Как обычно, U cz Rr.) Подчеркнем, что, в отличие от § 2.4, дифференцируемости функций и отображений по t не требуется. В качестве допустимых управлений, как и в § 2.4, рассматриваются произвольные измеримые огра­ ниченные вектор-функции, принимающие значения из

множества U.

2,

 

сформулируем

принцип

максимума

Как и в

гл.

 

Понтрягина

в двух

эквивалентных

формах — гамильто­

новой и лагранжевой. Введем снова функцию

Понтря­

гина

 

 

 

 

 

 

 

 

H(t, х, и, р,

А,0) = (р|ф(*,

*. u))— k0f(t,

X,

и)

и гамильтониан

 

 

 

 

 

 

 

2#(/,

х,

р,

А,0) = sup

H(t,

х, и, р, ко).

 

 

 

 

 

u^U

 

 

 

 

 

§ 5.2. ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

 

 

245

Т е о р е м а

1

(принцип

максимума

в

гамильтоновой

форме). Пусть (**(•).

«*(•))— оптимальный управляе­

мый процесс

в задаче

(1)

— (5).

Тогда

существуют не

равные

одновременно

 

нулю

число

К0 ^

0,

векторы

10«= Rs\ U е

 

вектор-функция

р( - ): [/<,, /i]-*

Rn

и

неотрицательные регулярные меры р{,

i =

1,

 

k, на

[f0, ti], сосредоточенные

 

соответственно

на

множествах

 

Ti

[*0| f,] |gi (t, xt (/)) =

0},

 

 

 

 

такие, что

 

 

р(-)

является

решением

инте­

а) вектор-функция

грального уравнения

 

 

 

 

 

 

 

 

 

 

 

p(t) = - h i ' ( x j t l))h +

 

 

 

ft

*i

 

 

 

 

 

 

11

 

 

 

 

 

 

 

 

 

 

 

 

+ [ Пх(х, x,{x),u,(x),p{x),‘k0)dx~

J

gix (t, xt (т)) й?рг (6)

t

 

 

 

 

 

 

<=i t

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

(7)

 

 

 

p{to) =

h ? (x ,№ lo ,

 

 

 

 

 

б) почти при

всех

t

из [/0, ^i]

выполняется

равен­

ство

 

 

 

 

 

 

 

 

 

 

 

 

 

 

H (t,

х, (*), и, (t), р (0, Л„) =

Ж (t,

{t), р (t),

А0).

(8)

Уравнение

(6), как и в задаче без фазовых ограниче­

ний, называется сопряженным. Нетрудно видеть, что в случае, когда все меры щ — нулевые, т. е., в частности, при отсутствии ограничений на фазовые координаты, это уравнение сводится к дифференциальному уравне­ нию, полученному в гл. 2. В задачах без фазовых огра­ ничений функция /?(•)— абсолютно непрерывная функ­ ция. При наличии фазовых ограничений из-за присут­ ствия в уравнении (6) интегралов по мерам р* функция р(-) может иметь разрывы. Однако она всегда является функцией ограниченной вариации, непрерывной слева (из-за регулярности мер рг).

В формулировке теоремы не исключается случай, когда одна или обе концевые точки оптимальной траек­ тории лежат на фазовых ограничениях. Поэтому меры Pi могут содержать ненулевые массы, сосредоточенные

246 ГЛ. 5. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ

в точках t0 и ti. В этом случае, как следует из соотно­

шений (6)

и (7),

 

 

 

 

 

 

 

 

 

 

 

lim

p (t)

=

-

hi* (х, (/,)) h +

S gix (tu x, (/,)) ji, ({*,]);

(9)

 

t < t \

 

 

 

 

 

 

i = 1

 

 

 

 

 

 

 

 

lim

P (0 =

Л6* (x, (t0)) to +

2

 

(/o,

*. (*o)) M’i ({^o))i

 

(Ю )

 

t - * t „

 

 

 

 

i =

i

 

 

 

 

 

 

 

т. e. p(0 может

иметь

разрыв в

точке

t0.

Если

же

gi(ti,

x,(ti)) <

0

и

gi (t0, х, (tQ)) <

0,

то точки

t0 и

tx не

принадлежат

ни

одному из множеств Tt, рЛ{^о)) =

= Hr((М) = 0, p(t)

непрерывна в точках

/0.

U и выпол­

нено

условие

трансверсальности

р (to) =

ho (х, (to)) to,

p{ti) = — hi(x,(U)) l\.

 

 

представляет

собой

 

Сформулированная теорема

еще одну реализацию принципа Лагранжа.

Если запи­

сать функцию Лагранжа

задачи

(1) —

(5)

в виде

 

 

2

= do I ho (X(to))) +

(/, 1A, (x (*,))) +

 

 

 

 

 

 

 

 

fL

 

 

 

 

 

 

 

 

 

 

 

 

 

+

j

[(p (t) I * (0 Ф (*, * (0. u № + hfi {t, X (t), и (/))] dt +

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

t x

 

 

 

 

 

 

 

 

 

 

 

 

 

+ У)

J gi(t, X (t)) dpt,

i=1/,

то окажется, что соотношения (6), (7) эквивалентны условию стационарности функции Лагранжа как функ­ ции переменного *(•) в точке **(•), а равенство (8) есть, очевидно, необходимое и достаточное условие то­ го, чтобы функция Лагранжа достигала минимума по и(-) в точке «*(•)■ Читатель сможет убедиться в этом,

анализируя

доказательство

теоремы

1

в

следующем

параграфе.

Поэтому теорема

1 допускает такую эквива­

лентную формулировку.

максимума

в

лагранжевой

Т е о р е м а

1' (принцип

форме).

Пусть

(дс,(•),«*(•)) — оптимальный управляе­

мый процесс в задаче (1) —

(5). Тогда существуют та­

кие не равные

одновременно нулю число Ко ^ 0, векто­

ры /0 е

Rso,

Zie=Rs‘, вектор-функция

ограниченной ва­

 

§ 5.2. ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

247

риации p(t) и неотрицательные

регулярные

меры щ,

i = 1,

 

к, сосредоточенные на множествах

Ti соот­

ветственно,

что

 

 

 

а)

при

ы(-) = « * ( • )

вектор-функция х*(-)

является

стационарной точкой функции Лагранжа как

функции

переменного х( •);

 

 

 

б)

при х { - ) — х*(-)

функция

Лагранжа

достигает

абсолютного минимума по и(-)

в точке н*(-).

5.2.2. Задачи с незакрепленным временем. Мы уже обращали

внимание читателя на то обстоятельство,

что теорема 1 (в отличие от

результатов гл. 2) справедлива без предположения о дифференцируе­ мости по времени функций и отображений, участвующих в формули­ ровке задачи. В определенной степени это связано с тем, что предла­ гаемое в следующем параграфе доказательство использует иную тех­ нику. Существует, однако, и причина принципиального характера. Дело в том, что задачи с закрепленным временем естественно фор­ мулируются как задачи в некотором банаховом пространстве, имен­ но, в том или ином пространстве функций на заданном отрезке. Что касается задачи с незакрепленным временем, то ее, по-видимому, нельзя сформулировать подобным образом без какого-либо ее преоб­ разования, связанного, в частности, с тем, что время трактуется как фазовая координата. При этом требование дифференцируемости по времени становится неизбежным.

В гл. 2 для этой цели использовалась замена времени. Однако там она несла значительно большую нагрузку и с этим были связаны многие технические сложности в доказательстве. Если же принцип максимума для задач с закрепленным временем доказан, то замену времени можно использовать только для сведения общей задачи к задаче с закрепленным временем. Тогда она оказывается совер­ шенно естественным приемом, применение которого не связано с ка­ кими-либо трудностями.

Покажем, как с помощью теоремы 1 можно (исполь­ зуя замену времени) получить принцип максимума для общей задачи оптимального управления: __

(10

(20

( 3 0

( 4 0

( 5 0

В отличие от задачи (1) — (5) моменты времени to и h здесь уже не предполагаются фиксированными, и^ все

248 ГЛ. 5. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ

функции и отображения считаются непрерывно диффе­ ренцируемыми по времени.

Пусть управляемый процесс (дс*(-), «»(•)) опреде­ лен на отрезке [^о*, ^i»] и оптимален в задаче (Г ) — (5'). Введем новую независимую переменную т, меняющуюся на отрезке [0, 1], и рассмотрим такую систему уравне­ ний:

 

 

 

■ ^ - = 0 .

-ff- =

uqp

 

 

 

 

 

(11)

Если

(*(т), у {т ))— некоторое

решение

этой

системы,

соответствующее

управлению

(и(т),

w {т)),

и при

этом

о ( т ) > 0 ,

то

^(т)— строго

возрастающая

непрерывная

функция. Обратная ей функция, обозначим ее

т (t),

тоже непрерывна и возрастает.

В этом

случае x(t) =

— y ( i ( t ) ) — решение

уравнения

(2'),

соответствующее

управлению u(t) =

 

w (x(t) ) , и при этом

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

J

f ( t , x (t),

и (t)) dt =

J v (т) / (t (т),

у (т),

w (т)) dx.

(12)

t (0)

 

 

 

 

 

 

 

о

 

 

 

 

 

 

 

 

 

Так как о(т)

всюду больше нуля, эти утверждения три­

виальны.

Наоборот,

если x (t) — определенное

на отрез­

ке [г'о, ^i] решение

 

уравнения

(2'),

соответствующее

управлению u.(t),

то

(ti t0)x,

 

 

 

 

 

 

 

 

 

 

t(x) =

t0 +

 

y(x) =

x(t(x))

 

 

— решение системы

(11), соответствующее управлениям

v ( x ) = t i to,

w(x) =

u(t(x)),

и при

этом

справедливо

равенство

(12).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Поэтому

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t. (т) =

tQ, +

 

(ti* — to*) т,

 

г/, (т) =

(t, (г)),

 

 

Vt (х) = о, =

tu to*,

w, (т) =

ut (tt (т))

 

 

— оптимальный управляемый

процесс в задаче

 

 

 

 

 

J

1

 

 

 

 

 

 

 

 

 

 

(1")

 

 

 

 

 

vf(t,

у,

w)dx->\ni\

 

 

 

 

 

 

 

О

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

и,

 

=

шр (t, у,

w) ,

 

 

 

(2")

 

 

 

 

 

 

 

у >

0,

w e

и,

 

 

 

 

 

(3")

 

 

Ло(*(0),

 

У (0)) =

h, (t (1), у (1)) =

0,

 

(4")

 

gi(t{x), y{ т ))< 0 ,

t e [ 0 ,

1],

i = \ .........k.

(5")

§ 5.2. ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

249

Это уже задача с закрепленным временем, и к ней при­ менима теорема 1. Обозначим через Н функцию Понтрягина в задаче (1") — (5"):

Н (/, х, и,

v, р,

q, А0) =

 

 

 

 

=

Iиф (t, х, и)) +

q v — l avf (t,

х, и) =

 

 

 

— v(H(t,

х, и,

р, А0) -|- q),

(13)

где H — функция Понтрягина в задаче (1') — (5'). Поло­

жим далее

 

 

 

 

 

А( = | т е [ 0 ,

Ш & М т),

У.(т)) =

0},

г = 1 , . . . ,

k.

Тогда, в соответствии с теоремой 1, существуют не равные одновременно нулю число А0^ 0 , векторы

/0 <= Rs°, l{ е RS|, вектор-функция р (т), функция q (т) и неотрицательные регулярные меры цг, г = 1, . . . , k, сосредоточенные на множествах Аг соответственно и такие, что

Р (т)== — h\x {t, (1), y A i ) ) h

+

 

+ Ji Н,(/,(£),

у, (|), w, (|), »„ p(l), q (|), Ao)dg —

 

 

J Six (t*

yM))dfii,

 

 

1=1 T

 

9(t) = — {h\t(K (1).

y , ( l ) ) \ h ) +

 

i

 

 

 

+ / Н/ (/. (|),

y, (|).........A0) di -

 

P(0) =

Л5, (/. (0),

У. (0)) /о,

q (0) =

(hot (t, (0), y, (0)) |/0),

H (t. ( т ) ,

y„ ( t ) , w, ( t ), v„ p ( t ) ,

q ( t ),

A3) =

 

=

шах H (tt (т), у, ( t), u, v, p{x), q (t), A0).

250

 

ГЛ. 5. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ

Пусть

т. (0 — функция, обратная /, (т), т.

е.

 

 

 

t - t n

 

 

 

 

\ (0

 

*0*

 

 

 

 

h* ~ Ч*

 

 

 

 

 

 

 

Тогда,

если

обозначить

 

 

 

 

 

 

p ( t ) = p (т. (t)), q(t) =

q (т. (0),

= [t е [*о*> 1и\ |Si {t, х, (/)) =

0} =

f.(A <),

i = 1, . . . , k,

и определить меры рг формулами

 

 

h*

Ф (0

1

 

V4>(•) S

С ([/0*, /и])

J

= JФ (*.(*)) 4+

+0

(р,, очевидно, сосредоточены на Т{), то с учетом (13) написанные выше соотношения преобразуются к сле­ дующему виду:

 

 

 

 

*1*

 

 

 

 

 

р (t) =

-

h\x (/,„

х, (/u)) /i+ |

Нх (1, х. (|), и. (£), р (|), ho) d l -

 

 

 

 

t

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

’ S

I

Sixit,

x,{D)d\ii',

(14)

q(t) =

(hu(h*,

x* (/i«)) 11\) +

< = i

t

 

 

 

 

ft

t

 

 

+ J

 

 

 

 

 

 

 

 

(£>■*■* (l)>

•••» h o ) d ^

 

 

J

S i / (£> x t (£)) d p i,

(1 5 )

t

 

 

p (to*) =

 

г=1 <

 

 

 

 

 

 

box (to*,

x* (+)) /о,

 

(16)

 

 

 

q (to*) =

(hot (to*,

X, (to*)) |to),

 

(17)

vt (H (t,

x, (/), u, (t), p (t),

ho) + q (0) =

 

 

 

 

=

max v (H (t,

x, (/),

u,

p (/),

hQ) + q (/)).

(18)

 

 

 

ue= С/

 

 

 

 

 

 

 

 

 

 

v > 0

 

 

 

 

 

 

 

Из (18) следует, что

 

 

 

 

 

 

 

Я (t,

х, (t), и, (t),

p (t), h0) =

max Я (/, x, (t),

u, p (t), h0),

(19)

 

 

 

 

 

net/

 

 

 

 

ипоскольку о, > 0 также следует, что

%{t, xt (t), p(t), Я0) = — q(t).

Соседние файлы в папке книги из ГПНТБ