Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Васильев Ф.П. Лекции по методам решения экстремальных задач

.pdf
Скачиваний:
41
Добавлен:
25.10.2023
Размер:
14.17 Mб
Скачать

250

МЕТОДЫ

М И Н И М И З А Ц И И В

Ф У НКЦ И О НАЛ ЬНЫ Х ПРОСТРАНСТВАХ

[Гл. 6

 

б) а „

определяется

из

условия

J ( u n) /(m„+i) ^e||«n— «„+il|2,

где Un+i имеет вид

(2), е — параметр алгоритма, е > 0 ;

 

 

в) а п можно выбирать,

как это указано в п. 1е).

 

 

Т е о р е м а

2. Пусть

функционал

 

J (и) определен на выпуклом

замкнутом

множестве

U

гильбертова

 

пространства

Я , J (и) 6 С1 (U),

inf J (и) = J* >

— оо,

и градиент J ' (и)

удовлетворяет условию

ЛИЛ­

ЛЕЦ

'

 

 

 

 

 

 

 

L =

 

 

и, v 6 U.

 

шица I J' (и) J' (и) |< L |и — v ||,

const > 0 ,

Пусть

и0— произвольная начальная точка

из

 

U

и последовательность {ип}

определена

по

формуле

(2)

с выбором

параметра

а п из условий

0 <

ех < а п <

L +

 

Qi>-

•заданные положительные

числа,

 

 

 

 

 

 

 

 

 

 

 

 

 

0 < 8 1 < -

2

 

Тогда

 

 

 

 

 

 

 

 

 

L +

 

 

 

 

 

 

 

 

 

 

j (ип) j

(«Д+0 >

8II ипип+1|Р,

п =

0,

1, .. • , limIIип— wn+,II = 0

 

 

 

 

 

 

 

 

 

 

 

 

Д -*о о

 

 

{если Я = Я ,

то равенство lim||«„— Wn+i||= 0 равносильно П т У' (ип) = 0).

 

 

 

 

 

 

 

Д -»оо

 

 

 

 

 

Д -*э о

 

 

Если, кроме того, J (и) — выпуклый функционал, и множество

M^{uo) — {u :u ^ U ,

J (и) s£ZJ(и0)}

ограничено, то

последователь­

ность {и„} является минимизирующей, и любая ее слабая предель­

ная точка будет точкой минимума J (и)

на U, причем в случае един­

ственности

точки

минимума к

ней слабо сходится вся последова-

тельность

{«„};

справедлива

оценка

Q

0<СУ(«„)— J* -С ——, С\ =

= co n st> 0 ,

п = 1, 2, ...

 

п

 

 

Если / («),

кроме того, сильно выпуклый функционал на U, то

{ип} сходится

к

единственной

точке минимума ы* по норме про-

 

 

 

 

Q

п = 1 , 2, ..., C2= c o n s t> 0 .

странства Я , причем \ип— ы*|р<——,

 

 

 

 

11

 

Доказательство этой теоремы полностью аналогично доказа­ тельству теоремы 2.3.2 с той лишь разницей, что вместо классиче­ ской теоремы Вейерштрасса здесь нужно использовать теорему 1.4 так же, как это мы делали только что при доказательстве тео­ ремы 1.

Если множество U имеет вид U— {и : gi{u) ;^ 0, i = l , 2, .... s}, где gi(u) — заданные функционалы из С1 (Я ), то для минимизации

•функционала 7 ( « ) е С ‘ (Я ) на U можно применить метод возмож­ ных направлений [59, 117, 135, 193, 196]; один из вариантов этого метода в Я-пространствах может быть описан также, как в § 2.4.

3. Метод проекции опорного функционала. Пусть выпукл функционал /(«) в каждой точке и замкнутого выпуклого множе­ ства U имеет опорный функционал 1{и).

§ 2]

Некоторые методы минимизации функционалов

251

Метод проекции опорных функционалов заключается в пост­ роении последовательности {ип} по правилу

Un+ 1 = Р ц ( ипа н

\ п = 0, 1,

\III Ы II J

где а п — произвольная

последовательность

со свойствами а пХ ) ,

 

00

 

 

а л -» 0 (п-^оо),

а г =

оо /например,

а п —

 

i=o

'■

п -4- 1 ) -

 

 

Теорема 2.5.2 о сходимости описанного метода и ее доказательствополностью сохраняют силу и в Я-пространствах. О методах мини­ мизации негладких функционалов см., например, в работах [35, 154, 155, 187, 189, 193].

4. Метод условного градиента. Пусть U — выпуклое замк тое ограниченное множество в Я-пространстве, пусть функционал

J(u )^ C '(U ) .

Метод условного

градиента

заключается

в

следую­

щем:

если Un

(п ^ О )

уже известно, то берем главную

линейную

часть

J n (u )s= (J'(u n),

ии п )

приращения

J (и)— /(ип) =

( Г ( и п) ,

иип)-\-о(\\и— ып||) и определяем

вспомогательное

приближение-

йп^ .и из условия

 

 

 

 

 

 

 

 

 

 

 

J n Ы

=

min J n(u) или (/' п) , йп) =

min (5 „), и).

(3>

 

 

 

иеи

 

 

 

 

 

uEU

 

 

 

 

Затем

полагаем

[35, 36, 82,

93,

94,

97,

124, 154,

155,

179,

229]

 

 

 

un+i =

ип +

ап (ип — ип),

0 <

a n <

1,

 

 

(4>

где а п может быть выбрано, например, одним из следующих спосо­ бов — а), б), в ):

а)

8п К )

=

min gn (а ), gn (а) = J ( u n + а (йп — ип)),

 

 

(5>

 

 

 

0 < а < 1

 

 

 

 

 

 

 

 

б)

J (un) j

(un+i) > е а л I J n (un) 1,

0 <

а„ <

1, где

е —- параметр-

алгоритма;

0 -< е <

1;

 

 

 

 

 

 

 

 

в) если

|J' (и) J' (о) ||< L I и v | при

всех u ,v £ U ,

L =

const >

0,

то

а п можно

определить

так:

 

а п — у„рл,

где

р„ =

= mi nl l ;

——

 

 

— J, ех < ; у л < —- — —, ех

и

е —.параметры

алго-

 

I

11«„-М 3 I

 

L

 

 

 

 

 

 

ритма,

 

 

 

2

(1 _е)

 

Заметим,

что приведенное здесь.

0 < е 1 •<------— -, 0 < е < 1.

описание

метода

условного

градиента сохраняется без

изменений

и в 5-пространствах.

 

 

 

 

 

 

 

 

Т е о р е м а

3.

Пусть U — выпуклое

замкнутое

ограниченное

множество в Я-пространстве (или рефлексивном 5-пространстве),

■ 252 МЕТОДЫ М И Н И М И З А Ц И И В Ф У НКЦ И О НАЛ ЬНЫ Х ПРОСТРАНСТВАХ \Гл. «Г

пусть функционал

/ ( п ) е С 1(Д),

inf J(u) — J*^> — оо

и градиент

J'(ti) удовлетворяет

условию

 

u £ U

\\J'{u)J'(v) ||^L||«— t>||

Липшица

при всех и, v<=U,

L = c o n s t> 0 .

Тогда

последовательность {w„},

удовлетворяющая

условиям

(3) — (5),

существует

и

J n(u„) =

= (/'(мп),

йп— п„)->-0

г(/г->оо)

при любом

выборе u0^U .

 

Если,

кроме того,

/ (и) выпуклый функционал на

U,

то после­

довательность {н,,} является минимизирующей и любая ее слабая предельная точка будет точкой минимума J (и) на U, причем в слу­ чае единственности точки минимума к ней слабо сходится вся по­ следовательность {«„}. Справедлива оценка

0 < ая = / ( ия) - / * < - ^ 1 л = 1, 2,

(6)

п

 

где С — положительная константа, независнмай от п.

Д о к а з а т е л ь с т в о . Пусть

начальное

приближение

u0^ U

выбрано произвольно. Пусть уже известно

и„ (п^О ). Так как

J n{u) = (Л (м„), и— ц„) линейный

(и тем более выпуклый)

непре­

рывный функционал, то существование элемента й „ е Д , удовлетво­ ряющего условию (3), следует из теоремы 1.4.

Доказательство утверждения

/n (wn)-vO

(п->оо) проводится

дословно так же, как в теореме

2.6.1. Если /(и) выпуклый функ­

ционал, то

существование

/ (« * )= / *

следует из

теоремы

1.4, э т о т

факт, что {ип} — минимизирующая

последовательность,

является следствием неравенств (2.6.6).

 

 

В силу теоремы 1.2 множество U слабо

компактно,

поэтому

последовательность {п„} имеет хотя бы одну слабую предельную точку и*е£/, являющуюся слабым пределом некоторой подпосле­

довательности {a„fe}. Но J (и)

слабо

полунепрерывен снизу, поэ­

тому

 

 

J* = lim J (ип) =

lim J («„

) > J (а*) > /*,

П -» оо

 

 

т. е. J(v*) = J * . Если /(«) достигает своего минимума в единствен­ ной точке и*, то вся последовательность {«„} слабо сходится к и*.

Оценка >(6) выводится совершенно так же, как и подобная оценка (2.6.4) в теореме 2.6.1. А

Формулировку и доказательство теоремы сходимости метода условного градиента, когда величина а„ в (4) выбирается соглас­ но пп. б), в), предоставляем читателю, заметив лишь, что это де­ лается совершенно так же, как в теореме 2.6.2.

S 2]

 

 

 

Некоторые методы минимизации функционалов

 

253

 

5.

 

Метод сопряженных градиентов. Пусть

функционал J (и

£ С1(Я ).

Построим последовательность {ип}

по' правилам [35,

124,

166,

179,

190]

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

МцЦ-l

 

11ц

 

Ctt/iPm

f t

1» 2 ,

• • •,

 

 

 

 

 

 

Ро =

J ' («о),

Рп =

J' (ftn) — $пРп-1,

п =

1, 2,

. . . , .

 

где величины а п, (3„

выбираются из условий

 

 

 

 

 

 

 

ёп К )

=

min g n (а), g„ (а) == J

(и„ — арп),

 

 

 

 

 

 

 

 

а>0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(J'(un), J' (u„-i) — J' (и„))

ft h ,

 

 

 

 

 

 

 

 

 

 

 

 

II/'(«л-0 II2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

о ,

n

£

I z ,

 

 

 

 

 

 

 

а множества индексов /1,

/2

таковы,

что /iU^2 = {0,

1,

2, ...},

0е / 2.

На

практике

часто

 

принимают

/2= { 0 ,

щ, п2, ...},

где 0 < n i <

< п 2<

... — заданная

последовательность,

например

n u = ks,

s

некоторое натуральное

число, k — 0,

1, 2........... Если

/2={< ?},

11=

= {1, 2,

...}, то этот метод превратится в метод скорейшего спуска.

Сходимость метода сопряженных градиентов для сильно выпуклых функционалов в Я-пространствах доказывается совершенно так же, как в теореме 2.7.2.

Приведенное здесь описание метода сопряженных градиентов предполагает, что £/= Я . Если же И ф Н , то можно использовать проекцию описанного метода ип+\= Ри (ипа прп), выбирая ап> 0 , например, из условия J(u n+i) < J ( u n).

6.Метод Ньютона [4, 27, 35, 46, 75, 81, 82, 130, 152, 155, 1

Пусть U — выпуклое замкнутое множество в Я-пространстве

(или

в 5-пространстве), функционал J(u)<=C2(U). Пусть ип ( п ^ 0)

уже

известно. Тогда берем главную квадратичную часть

 

J n (и) = (/' п), и un) + - L (J" (ип) (и — un) , u — un)

 

приращения J (и)J(u n) = J n (u)-\-o(\\u— и„||2) и определяем вспо­ могательное приближение ип из условия

J.n (un) min J n (и).

 

u £ U

Затем полагаем

 

Чп+1 = ип +

0 < а л < 1,

где а п может быть выбрано, например, одним из следующих спо­ собов:

254

МЕТОДЫ

М И Н И М И З А Ц И И В

Ф У НКЦ И О НАЛ ЬНЫ Х

ПРОСТРАНСТВАХ

[ Г л . S

 

а)

а ,1 = 1 , п = О, 1, 2,

...

(здесь имеем дело с методом Ньютона

в его классическом виде);

 

 

 

 

 

 

б)

ёп Ю

= min g„ (a),

gn (а) = J (ип +

а (йп— гг,,));

 

 

 

 

0<а<1

 

 

 

 

 

 

в)

J {ип) — 7 (« n+i) ^ е а „ | /„(«„) |, где

е — параметр алгорит­

ма,

O C e C l,

а величина

а п выбирается

как

можно ближе

к 1,.

0 < а „ ^ 1 . Сходимость вариантов а), в) метода Ньютона доказы­

вается совершенно так же, как в теоремах

2.8.1— 2,

сходимость

варианта б)

см. в работе [82].

 

 

7.

Метод штрафных функционалов

[27, 35,

75, 155, 162, 1

192, 229, 244]. Пусть g(u) — некоторый функционал, определенный

на

заданном множестве

Ui банахова пространства

В

(возможно,

U i= B ) . Пусть

 

 

 

 

 

 

и =

{ и : и е и ъ g ( u ) < 0 } .

 

 

(7>

 

Заметим, что множества вида (7) охватывают такие множест­

ва как Ui = {и : u^.U\,

h ( u )= 0}, поскольку U0= { u : u ^ U u

g(u) =

=

h2(u)^Z0}. Если же

U0= {и: u ^ U ь g i ( u ) ^ 0 (г =

1,

2, ...,

s)}, та

это множество также представимо в виде (7). Для этого достаточ­ но взять

 

8 (ц) = £

(“)]+»

гДе [&; (“)]+ =

max {£; (“); °}-

 

 

 

 

 

i=l

 

 

 

 

 

 

 

 

 

О п р е д е л е н и е 1. Функционалы Ph(u)

( k = l , 2,

...)

называ­

ются штрафом или штрафными функционалами для

ограничения

£(гг)г^0

на

множестве

U\,

если: 1) Ph (u) ^

0

при всех

гге^Л я

k = \ , 2,

...;

2)

Н тРй(гг )= 0

при гге£/,

П тРй(гг) = + о о

при гге(/ь

но и ф и .

 

 

k-*ao

 

 

k-*oo

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Примеры

штрафных

функционалов:

Рк (“) =

4 U r ( “)]+.

p k(“) =■•

= Л ([ Я (“)]+)2. ^ * (« )=

- ± — еА^ и) и т.

п.,

где

Ak — некоторая

пос-

ледовательность, Ак > 0

(k =

1, 2, . . . ) ,

Ak

 

+

оо при

£ ->- оо

(ср.

С §2 .9).

 

 

 

 

 

 

 

 

 

 

 

 

Пусть на множестве Ui задан функционал /(гг), и пусть тре­

буется минимизировать

/(гг)

на множестве

U вида (7).

Заменим

эту задачу последовательностью задач минимизации функционалов

/й(гг )= / (гг)+ Р й(гг), k = l , 2, ...,

на множестве Uь где Р й(гг)—

штраф для ограничения g (u )^ .0

на U\. При каждом k задача ми­

нимизации /й (гг) на Ui может быть решена приближенно каким-

либо методом

(например, одним из вышеописанных методов). '

В прикладных задачах нужно стараться представить множе­

ство U в виде

(7) так, чтобы множество Ui, входящее в (7), имела

§ 2]

Некоторые методы минимизации функционалов

255

 

 

достаточно простой вид, а реализация тех или иных методов ми­ нимизации Д (« ) на U\ не встречала чрезмерных затруднений (например, Ui может быть шаром в пространстве В\ возможно также U \=B).

Предположим, что с помощью каких-либо методов минимиза­ ции получена последовательность {иу}, удовлетворяющая усло­ виям

4 =

inf J k (и) < J k (uk) < 4 -1- eA, uk e Ult

A = 1 ,2 .........

(8)

 

u £ U l

 

 

где Efc>0,

eft-^-0 при / е - > о о .

g(u) определены

 

Т е о р е м а 4. Пусть функционалы /(«),

и

непрерывны на множестве Ui из-банахова пространства В, пусть

inf J(u)^> — оо.

Пусть

штрафной

функционал

для

ограничения

Jt£UI

 

 

имеет вид Рл(и) =

Qk(g(u) ), причем:

1)

для каж ­

g ( u ) ^ 0 на U1

дого k

функция

Qft(g) одной переменной непрерывна

и неотрица­

тельна при всех g\ 2)

Qh(g) > 0 при g > 0 , монотонно возрастает

но g и limQft (g) — +

о о

при g > 0;

3)

если же g < 0 ,

то Qk(g)-+ 0

 

 

ft->00

 

 

 

 

 

 

 

 

 

 

 

 

 

 

при / г - v o o равномерно по

 

 

 

 

 

 

 

 

 

 

 

Тогда для последовательности {«&}, полученной

из

условий

•(8),

имеет место

limg'(uft) < 0 ,

 

 

 

 

 

 

 

 

 

 

 

 

k-*o°

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

lim J (uk) <

J* = inf J

(u).

 

 

 

 

 

 

 

 

 

I t - * оо

 

 

 

ц £ С /

 

 

 

 

 

 

 

 

Если, кроме того, В рефлексивно, U\ — выпуклое замкнутое

множество, g(u), J (и) — выпуклые функционалы на Ui

и множе­

ство

С/б={и: u ^ U 1, g ( u ) ^ . 6} ограничено при некотором б = бо>0,

то

lim J (uk) =

J*

и любая

слабая

предельная точка

и*

последо-

 

ft-»!»

 

 

 

 

 

 

 

U и / (« *)= / *,

 

 

 

 

вательности {uft}

будет

принадлежать

а

в

случае

единственности точки минимума {uk}-*-u* при k-+oo слабо в В.

 

Д о к а з а т е л ь с т в о .

Пусть {ит}— какая-либо последовательность,

минимизирующая J {и) на U,

т. е. vm£ U

и J (vm)

Г (гп

оо). Возь­

мем произвольное е > 0 .

Тогда существуют числа m0, ka >

0,

такие,

что

J (vm) < J* +

е,

е/; <

е,

Qk (g (vm)) <

е

при всех

tn > m0,

k >

£0.

Из неравенств (8) тогда следует

Т (uk) <

//г («*) < 4

+

<

4

(vm) +

+ е = J

(и,п) + Qk (g(Vm)) + e -</* - f 3s.

Отсюда в силу

произвольно­

сти

e >

О имеем lim J

(uk) <

Г ,

Далее,

Qk (g (uk)) =

У* (uk) — J (Uft) <

 

 

 

k~*OQ

 

 

 

 

 

 

 

 

 

 

 

 

-< J* +

3e — inf J (u) <

-j- оо

при всех k

> &0. Это

возможно

только

при lim

g (uk)

0,

ибо в противном

случае существовала бы подпо- •

•следовательность

{«*„},

для

которой

 

limg'(uft) = a > -0

 

и

0 <

Л - » о о

п

256

МЕТОДЫ М И Н И М И З А Ц И И В ФУНКЦ И ОНАЛЬНЫ Х ПРОСТРАНСТВАХ

\Гл. 6

KQkn(^Y^)< Qkn ( g (Чкп)) ->■ о°

при

/1- ^ 0 0 .

Первое ;утверждение

теоремы доказано.

 

 

 

 

 

 

Пусть теперь множество Ue0 = {и: и ^ Ux, g

(и) < 6 0}

ограничено,

кроме того, Uб„ выпукло и замкнуто.

Следовательно, согласно тео­

реме

1.2 С/в0 слабо компактно.

Так

как lim g («/;) < 0 ,

то

uk £.U&a

 

 

 

k->oo

 

 

 

при всех & > & 0, и из {ик} можно выбрать хотя бы одну подпосле­ довательность {ukl) ( k n-+ оо), слабо сходящуюся к некоторой точке

и* 6 Яво. Но g (и) слабо полунепрерывен снизу (см. теорему 1.3), по­

этому

g ( и ) < Umg(ukn) < lim gjuk) < 0. Следовательно, и

в U. А

 

П -> о о

имеем J* <

/(«*)]<

тогда, пользуясь слабой полунепрерывностыо J (и),

<СИш/(ыАп) < lim J (uk) < У *, т. е. J(u") — J*. В

силу произвольно-

/1— *оо

/г~>оо

 

 

сти слабой предельной точки и* последовательности {ик} отсюда име­

ем

lim J (uk) — J*. Если и* — единственная

точка

минимума

J (и) на

U,

к-*оо

 

 

 

 

 

 

то

при k-^-oo слабо в В . А

 

ик 6

Иг

 

 

Условия, при которых

из

limg^U/j) < 0,

следует

р (uk,

60 = inf||ufe — и[|-*-0 (&->- оо),

k-±oo

 

 

работах [46,

рассматривались в

153,

лес/

 

 

 

 

 

 

155].

 

 

 

 

 

 

 

8 . Метод множителей Лагранжа. Теорема Куна— Таккера мо­

жет быть положена в основу различных

итерационных

методов

минимизации функционала J (и)

на множествах вида U— { u :u ^ U it

gi(u)s^O, i= 1, 2 , ..., s; gi(u) = 0 , i'= l, 2 , ..., p), где Hi — заданное выпуклое множество гильбертова пространства Я , функционалы,

/(u),

g i (u) определены,

выпуклы на Ui

и

принадлежат C'(U\),

gi{u)

— линейные функционалы на Я . Эти методы сводятся к по­

иску

седловой

точки

функции

Лагранжа

L(u,

X) — J (и) + (\i,

g{u )) + (р, g ( u))

на множестве

 

 

 

 

 

и г X Л ь

Л х =

{X = ( р , р ): р 6 Es, р >

0 , р 6

£ р} .

Здесь возможен следующий итерационный процесс:

 

Ил+1 ~ P[Ji (Цп

^-л (^л> ^л)) Г ^rt+1 ~

Ра,

-f- а п Lx (ип, Хп)),

пли

 

 

п = 0, 1,

,

 

 

 

 

 

 

 

 

 

 

 

L (мп-{-1, А>л) =

m inL {и, Хп),

Ра,

4“

(^л> ^л))>

 

 

леи,

 

 

 

 

 

 

 

 

. n = 0 , 1 , . . . ,

 

 

 

и другие [111, 119, 135,

256].

 

 

 

 

§ 3]

Задача оптимального

управления

 

со

свободным

правым концом

257

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

§ 3.

ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ СО СВОБОДНЫМ

 

 

 

 

ПРАВЫМ КОНЦОМ

 

 

 

 

 

 

 

 

I.

Обозначим через Bir)[t0,

T]==Li'l

пространство

вектор-фу

ций и = u(t) = 1 (о, •••

.

«г (0)>

 

*о <

t < T ,

с

конечной

нормой

 

 

т

 

 

 

 

 

 

 

 

 

 

 

 

 

II «IIL(r) =

u (f)jErdty1*.

Очевидно,

 

эта

норма

порождается

скаляр-

ным произведением

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(и, o)L(r> = j (и (t), v {t))Ef d t : |и |L

 

 

 

 

 

 

 

и пространство L 2r)[t0, Т\ — гильбертово.

Здесь,

 

как и в гл.

2,

под

Ет понимаем евклидово

пространство

векторов

г =

(z1,

. . . ,

гт)

со

скалярным произведением (у, z)Bm =

т

ylzl с нормой |z \Ет = Viz, z)Em;

^

норму матрицы А = (аи} ( i =

1, . . .

i=i

 

1, . . .

 

, т)

будем

обозна­

л; / =

 

чать |А\п,т= sup|Az\Bn, где верхняя грань берется по шару |z|£m<

1.

Там,

где не могут возникнуть недоразумения,

индексы

пространств

в обозначениях норм и скалярных произведений будем опускать.

 

 

Рассмотрим следующую задачу оптимального управления: мини­

мизировать функционал

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j ( u ) =

т

и,

t)dt +

® (x(T))

 

 

 

(1)

 

 

 

 

 

 

при условиях

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x = f ( x , u , t ) ,

t0< t < T ,

x(t0) =

x0\

 

 

(2)

 

 

u =

u { t ) £ U C l L p [ t 0, T],

 

 

 

 

 

 

(3)

где x = ( x 1,..., xn), u=.(u\...,

ur), функции

 

 

fn), f°, Ф пред­

полагаются известными,

U — заданное множество из

L|r) [t0,

T\,

моменты

to, Т и начальная точка х0 заданы. Будем предполагать,

не оговаривая этого в дальнейшем,

что для каждого u ( t) ^ U соот­

ветствующее решение x{t, и) задачи

(2 )

определено на всем отрезке

[*о,

П» и функционал ( 1)

принимает конечное значение.

 

 

 

 

Ниже будут сформулированы достаточные условия дифферен­

цируемости и выпуклости функционала

( 1) при условиях (2 ), (3),

доказана

справедливость принципа

максимума

 

для

задачи

( 1 ) —

(3), кратко обсуждены возможности использования методов § 2 для приближенного решения этой задачи. Примем обозначения

9 Ф. П. Васильев

258 МЕТОДЫ М И Н И М И З А Ц И И

В ФУНКЦ И ОНАЛ ЬНЫ Х

ПРОСТРАНСТВАХ [Гл. О

 

а/1

 

 

др

I L

дх*

J L

 

диг

 

 

 

 

дх

df*

ди

 

df*

 

 

 

 

дхп

 

 

диг

•а/°

1 ••• У

др_\

3/° _ fdfo_

 

. dxi

дх* )'

ди

 

 

 

дФ

(

<••• >

5Ф \

 

 

-

дхп )

 

дх

V дх1

Т е о р е м а 1.

Пусть функции f°, f,

Ф непрерывны по совокуп­

ности своих аргументов вместе со своими частными производными

по переменным х, и при

ы е £ г> tQ^,ts£ZT, и пусть выполне­

ны следующие условия Липшица:

\f(x + Ax, u + h, t) — f(x,

и, *)|e„ < А('|Л*|е„ + |А’|яг), (4)

 

 

ЗФ(* +

Д* 1__дФ(х)

|

< Ц А х \Епг

 

(5)

 

 

 

дх

дх

 

 

 

 

 

 

д}(х +

Ах,

u +

h,

t)

df{х, и,

t)

 

^<L(| A x| £n+

|Л(яг),

(6 )

I

дх

 

 

 

дх

 

 

 

 

 

 

 

|n

 

 

 

д/° (х +

Дх,

и +

h,

t)

д ? (х,

и,

t)

р

<L(\A x\En-+\h\Ery,

(7)

 

дх

 

 

дх

 

 

 

 

 

df(x +

Ах,

u +

h,

t)

df{x, и,

t)

 

 

 

 

 

ди

 

 

 

ди

 

 

 

 

 

 

д Р ( х + А х ,

u +

h,

t)

df°(x, и,

t)

 

< L ( |Ах |£ +

|А |я )

(9)

 

ди

 

 

 

ди

 

 

\ЕГ

 

 

 

 

 

 

*

г

 

(константы Липшица для всех функций здесь обозначим одной буквой L, так как величины этих констант для нас не будут суще­ ственными). Тогда функционал (1) при условиях (2), (3) непре­

рывен и дифференцируем по u= u (t) в норме L p [f0, Т], причем его градиент

=. . . . j'r(i))eLir)[t0, т]

в точке и = и (t)

представим в виде

 

J' (u) =

dH(x{t)f

t] , t0 < t < T ,

(1.0)

 

 

ди

 

 

где

 

 

 

 

Н(х, ф, и,

t):=

— f°(x, и, t) +

(ф, f(x, и, 0)е„ , ~

= '

 

 

•_ ( дН

дН X

(И )

Л ди1 ’ “ ‘ ’ диг ) ’

§ 5]

Задача оптимального

управления

со свободным правым концом

259

x(t)s= x(t,

и) — решение

задачи (2 )

при u = u(t), а вектор-функция

ф(г) =

ф(£,

ы) = (тЫ 0 ..........

ф„(0 ) определяется из условий

 

дН (х «), гр, u{t), t)

t0 < t < T ,

дх1

дФ(х(Т))

i = 1 , 2 , . . . , п.

дх1

( 12)

(13)

Д о к а з а т е л ь с т в о . Пусть

u = u {t),

u + h = u (t) + h ( t ) ^ U ,

пусть x(t) ==x(t,u), x(t, u + h)z= x(t,

u )+ A x(t),

соответ­

ствующие этим управлениям решения задачи

(2),/(и)

и J (u + h ) —

=/(и) + A J (и) — соответствующие значения функционала (1). Из

(2)следует, что приращение Ax(t) удовлетворяет условиям

Ах =

f{x(t) +

Ax,

u(t) +

h(t),

t) — f{x(t), -u(t), t),

(14)

*

 

 

 

t0 < t < T \

Ax(t0) =

0.

 

 

Так как

 

 

 

 

 

 

 

 

 

 

 

Ф (x +

Ax) — Ф (x) =

(

5 0 (* * 9A*} ,

A x ),

O < 0 < 1 ,

 

то из (1)

получаем

 

 

 

 

 

 

 

 

 

 

 

т

 

 

 

 

 

 

 

 

 

A J ( u )=

^ [/° (x +

Ax, u + h ,

t) — f°(x, u, t)]dt +

 

 

 

 

to

 

 

 

 

 

 

 

 

 

 

 

+ (

дФ{дх(Т))

Ax(T)^ + Rlt

 

(15)

где

 

5Ф (х (Г ) + еА х (Г ))

 

 

 

 

 

 

 

 

дФ (x (Г)) .

Ах (Г )),

 

 

 

 

 

дх

 

 

 

дх

 

 

 

 

 

 

 

|/?1 |<L|A x(7’)P .

 

 

(16)

С учетом соотношений (12) — (14)

имеем

 

 

 

( —

f / ) ) .

АхХТ)^ =

- ^ ( Т ) ,

Ах (7 )) =

- | - ^ - ( ф ( 0 ,

 

 

 

 

 

 

 

 

 

 

 

*0

 

Ах (t)) dt = — j (ф,

Ах) dt — ^'-(ф, Ах) di =

^ ?Н(х,

у, и, о;

_

 

 

*0

 

 

 

 

f0

 

 

 

 

 

Т

 

 

 

 

 

 

 

 

 

 

 

 

/ (* +

Ах,

u +

h, t ) - f { x , и,

t))dt.

 

9*

Соседние файлы в папке книги из ГПНТБ