книги из ГПНТБ / Васильев Ф.П. Лекции по методам решения экстремальных задач
.pdf250 |
МЕТОДЫ |
М И Н И М И З А Ц И И В |
Ф У НКЦ И О НАЛ ЬНЫ Х ПРОСТРАНСТВАХ |
[Гл. 6 |
||||||||||
|
б) а „ |
определяется |
из |
условия |
J ( u n) —/(m„+i) ^e||«n— «„+il|2, |
|||||||||
где Un+i имеет вид |
(2), е — параметр алгоритма, е > 0 ; |
|
||||||||||||
|
в) а п можно выбирать, |
как это указано в п. 1е). |
|
|||||||||||
|
Т е о р е м а |
2. Пусть |
функционал |
|
J (и) определен на выпуклом |
|||||||||
замкнутом |
множестве |
U |
гильбертова |
|
пространства |
Я , J (и) 6 С1 (U), |
||||||||
inf J (и) = J* > |
— оо, |
и градиент J ' (и) |
удовлетворяет условию |
ЛИЛ |
||||||||||
ЛЕЦ |
' |
|
|
|
|
|
|
|
L = |
|
|
и, v 6 U. |
|
|
шица I J' (и) — J' (и) |< L |и — v ||, |
const > 0 , |
Пусть |
||||||||||||
и0— произвольная начальная точка |
из |
|
U |
и последовательность {ип} |
||||||||||
определена |
по |
формуле |
(2) |
с выбором |
параметра |
а п из условий |
||||||||
0 < |
ех < а п < |
■ |
L + 2е |
|
Qi>- |
•заданные положительные |
числа, |
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||
0 < 8 1 < - |
2 |
|
Тогда |
|
|
|
|
|
|
|
|
|||
|
L + |
2в |
|
|
|
|
|
|
|
|
|
|
||
j (ип) — j |
(«Д+0 > |
8II ип— ип+1|Р, |
п = |
0, |
1, .. • , limIIип— wn+,II = 0 |
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
Д -*о о |
|
|
{если Я = Я , |
то равенство lim||«„— Wn+i||= 0 равносильно П т У' (ип) = 0). |
|||||||||||||
|
|
|
|
|
|
|
Д -»оо |
|
|
|
|
|
Д -*э о |
|
|
Если, кроме того, J (и) — выпуклый функционал, и множество |
|||||||||||||
M^{uo) — {u :u ^ U , |
J (и) s£ZJ(и0)} |
ограничено, то |
последователь |
|||||||||||
ность {и„} является минимизирующей, и любая ее слабая предель
ная точка будет точкой минимума J (и) |
на U, причем в случае един |
||||
ственности |
точки |
минимума к |
ней слабо сходится вся последова- |
||
тельность |
{«„}; |
справедлива |
оценка |
Q |
|
0<СУ(«„)— J* -С ——, С\ = |
|||||
= co n st> 0 , |
п = 1, 2, ... |
|
п |
||
|
|
||||
Если / («), |
кроме того, сильно выпуклый функционал на U, то |
||||
{ип} сходится |
к |
единственной |
точке минимума ы* по норме про- |
||
|
|
|
|
Q |
п = 1 , 2, ..., C2= c o n s t> 0 . |
странства Я , причем \ип— ы*|р<——, |
|||||
|
|
|
|
11 |
|
Доказательство этой теоремы полностью аналогично доказа тельству теоремы 2.3.2 с той лишь разницей, что вместо классиче ской теоремы Вейерштрасса здесь нужно использовать теорему 1.4 так же, как это мы делали только что при доказательстве тео ремы 1.
Если множество U имеет вид U— {и : gi{u) ;^ 0, i = l , 2, .... s}, где gi(u) — заданные функционалы из С1 (Я ), то для минимизации
•функционала 7 ( « ) е С ‘ (Я ) на U можно применить метод возмож ных направлений [59, 117, 135, 193, 196]; один из вариантов этого метода в Я-пространствах может быть описан также, как в § 2.4.
3. Метод проекции опорного функционала. Пусть выпукл функционал /(«) в каждой точке и замкнутого выпуклого множе ства U имеет опорный функционал 1{и).
§ 2] |
Некоторые методы минимизации функционалов |
251 |
Метод проекции опорных функционалов заключается в пост роении последовательности {ип} по правилу
Un+ 1 = Р ц ( ип— а н |
\ п = 0, 1, |
\III Ы II J
где а п — произвольная |
последовательность |
со свойствами а пХ ) , |
|
|
00 |
|
|
а л -» 0 (п-^оо), |
а г = |
оо /например, |
а п — |
|
i=o |
'■ |
п -4- 1 ) - |
|
|
||
Теорема 2.5.2 о сходимости описанного метода и ее доказательствополностью сохраняют силу и в Я-пространствах. О методах мини мизации негладких функционалов см., например, в работах [35, 154, 155, 187, 189, 193].
4. Метод условного градиента. Пусть U — выпуклое замк тое ограниченное множество в Я-пространстве, пусть функционал
J(u )^ C '(U ) . |
Метод условного |
градиента |
заключается |
в |
следую |
||||||||
щем: |
если Un |
(п ^ О ) |
уже известно, то берем главную |
линейную |
|||||||||
часть |
J n (u )s= (J'(u n), |
и— и п ) |
приращения |
J (и)— /(ип) = |
( Г ( и п) , |
||||||||
и— ип)-\-о(\\и— ып||) и определяем |
вспомогательное |
приближение- |
|||||||||||
йп^ .и из условия |
|
|
|
|
|
|
|
|
|
|
|||
|
J n Ы |
= |
min J n(u) или (/' (ип) , йп) = |
min (5 (и„), и). |
(3> |
||||||||
|
|
|
иеи |
|
|
|
|
|
uEU |
|
|
|
|
Затем |
полагаем |
[35, 36, 82, |
93, |
94, |
97, |
124, 154, |
155, |
179, |
229] |
||||
|
|
|
un+i = |
ип + |
ап (ип — ип), |
0 < |
a n < |
1, |
|
|
(4> |
||
где а п может быть выбрано, например, одним из следующих спосо бов — а), б), в ):
а) |
8п К ) |
= |
min gn (а ), gn (а) = J ( u n + а (йп — ип)), |
|
|
(5> |
|||||||
|
|
|
0 < а < 1 |
|
|
|
|
|
|
|
|
||
б) |
J (un) — j |
(un+i) > е а л I J n (un) 1, |
0 < |
а„ < |
1, где |
е —- параметр- |
|||||||
алгоритма; |
0 -< е < |
1; |
|
|
|
|
|
|
|
|
|||
в) если |
|J' (и) — J' (о) ||< L I и — v | при |
всех u ,v £ U , |
L = |
||||||||||
— const > |
0, |
то |
а п можно |
определить |
так: |
|
а п — у„рл, |
где |
р„ = |
||||
= mi nl l ; |
—— |
|
|
— J, ех < ; у л < —- — —, ех |
и |
е —.параметры |
алго- |
||||||
|
I |
11«„-М 3 I |
|
L |
|
|
|
|
|
|
|||
ритма, |
|
|
|
2 |
(1 _е) |
|
Заметим, |
что приведенное здесь. |
|||||
0 < е 1 •<------— -, 0 < е < 1. |
|||||||||||||
описание |
метода |
условного |
градиента сохраняется без |
изменений |
|||||||||
и в 5-пространствах. |
|
|
|
|
|
|
|
|
|||||
Т е о р е м а |
3. |
Пусть U — выпуклое |
замкнутое |
ограниченное |
|||||||||
множество в Я-пространстве (или рефлексивном 5-пространстве),
■ 252 МЕТОДЫ М И Н И М И З А Ц И И В Ф У НКЦ И О НАЛ ЬНЫ Х ПРОСТРАНСТВАХ \Гл. «Г
пусть функционал |
/ ( п ) е С 1(Д), |
inf J(u) — J*^> — оо |
и градиент |
|||||
J'(ti) удовлетворяет |
условию |
|
u £ U |
\\J'{u)— J'(v) ||^L||«— t>|| |
||||
Липшица |
||||||||
при всех и, v<=U, |
L = c o n s t> 0 . |
Тогда |
последовательность {w„}, |
|||||
удовлетворяющая |
условиям |
(3) — (5), |
существует |
и |
J n(u„) = |
|||
= (/'(мп), |
йп— п„)->-0 |
г(/г->оо) |
при любом |
выборе u0^U . |
|
|||
Если, |
кроме того, |
/ (и) выпуклый функционал на |
U, |
то после |
||||
довательность {н,,} является минимизирующей и любая ее слабая предельная точка будет точкой минимума J (и) на U, причем в слу чае единственности точки минимума к ней слабо сходится вся по следовательность {«„}. Справедлива оценка
0 < ая = / ( ия) - / * < - ^ 1 л = 1, 2, |
(6) |
п |
|
где С — положительная константа, независнмай от п.
Д о к а з а т е л ь с т в о . Пусть |
начальное |
приближение |
u0^ U |
выбрано произвольно. Пусть уже известно |
и„ (п^О ). Так как |
||
J n{u) = (Л (м„), и— ц„) линейный |
(и тем более выпуклый) |
непре |
|
рывный функционал, то существование элемента й „ е Д , удовлетво ряющего условию (3), следует из теоремы 1.4.
Доказательство утверждения |
/n (wn)-vO |
(п->оо) проводится |
||
дословно так же, как в теореме |
2.6.1. Если /(и) выпуклый функ |
|||
ционал, то |
существование |
/ (« * )= / * |
следует из |
теоремы |
1.4, э т о т |
факт, что {ип} — минимизирующая |
последовательность, |
||
является следствием неравенств (2.6.6). |
|
|
||
В силу теоремы 1.2 множество U слабо |
компактно, |
поэтому |
||
последовательность {п„} имеет хотя бы одну слабую предельную точку и*е£/, являющуюся слабым пределом некоторой подпосле
довательности {a„fe}. Но J (и) |
слабо |
полунепрерывен снизу, поэ |
тому |
|
|
J* = lim J (ип) = |
lim J («„ |
) > J (а*) > /*, |
П -» оо |
|
|
т. е. J(v*) = J * . Если /(«) достигает своего минимума в единствен ной точке и*, то вся последовательность {«„} слабо сходится к и*.
Оценка >(6) выводится совершенно так же, как и подобная оценка (2.6.4) в теореме 2.6.1. А
Формулировку и доказательство теоремы сходимости метода условного градиента, когда величина а„ в (4) выбирается соглас но пп. б), в), предоставляем читателю, заметив лишь, что это де лается совершенно так же, как в теореме 2.6.2.
S 2] |
|
|
|
Некоторые методы минимизации функционалов |
|
253 |
||||||||||
|
5. |
|
Метод сопряженных градиентов. Пусть |
функционал J (и |
||||||||||||
£ С1(Я ). |
Построим последовательность {ип} |
по' правилам [35, |
124, |
|||||||||||||
166, |
179, |
190] |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
МцЦ-l |
|
11ц |
|
Ctt/iPm |
f t |
1» 2 , |
• • •, |
|
|
|
||
|
|
|
Ро = |
J ' («о), |
Рп = |
J' (ftn) — $пРп-1, |
п = |
1, 2, |
. . . , . |
|
||||||
где величины а п, (3„ |
выбираются из условий |
|
|
|
|
|||||||||||
|
|
|
ёп К ) |
= |
min g n (а), g„ (а) == J |
(и„ — арп), |
|
|
||||||||
|
|
|
|
|
|
а>0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(J'(un), J' (u„-i) — J' (и„)) |
ft € h , |
|
|
|
||||||
|
|
|
|
|
|
|
|
|
II/'(«л-0 II2 |
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
о , |
n |
£ |
I z , |
|
|
|
|
|
|
|
а множества индексов /1, |
/2 |
таковы, |
что /iU^2 = {0, |
1, |
2, ...}, |
0е / 2. |
||||||||||
На |
практике |
часто |
|
принимают |
/2= { 0 , |
щ, п2, ...}, |
где 0 < n i < |
|||||||||
< п 2< |
... — заданная |
последовательность, |
например |
n u = ks, |
s — |
|||||||||||
некоторое натуральное |
число, k — 0, |
1, 2........... Если |
/2={< ?}, |
11= |
||||||||||||
= {1, 2, |
...}, то этот метод превратится в метод скорейшего спуска. |
|||||||||||||||
Сходимость метода сопряженных градиентов для сильно выпуклых функционалов в Я-пространствах доказывается совершенно так же, как в теореме 2.7.2.
Приведенное здесь описание метода сопряженных градиентов предполагает, что £/= Я . Если же И ф Н , то можно использовать проекцию описанного метода ип+\= Ри (ип— а прп), выбирая ап> 0 , например, из условия J(u n+i) < J ( u n).
6.Метод Ньютона [4, 27, 35, 46, 75, 81, 82, 130, 152, 155, 1
Пусть U — выпуклое замкнутое множество в Я-пространстве |
(или |
в 5-пространстве), функционал J(u)<=C2(U). Пусть ип ( п ^ 0) |
уже |
известно. Тогда берем главную квадратичную часть |
|
J n (и) = (/' (ип), и — un) + - L (J" (ип) (и — un) , u — un) |
|
приращения J (и)— J(u n) = J n (u)-\-o(\\u— и„||2) и определяем вспо могательное приближение ип из условия
J.n (un) — min J n (и).
|
u £ U |
Затем полагаем |
|
Чп+1 = ип + |
0 < а л < 1, |
где а п может быть выбрано, например, одним из следующих спо собов:
254 |
МЕТОДЫ |
М И Н И М И З А Ц И И В |
Ф У НКЦ И О НАЛ ЬНЫ Х |
ПРОСТРАНСТВАХ |
[ Г л . S |
|||
|
а) |
а ,1 = 1 , п = О, 1, 2, |
... |
(здесь имеем дело с методом Ньютона |
||||
в его классическом виде); |
|
|
|
|
|
|||
|
б) |
ёп Ю |
= min g„ (a), |
gn (а) = J (ип + |
а (йп— гг,,)); |
|
||
|
|
|
0<а<1 |
|
|
|
|
|
|
в) |
J {ип) — 7 (« n+i) ^ е а „ | /„(«„) |, где |
е — параметр алгорит |
|||||
ма, |
O C e C l, |
а величина |
а п выбирается |
как |
можно ближе |
к 1,. |
||
0 < а „ ^ 1 . Сходимость вариантов а), в) метода Ньютона доказы
вается совершенно так же, как в теоремах |
2.8.1— 2, |
сходимость |
|
варианта б) |
см. в работе [82]. |
|
|
7. |
Метод штрафных функционалов |
[27, 35, |
75, 155, 162, 1 |
192, 229, 244]. Пусть g(u) — некоторый функционал, определенный
на |
заданном множестве |
Ui банахова пространства |
В |
(возможно, |
||
U i= B ) . Пусть |
|
|
|
|
|
|
|
и = |
{ и : и е и ъ g ( u ) < 0 } . |
|
|
(7> |
|
|
Заметим, что множества вида (7) охватывают такие множест |
|||||
ва как Ui = {и : u^.U\, |
h ( u )= 0}, поскольку U0= { u : u ^ U u |
g(u) = |
||||
= |
h2(u)^Z0}. Если же |
U0= {и: u ^ U ь g i ( u ) ^ 0 (г = |
1, |
2, ..., |
s)}, та |
|
это множество также представимо в виде (7). Для этого достаточ но взять
|
8 (ц) = £ |
(“)]+» |
гДе [&; (“)]+ = |
max {£; (“); °}- |
|
|
||||||
|
|
|
i=l |
|
|
|
|
|
|
|
|
|
О п р е д е л е н и е 1. Функционалы Ph(u) |
( k = l , 2, |
...) |
называ |
|||||||||
ются штрафом или штрафными функционалами для |
ограничения |
|||||||||||
£(гг)г^0 |
на |
множестве |
U\, |
если: 1) Ph (u) ^ |
0 |
при всех |
гге^Л я |
|||||
k = \ , 2, |
...; |
2) |
Н тРй(гг )= 0 |
при гге£/, |
П тРй(гг) = + о о |
при гге(/ь |
||||||
но и ф и . |
|
|
k-*ao |
|
|
k-*oo |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Примеры |
штрафных |
функционалов: |
Рк (“) = |
4 U r ( “)]+. |
p k(“) =■• |
|||||||
= Л ([ Я (“)]+)2. ^ * (« )= |
- ± — еА^ и) и т. |
п., |
где |
Ak — некоторая |
пос- |
|||||||
ледовательность, Ак > 0 |
(k = |
1, 2, . . . ) , |
Ak |
|
+ |
оо при |
£ ->- оо |
(ср. |
||||
С §2 .9). |
|
|
|
|
|
|
|
|
|
|
|
|
Пусть на множестве Ui задан функционал /(гг), и пусть тре |
||||||||||||
буется минимизировать |
/(гг) |
на множестве |
U вида (7). |
Заменим |
||||||||
эту задачу последовательностью задач минимизации функционалов
/й(гг )= / (гг)+ Р й(гг), k = l , 2, ..., |
на множестве Uь где Р й(гг)— |
штраф для ограничения g (u )^ .0 |
на U\. При каждом k задача ми |
нимизации /й (гг) на Ui может быть решена приближенно каким-
либо методом |
(например, одним из вышеописанных методов). ' |
В прикладных задачах нужно стараться представить множе |
|
ство U в виде |
(7) так, чтобы множество Ui, входящее в (7), имела |
§ 2] |
Некоторые методы минимизации функционалов |
255 |
|
|
достаточно простой вид, а реализация тех или иных методов ми нимизации Д (« ) на U\ не встречала чрезмерных затруднений (например, Ui может быть шаром в пространстве В\ возможно также U \=B).
Предположим, что с помощью каких-либо методов минимиза ции получена последовательность {иу}, удовлетворяющая усло виям
4 = |
inf J k (и) < J k (uk) < 4 -1- eA, uk e Ult |
A = 1 ,2 ......... |
(8) |
|
u £ U l |
|
|
где Efc>0, |
eft-^-0 при / е - > о о . |
g(u) определены |
|
Т е о р е м а 4. Пусть функционалы /(«), |
и |
||
непрерывны на множестве Ui из-банахова пространства В, пусть
inf J(u)^> — оо. |
Пусть |
штрафной |
функционал |
для |
ограничения |
|||||||||||
Jt£UI |
|
|
имеет вид Рл(и) = |
Qk(g(u) ), причем: |
1) |
для каж |
||||||||||
g ( u ) ^ 0 на U1 |
||||||||||||||||
дого k |
функция |
Qft(g) одной переменной непрерывна |
и неотрица |
|||||||||||||
тельна при всех g\ 2) |
Qh(g) > 0 при g > 0 , монотонно возрастает |
|||||||||||||||
но g и limQft (g) — + |
о о |
при g > 0; |
3) |
если же g < 0 , |
то Qk(g)-+ 0 |
|||||||||||
|
|
ft->00 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
при / г - v o o равномерно по |
|
|
|
|
|
|
|
|
|
|
||||||
|
Тогда для последовательности {«&}, полученной |
из |
условий |
|||||||||||||
•(8), |
имеет место |
limg'(uft) < 0 , |
|
|
|
|
|
|
|
|
|
|||||
|
|
|
k-*o° |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
lim J (uk) < |
J* = inf J |
(u). |
|
|
|
|
|
|||||
|
|
|
|
I t - * оо |
|
|
|
ц £ С / |
|
|
|
|
|
|
|
|
|
Если, кроме того, В рефлексивно, U\ — выпуклое замкнутое |
|||||||||||||||
множество, g(u), J (и) — выпуклые функционалы на Ui |
и множе |
|||||||||||||||
ство |
С/б={и: u ^ U 1, g ( u ) ^ . 6} ограничено при некотором б = бо>0, |
|||||||||||||||
то |
lim J (uk) = |
J* |
и любая |
слабая |
предельная точка |
и* |
последо- |
|||||||||
|
ft-»!» |
|
|
|
|
|
|
|
U и / (« *)= / *, |
|
|
|
|
|||
вательности {uft} |
будет |
принадлежать |
а |
в |
случае |
|||||||||||
единственности точки минимума {uk}-*-u* при k-+oo слабо в В. |
||||||||||||||||
|
Д о к а з а т е л ь с т в о . |
Пусть {ит}— какая-либо последовательность, |
||||||||||||||
минимизирующая J {и) на U, |
т. е. vm£ U |
и J (vm) |
Г (гп |
оо). Возь |
||||||||||||
мем произвольное е > 0 . |
Тогда существуют числа m0, ka > |
0, |
такие, |
|||||||||||||
что |
J (vm) < J* + |
е, |
е/; < |
е, |
Qk (g (vm)) < |
е |
при всех |
tn > m0, |
k > |
£0. |
||||||
Из неравенств (8) тогда следует |
Т (uk) < |
//г («*) < 4 |
+ |
< |
4 |
(vm) + |
||||||||||
+ е = J |
(и,п) + Qk (g(Vm)) + e -</* - f 3s. |
Отсюда в силу |
произвольно |
|||||||||||||
сти |
e > |
О имеем lim J |
(uk) < |
Г , |
Далее, |
Qk (g (uk)) = |
У* (uk) — J (Uft) < |
|||||||||
|
|
|
k~*OQ |
|
|
|
|
|
|
|
|
|
|
|
|
|
-< J* + |
3e — inf J (u) < |
-j- оо |
при всех k |
> &0. Это |
возможно |
только |
||||||||||
при lim |
g (uk) |
0, |
ибо в противном |
случае существовала бы подпо- • |
||||||||||||
•следовательность |
{«*„}, |
для |
которой |
|
limg'(uft) = a > -0 |
|
и |
0 < |
||||||||
Л - » о о |
п |
256 |
МЕТОДЫ М И Н И М И З А Ц И И В ФУНКЦ И ОНАЛЬНЫ Х ПРОСТРАНСТВАХ |
\Гл. 6 |
||||
KQkn(^Y^)< Qkn ( g (Чкп)) ->■ -г о° |
при |
/1- ^ 0 0 . |
Первое ;утверждение |
|||
теоремы доказано. |
|
|
|
|
|
|
|
Пусть теперь множество Ue0 = {и: и ^ Ux, g |
(и) < 6 0} |
ограничено, |
|||
кроме того, Uб„ выпукло и замкнуто. |
Следовательно, согласно тео |
|||||
реме |
1.2 С/в0 слабо компактно. |
Так |
как lim g («/;) < 0 , |
то |
uk £.U&a |
|
|
|
|
k->oo |
|
|
|
при всех & > & 0, и из {ик} можно выбрать хотя бы одну подпосле довательность {ukl) ( k n-+ оо), слабо сходящуюся к некоторой точке
и* 6 Яво. Но g (и) слабо полунепрерывен снизу (см. теорему 1.3), по
этому |
g ( и ) < Umg(ukn) < lim gjuk) < 0. Следовательно, и |
в U. А |
|
|
П -> о о |
имеем J* < |
/(«*)]< |
тогда, пользуясь слабой полунепрерывностыо J (и), |
|||
<СИш/(ыАп) < lim J (uk) < У *, т. е. J(u") — J*. В |
силу произвольно- |
||
/1— *оо |
/г~>оо |
|
|
сти слабой предельной точки и* последовательности {ик} отсюда име
ем |
lim J (uk) — J*. Если и* — единственная |
точка |
минимума |
J (и) на |
||||
U, |
к-*оо |
|
|
|
|
|
|
|
то |
при k-^-oo слабо в В . А |
|
ик 6 |
Иг |
|
|||
|
Условия, при которых |
из |
limg^U/j) < 0, |
следует |
||||
р (uk, |
60 = inf||ufe — и[|-*-0 (&->- оо), |
k-±oo |
|
|
работах [46, |
|||
рассматривались в |
||||||||
153, |
лес/ |
|
|
|
|
|
|
|
155]. |
|
|
|
|
|
|
||
|
8 . Метод множителей Лагранжа. Теорема Куна— Таккера мо |
|||||||
жет быть положена в основу различных |
итерационных |
методов |
||||||
минимизации функционала J (и) |
на множествах вида U— { u :u ^ U it |
|||||||
gi(u)s^O, i= 1, 2 , ..., s; gi(u) = 0 , i'= l, 2 , ..., p), где Hi — заданное выпуклое множество гильбертова пространства Я , функционалы,
/(u), |
g i (u) определены, |
выпуклы на Ui |
и |
принадлежат C'(U\), |
|||
gi{u) |
— линейные функционалы на Я . Эти методы сводятся к по |
||||||
иску |
седловой |
точки |
функции |
Лагранжа |
L(u, |
X) — J (и) + (\i, |
|
g{u )) + (р, g ( u)) |
на множестве |
|
|
|
|
||
|
и г X Л ь |
Л х = |
{X = ( р , р ): р 6 Es, р > |
0 , р 6 |
£ р} . |
||
Здесь возможен следующий итерационный процесс: |
|
||||||
Ил+1 ~ P[Ji (Цп |
^-л (^л> ^л)) Г ^rt+1 ~ |
Ра, |
-f- а п Lx (ип, Хп)), |
||||
пли |
|
|
п = 0, 1, |
, |
|
|
|
|
|
|
|
|
|
|
|
|
L (мп-{-1, А>л) = |
m inL {и, Хп), |
— Ра, |
4“ |
(^л> ^л))> |
||
|
|
леи, |
|
|
|
|
|
|
|
|
. n = 0 , 1 , . . . , |
|
|
|
|
и другие [111, 119, 135, |
256]. |
|
|
|
|
||
§ 3] |
Задача оптимального |
управления |
|
со |
свободным |
правым концом |
257 |
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
§ 3. |
ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ СО СВОБОДНЫМ |
|
||||||||||||
|
|
|
ПРАВЫМ КОНЦОМ |
|
|
|
|
|
|
|
|||||
|
I. |
Обозначим через Bir)[t0, |
T]==Li'l |
пространство |
вектор-фу |
||||||||||
ций и = u(t) = (и1 (о, ••• |
. |
«г (0)> |
|
*о < |
t < T , |
с |
конечной |
нормой |
|||||||
|
|
т |
|
|
|
|
|
|
|
|
|
|
|
|
|
II «IIL(r) = |
u (f)jErdty1*. |
Очевидно, |
|
эта |
норма |
порождается |
скаляр- |
||||||||
ным произведением |
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
(и, o)L(r> = j (и (t), v {t))Ef d t : |и |L |
|
|
|
|
|
|
|
||||||
и пространство L 2r)[t0, Т\ — гильбертово. |
Здесь, |
|
как и в гл. |
2, |
под |
||||||||||
Ет понимаем евклидово |
пространство |
векторов |
г = |
(z1, |
. . . , |
гт) |
со |
||||||||
скалярным произведением (у, z)Bm = |
т |
ylzl с нормой |z \Ет = Viz, z)Em; |
|||||||||||||
^ |
|||||||||||||||
норму матрицы А = (аи} ( i = |
1, . . . |
i=i |
|
1, . . . |
|
, т) |
будем |
обозна |
|||||||
л; / = |
|
||||||||||||||
чать |А\п,т= sup|Az\Bn, где верхняя грань берется по шару |z|£m< |
1. |
||||||||||||||
Там, |
где не могут возникнуть недоразумения, |
индексы |
пространств |
||||||||||||
в обозначениях норм и скалярных произведений будем опускать. |
|
||||||||||||||
|
Рассмотрим следующую задачу оптимального управления: мини |
||||||||||||||
мизировать функционал |
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
j ( u ) = |
т |
и, |
t)dt + |
® (x(T)) |
|
|
|
(1) |
|||||
|
|
|
|
|
|
||||||||||
при условиях |
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
x = f ( x , u , t ) , |
t0< t < T , |
x(t0) = |
x0\ |
|
|
(2) |
|||||||
|
|
u = |
u { t ) £ U C l L p [ t 0, T], |
|
|
|
|
|
|
(3) |
|||||
где x = ( x 1,..., xn), u=.(u\..., |
ur), функции |
|
|
fn), f°, Ф пред |
|||||||||||
полагаются известными, |
U — заданное множество из |
L|r) [t0, |
T\, |
||||||||||||
моменты |
to, Т и начальная точка х0 заданы. Будем предполагать, |
||||||||||||||
не оговаривая этого в дальнейшем, |
что для каждого u ( t) ^ U соот |
||||||||||||||
ветствующее решение x{t, и) задачи |
(2 ) |
определено на всем отрезке |
|||||||||||||
[*о, |
П» и функционал ( 1) |
принимает конечное значение. |
|
|
|
||||||||||
|
Ниже будут сформулированы достаточные условия дифферен |
||||||||||||||
цируемости и выпуклости функционала |
( 1) при условиях (2 ), (3), |
||||||||||||||
доказана |
справедливость принципа |
максимума |
|
для |
задачи |
( 1 ) — |
|||||||||
(3), кратко обсуждены возможности использования методов § 2 для приближенного решения этой задачи. Примем обозначения
9 Ф. П. Васильев
258 МЕТОДЫ М И Н И М И З А Ц И И |
В ФУНКЦ И ОНАЛ ЬНЫ Х |
ПРОСТРАНСТВАХ [Гл. О |
|||
|
а/1 |
|
|
др |
|
I L |
дх* |
J L |
|
диг |
|
|
|
|
|
||
дх |
df* |
ди |
|
df* |
|
|
|
|
|||
|
дхп |
|
|
диг |
|
•а/° |
’1 ••• У |
др_\ |
3/° _ fdfo_ |
|
|
. dxi |
дх* )' |
ди |
|
|
|
|
дФ |
( 5Ф |
<••• > |
5Ф \ |
|
|
- |
дхп ) |
’ |
||
|
дх |
V дх1 |
’ |
||
Т е о р е м а 1. |
Пусть функции f°, f, |
Ф непрерывны по совокуп |
|||
ности своих аргументов вместе со своими частными производными
по переменным х, и при |
ы е £ г> tQ^,ts£ZT, и пусть выполне |
ны следующие условия Липшица: |
|
\f(x + Ax, u + h, t) — f(x, |
и, *)|e„ < А('|Л*|е„ + |А’|яг), (4) |
|
|
ЗФ(* + |
Д* 1__дФ(х) |
| |
< Ц А х \Епг |
|
(5) |
||||
|
|
|
дх |
дх |
|
|
|
|
|
|
|
д}(х + |
Ах, |
u + |
h, |
t) |
df{х, и, |
t) |
|
^<L(| A x| £n+ |
|Л(яг), |
(6 ) |
|
I |
дх |
|
|
|
дх |
|
|
||||
|
|
|
|
|
|n |
|
|
|
|||
д/° (х + |
Дх, |
и + |
h, |
t) |
д ? (х, |
и, |
t) |
р |
<L(\A x\En-+\h\Ery, |
(7) |
|
|
дх |
|
|
дх |
|
|
|
|
|
||
df(x + |
Ах, |
u + |
h, |
t) |
df{x, и, |
t) |
|
|
|
|
|
|
ди |
|
|
|
ди |
|
|
|
|
|
|
д Р ( х + А х , |
u + |
h, |
t) |
df°(x, и, |
t) |
|
< L ( |Ах |£ + |
|А |я ) |
(9) |
||
|
ди |
|
|
|
ди |
|
|
\ЕГ |
|||
|
|
|
|
|
|
* |
г |
|
|||
(константы Липшица для всех функций здесь обозначим одной буквой L, так как величины этих констант для нас не будут суще ственными). Тогда функционал (1) при условиях (2), (3) непре
рывен и дифференцируем по u= u (t) в норме L p [f0, Т], причем его градиент
=. . . . j'r(i))eLir)[t0, т]
в точке и = и (t) |
представим в виде |
|
||
J' (u) = |
— |
dH(x{t)f |
t] , t0 < t < T , |
(1.0) |
|
|
ди |
|
|
где |
|
|
|
|
Н(х, ф, и, |
t):= |
— f°(x, и, t) + |
(ф, f(x, и, 0)е„ , ~ |
= ' |
|
|
•_ ( дН |
дН X |
(И ) |
Л ди1 ’ “ ‘ ’ диг ) ’
§ 5] |
Задача оптимального |
управления |
со свободным правым концом |
259 |
|
x(t)s= x(t, |
и) — решение |
задачи (2 ) |
при u = u(t), а вектор-функция |
||
ф(г) = |
ф(£, |
ы) = (тЫ 0 .......... |
ф„(0 ) определяется из условий |
|
|
дН (х «), гр, u{t), t)
t0 < t < T ,
дх1
дФ(х(Т))
i = 1 , 2 , . . . , п.
дх1
( 12)
(13)
Д о к а з а т е л ь с т в о . Пусть |
u = u {t), |
u + h = u (t) + h ( t ) ^ U , |
|
пусть x(t) ==x(t,u), x(t, u + h)z= x(t, |
u )+ A x(t), |
соответ |
|
ствующие этим управлениям решения задачи |
(2),/(и) |
и J (u + h ) — |
|
=/(и) + A J (и) — соответствующие значения функционала (1). Из
(2)следует, что приращение Ax(t) удовлетворяет условиям
Ах = |
f{x(t) + |
Ax, |
u(t) + |
h(t), |
t) — f{x(t), -u(t), t), |
(14) |
|||||
* |
|
|
|
t0 < t < T \ |
Ax(t0) = |
0. |
|
|
|||
Так как |
|
|
|
|
|
|
|
|
|
|
|
Ф (x + |
Ax) — Ф (x) = |
( |
5 0 (* * 9A*} , |
A x ), |
O < 0 < 1 , |
|
|||||
то из (1) |
получаем |
|
|
|
|
|
|
|
|
||
|
|
|
т |
|
|
|
|
|
|
|
|
|
A J ( u )= |
^ [/° (x + |
Ax, u + h , |
t) — f°(x, u, t)]dt + |
|
||||||
|
|
|
to |
|
|
|
|
|
|
|
|
|
|
|
+ ( |
дФ{дх(Т)) |
Ax(T)^ + Rlt |
|
(15) |
||||
где |
|
5Ф (х (Г ) + еА х (Г )) |
|
|
|
|
|
||||
|
|
|
дФ (x (Г)) . |
Ах (Г )), |
|
||||||
|
|
|
|
дх |
|
|
|
дх |
|
|
|
|
|
|
|
|/?1 |<L|A x(7’)P . |
|
|
(16) |
||||
С учетом соотношений (12) — (14) |
имеем |
|
|
|
|||||||
( — |
f / ) ) . |
АхХТ)^ = |
- ^ ( Т ) , |
Ах (7 )) = |
- | - ^ - ( ф ( 0 , |
|
|||||
|
|
|
|
|
|
|
|
|
|
*0 |
|
Ах (t)) dt = — j (ф, |
Ах) dt — ^'-(ф, Ах) di = |
^ ?Н(х, |
у, и, о; |
_ |
|||||||
|
|
*0 |
|
|
(о |
|
|
f0 |
|
|
|
|
|
Т |
|
|
|
|
|
|
|
|
|
|
|
|
/ (* + |
Ах, |
u + |
h, t ) - f { x , и, |
t))dt. |
|
|||
9*
