Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Иоффе, А. Д. Теория экстремальных задач [учеб. пособие]

.pdf
Скачиваний:
16
Добавлен:
22.10.2023
Размер:
15.51 Mб
Скачать

Г л а в а 2

НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА В ЗАДАЧАХ КЛАССИЧЕСКОГО ВАРИАЦИОННОГО

ИСЧИСЛЕНИЯ И ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

В §§ 2.3, 2.5 с использованием теорем

1 и 3

из гл. 1

дается

вывод уравнений Эйлера — Лагранжа для

задачи

Лагранжа

клас­

сического вариационного исчисления и принципа максимума Понтрягина для задач оптимального управления; § 2.2 и п. 2.4.2 посвя­ щены независимому от гл. 1 элементарному выводу важнейших необходимых условий минимума для простейших классов задач вариационного исчисления и оптимального управления.

§2.1. Постановки задач

2.1.1.Функционалы, ограничения, граничные усло­ вия. Мы будем рассматривать лишь одномерные задачи, когда независимое переменное t, называемое иногда

временем,

принадлежит

некоторому отрезку [^0, Ы.

— оо ^ t0 <

t\ ^

оо. В задачах, с которыми

приходится

иметь дело, как правило, участвуют две группы перемен­

ных: х = (х1, ...,

хп) и и = (и1, ...,

иг). Переменные х

называются

фазовыми, переменные

и управлениями.

В задачах,

относящихся

к классическому

вариацион­

ному исчислению или оптимальному управлению, при­

 

сутствуют три элемента: функционал, ограничения на

 

фазовые координаты и управления и граничные условия,

 

накладываемые на фазовые координаты на концах рас­

 

сматриваемого в задаче отрезка времени. На самом

 

деле не всегда разумно устанавливать разделение на

 

ограничения и граничные условия, но в большом числе

 

случаев это разделение выглядит естественно и оказы­

 

вается удобным.

трех видов. Интеграль­

 

Функционалы встречаются

 

ные функционалы имеют такую форму:

 

Vx (*< •),«(•))J=fit,

x(t), x(t), u{t))dt,

(1

*0

 

 

102

ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ

 

где

f: R X R" X R'1X Rr—> R; функция f

называется

интегрантом.

 

 

Функционалы, зависящие от конечных значений фа­

зовых координат, т. е. функционалы вида

 

 

У 2 (х (•)) = ф (/с. х (t0), tu х (/,)),

(2)

где ф: R X Rn X R X Rrt -> R, называются терминальными.

Наконец, встречаются функционалы смешанного вида

З'з(*(•). и(-)) = 5гЛх(-), М - )) + З Д ( - ) ) , (3)

где 3\ — интегральное, а — терминальное слагаемое. Ограничения, с которыми мы столкнемся, будут дво­ якого рода. Это — либо функциональные соотношения,

выражаемые равенствами и неравенствами:

G, (/, х (t), х (0, и (0) = 0,1

G2(t, x(t), x(t), u (t))^ 0 , J

( )

где Gp R X ^ 'X ^ X R " -> R ft', t == 1> 2, либо нефунк­ циональные соотношения, например:

u(t)< =U czR r,

yt

Л c: [f,,

t2].

(5)

Функциональные

ограничения

вида (4),

не зависящие

от производных и управлений, т. е. соотношения

 

g l(t,x(t)) = 0,

g2(t .x (t))< 0 ,

(6)

будем называть фазовыми ограничениями.

 

Ограничения типа

 

 

 

(7)

 

x(t) = q>(t,

x(t), u(t)),

 

где qp: R X R™X

Rr -* R",

называются

ограничениями

в разрешенной форме.

 

 

 

 

Уравнением (7) описываются многие управляемые

объекты. Отсюда

и названия — фазовые

координаты и

управления. Если

управление

задано, то уравнение

(7)

становится обыкновенным дифференциальным уравне­ нием относительно х. Всякое его решение, соответствую­ щее управлению «(■ ), называется фазовой траекторией, а пара (х(-), и( - )), связанная уравнением (7), назы­ вается управляемым процессом.

Граничные условия задаются выделением в прост­ ранстве R X Rn X R X Rn некоторого множества Г, ко­

§ 2.1. ПОСТАНОВКИ ЗАДАЧ

103

торому должны принадлежать концы траектории, т. е.

точка (t0,x (to ),ti,x {ti)). Часто встречаются такие

гра­

ничные условия:

за­

закрепленные, когда значения траектории

креплены на обоих концах отрезка [/0, Ч] (при этом сам отрезок предполагается фиксированным): x{to) — Xo, X(ti)=Xy,

свободный правый или левый конец, когда соот­ ветствующий конец отрезка |7о, Ч] предполагается фик­ сированным, но на нем условия на фазовую траекто­ рию отсутствуют;

периодические, когда отрезок [/0, Ч] фиксирован и фазовая траектория принимает равные значения на концах: x (to )= x(h).

2.1.2.Задачи классического вариационного исчисле­

ния и оптимального управления.

Общая постановка:

У(х(-),

« ( - ) ) —> inf (sup);

(8)

G, (t, x (t), x (0, и (t)) =

0,

G2 (t, x (t), x (t), и (0) ^ 0,

(9)

u{t)ezU(t),

 

(10)

(*o. x (tb)>

ti, x(ti))

e= Г

(11)

охватывает большинство задач оптимального управле­ ния и вариационного исчисления. (Отрезок [/0, Ы не пред­ полагается закрепленным. Если же он фиксируется, то соответствующую задачу называют задачей с закреплен­ ным временем.)

Если функционал (8) является интегральным, задача '(8) — (11) называется задачей Лагранжа-, если функцио­ нал — терминальный, то она называется задачей Майе­ ра и, наконец, если функционал — смешанный, то соот­ ветствующая задача называется задачей Больца.

Все три постановки являются в значительной мере равносиль­ ными. Если, например, задан интегральный функционал, то, введя новую координату хп+1 и пополнив систему (9) уравнением

хп+1— / =

0

с граничным условием * п+1( / о ) = 0 ,

мы задачу о минимизации

функционала

 

9 1= | felt

Н

104

 

ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ

1

сведем к минимизации терминального функционала

 

 

 

Z 2 =

xn + l(t,).

 

 

Наоборот,

если требуется

минимизировать

терминальный функ­

ционал Э г

=

ф(А, x(U)), скажем,

при фиксированных значениях

to и x(tо)

(тогда без ограничения

общности

можно считать, что

фНо, x(to)) =

0), то, предполагая, что функция

ф

дифференцируе­

ма, можно положить

 

 

 

 

и мы получим, что

^2 = ф (<1, *(/,))

Особенности задач классического вариационного ис­ числения состоят в следующем. Во-первых, в задачах классического вариационного исчисления все функции, входящие в описание задачи, предполагаются гладкими,

по меньшей мере — непрерывно дифференцируемыми.

С другой стороны, там отсутствуют нефункциональные ограничения вида (10). (Эти обстоятельства позволяют относить задачи вариационного исчисления к числу гладких задач, о которых речь шла в п. 1.1.1.) В зада­ чах же оптимального управления нефункциональные ограничения играют весьма существенную роль. Само по себе множество U(t), задающее ограничение (10), может иметь самую разнообразную природу, например, оно может быть дискретным множеством. Это делает не­ естественным рассмотрение в задачах оптимального управления гладких и даже непрерывных управлений,

авместе с этим и допущение о гладкости отображений G\, G2 в (9) и т. д. по управлениям и. Так что стандарт­ ные допущения в задачах вариационного исчисления —

непрерывная дифференцируемость по всем переменным,

ав. задачах оптимального управления— непрерывность по совокупности переменных и гладкость по перемен­ ным t u x . Задачи оптимального управления будут реду­ цированы к гладко-выпуклым задачам, о которых речь

шла в п. 1.1.3.

Приведем несколько примеров частных задач, ук­ ладывающихся в общую схему.

§ 2.1. ПОСТАНОВКИ ЗАДАЧ

105

Простейшей векторной задачей называется задача следующего вида:

^ (*(•))= J

x{t)) inf;

и

( 12)

(x(t0), г У

е Г.

В (12) отрезок [to, U] предполагается фиксированным, функция L — определенной и непрерывно дифференци­ руемой в некоторой области пространства R X R” X R". множество Г, задающее граничные условия, — произ­ вольным подмножеством пространства Rn X R"- Если п = 1, то задачу (12) называем коротко простейшей за­ дачей.

Буква L для обозначения интегранта простейшей векторной за­ дачи выбрана в честь Лагранжа. При этом производится неявная апелляция к языку и символике классической механики. В осно­ вании классической механики лежит принцип наименьшего действия (или как иногда его называют — принцип стационарного дей­ ствия— что более точно). Согласно этому принципу траектории движения системы частиц в силовом поле U являются стационар­ ными точками функционала действия

Под знаком интеграла стоит лагранжиан системы, являющийся раз­ ностью кинетической и потенциальной энергии:

L — T — U.

В силу сказанного, интегрант L иногда называют лагранжианом, даже если задача взята не из классической механики.

п

Выражения pi — Li , Н = '^i pixl — L называются в механике

1 £=1

импульсами и энергией системы. В дальнейшем мы иногда будем употреблять эти термины, навеянные классической механикой.

Задачей Лагранжа с ограничениями в разрешенной форме и фазовыми ограничениями типа равенств и

106

ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ

 

 

неравенств называют следующую проблему:

 

У ( х { ■), «(• )) = J f(t,x(t),u(t))dt ->M\

(13)

 

 

tti

 

 

(14)

 

x =

q>(t, х, и),

 

 

gi (t, x (t)) =

0,

g2(t, x {()) < 0 ,

(15)

 

h0(*o> x (to)) =

0,

ft, (tu x (t{)) =

0,

(16)

 

 

м е 1 /.

 

(17)

Здесь

интегральный

функционал не

зависит

от х.

Ограничения разделены

на разрешенные — (14) и фазо­

вые— (15). Граничные условия описываются соотноше­ ниями (16). (Так можно задать не все встречающиеся в приложениях граничные условия. Скажем, периодиче­ ские услозия таким путем описать нельзя. Но вместе с тем, соотношения (16) дают возможность выразить до­ статочно широкий класс граничных условий.)

При рассмотрении задачи Лагранжа в рамках клас­ сического вариационного исчисления будем предпола­ гать, что отрезок [/о, ^i] является фиксированным и ог­ раничение (17) отсутствует.

Задача (13) — (17) называется автономной, если во всех входящих в ее определение функциях н отобра­ жениях отсутствует явная зависимость от времени.

Линейными задачами оптимального управления бу­ дем называть задачи с закрепленным временем следую­ щего вида:

<■

| ((a (0 l* (0 ) + (M 0 U W ))t f - > in f ;

tn

 

 

 

 

x =

A(t)x +

B(t) и,

(gi (01x (t)) <

(t),

i =

1, .. •, m,

(Afc/| x (/* )) = P*/,

A =

0 , 1 ,

/ =

1 ...........sk, us=U.

Иногда требование о закрепленности времени при определении линейных задач опускают. Эти и более

 

§ 2.1. ПОСТАНОВКИ ЗАДАЧ

107

общие задачи оптимального управления будут исследо­

ваны в § 9.3 методами выпуклого анализа.

 

2.1.3.

Сильный и слабый экстремум в задачах клас­

сического вариационного исчисления. Поставленные выше задачи обладают все еще неопределенностью, ибо не описан класс допустимых элементов. Задача Ла­ гранжа (13) — (16) с фиксированным временем в рам­ ках классического вариационного исчисления будет ис­

следоваться

в банаховых

пространствах

С? (foXi]) X

X Сг([/0, Л]),

гДе СГ([/0,* 1]) — пространство

непрерывно

дифференцируемых вектор-функций,

a

Сг([£0, М )— про­

странство непрерывных вектор-функций.

(Норму в про­

странстве Ci

условимся

обозначать

для

сокращения

||-Hi, норму же в пространстве С, если мы хотим сопо­ ставить ее с нормой в пространстве Си иногда обозна­ чаем II-Но-) Исследование простейших задач проводится

в банаховых пространствах С\ ([^0, / t]).

Локальный минимум в пространстве С" X Сг в слу­ чае задачи Лагранжа (или в пространстве С" в случае

простейших задач)

называется

с л а б ы м . Иначе

говоря,

пара (х *(-), «*(•))

доставляет с л а б ы й л о к а л ь н ы й м и н и ­

м у м ф у н к ц и о н а л у

У ( х ( • ),«(■ )) в задаче

(13) — (16),

если найдется

такое число

е >

0, что для любой допу­

стимой пары

(х (• ),« (• ))е

Ci X Сг такой,

что

 

Н *(' ) — * .( *)lli < е>

II ы ( -) — w, ( -) По <

е,

выполняется неравенство

 

 

 

 

У ( х ( - ) , и ( - ) ) > У ( х . ( - ) , «,(•))•

 

 

При этом

пара

называется

д о п у с т и м о й

в

задаче,

если она удовлетворяет ограничениям (14) и (15) и граничным условиям (16).

Совершенно аналогично определяется слабый мини­

мум для простейшей задачи (12).

пространства

Локальный экстремум

в

топологии

С.1 (по х )

называется с и л ь н ы м .

Иначе говоря, допусти­

мая пара

(**(•), ц *(-))

доставляет с и л ь н ы й л о к а л ь н ы й

м и н и м у м

функционалу У

в задаче (13) — (16), если най­

дется

такое число

е >

0,

что

для любой

допустимой

пары

(*(•), «(• )),

для которой

 

 

II * ( ' ) — * .(• ) 11о < е»

1 0 8

ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ

выполняется неравенство

Д ( * ( - ) , д ( - ) ) > Д ( х . ( . ),«. (•)) .

Аналогичным образом определяется сильный мини­ мум для простейшей векторной задачи (12).

Но мы будем в термин «сильный экстремум» вкла­ дывать несколько расширенное толкование, которое свойственно этому понятию в задачах оптимального управления. Об этом речь пойдет в следующем пункте.

2.1.4. Допустимые управления и управляемые про­ цессы в задачах оптимального управления. Оптималь­ ные процессы. Уже упоминалось, что требование непре­ рывности управлений во многих случаях не является естественным. Нередко из самой постановки задачи вы­ текает необходимость рассматривать более широкий класс допустимых управлений. Иногда в качестве тако­ вого берут класс кусочно-непрерывных управлений. Мы же будем обычно рассматривать в качестве допустимых

произвольные ограниченные измеримые управления, принимающие значения из множества U(t).

При таком выборе допустимых управлений требуется уточнить понятие управляемого процесса. Процесс (x(t),u(t)) называется управляемым на отрезке |Y0, t\], если на этом отрезке функция u(t) — допустимое управ­ ление, х (t) — абсолютно непрерывная вектор-функция, удовлетворяющая почти всюду уравнению (14):

X(t) = 4>(t, x(t), u{t)).

В понятие допустимого управляемого процесса вклю­ чается и отрезок времени, на котором этот процесс рас­ сматривается. Таким образом, управляемый процесс,

допустимый

в

задаче

(13) — (17),

это

тройка

(x(t),

u(t),

[f0, *,])

такая,

что

вектор-функции

x(t)

и u(t) образуют

управляемый

процесс

на

отрезке

[to, h]

и при этом

фазовые

переменные x(t) удовлетво­

ряют

фазовым ограничениям (15) и граничным усло­

виям

(16).

 

процесс

(xt (t), ut (t),

[lo.,

й»])

назовем

Допустимый

оптимальным,

если

найдется е >

0 такое,

что

для

вся­

кого

другого

допустимого

процесса

(*(^), и (/), [£0. М)>

для которого I to to* |<

е, I t\ t\* 1<

e, I X (t) xt {t) I < Б

§ 2.2. ЭЛЕМЕНТАРНЫЕ ВЫВОДЫ

109

(Vfe=[f„, *,]П[*о., ti,]) имеет место неравенство

2 ( x ( - ) , u ( - ) ) ^ V ( x t ( •), « .(О ).

В описанной ситуации говорят

еще,

что

процесс

(х*(/),

а*(0»

[/о*, /и]) доставляет

сильный

минимум в

задаче

(13) —

(17).

к

задачам

классиче­

Таким образом (возвращаясь

ского вариационного исчисления), в расширенное по­ нимание сильного минимума вкладывается следующий смысл. Проиллюстрируем его на векторной задаче клас­ сического вариационного исчисления.

Мы говорим, что вектор-функция x„{t) доставляет сильный минимум в задаче (12), если существует е > 0 такое, что для всякой функции x(t)<= WS.,i([^o, *ij)> удов­ летворяющей граничным условиям и неравенству

||*(-)— М- ) 1 1 о < е ,

имеет место неравенство

§ 2.2. Элементарный вывод необходимых условий экстремума для простейших задач классического вариационного исчисления

В этом параграфе мы даем вывод необходимых ус­ ловий Эйлера, Вейерштрасса, Лежандра и Якоби, ис­ пользуя самые элементарные средства. Наши рассуж­ дения всюду основаны на непосредственном примене­ нии метода вариаций.

2.2.1.Элементарный вывод уравнения Эйлера. Нач­

нем с простейшей задачи с закрепленными концами:

Л

 

 

. ? ( * ( • ) ) = f L (t,x(t),& (t))d t-+ in i;

0)

и

 

x(t0)=Xo,

X ( t i ) = X i .

 

Предположим, что функция L(t,x,y) непрерывно дифференцируема в некоторой области U пространства R3. Задачу (1) будем исследовать на слабый экстремум, т. е. — в пространстве Ci([/o,^]).

п о

ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИ,

Вывод

уравнения Эйлера состоит из трех этапов.

Первый этап состоит в доказательстве того, что функ­

ционал & обладает первой вариацией

(в любой точке

х*(-) такой, что точки

(t, х* (/), x*{t) ),

t ^ [ t 0,ti], принад­

лежат области U), и в

получении необходимого условия

в терминах первой вариации. Рассмотрим функцию од­ ного переменного

ф(Я)=

ЗДх,( .)

+

**(•)) =

J

'Ftf,

*)<#=

 

 

 

 

 

и

 

*0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

{

L(t,x,(t)

+

lx (t), х, (t) +

lx

(t)) dt,

(2)

порожденную

вариацией

x( t, l)

=

x*(/) +

lx(t)

точки

x*(-)

по направлению точки x( - ) .

При наших допуще­

ниях относительно L, х*(-)

и х( - )

функция Чг(/, Я,) яв­

ляется дифференцируемой

по I при достаточно малых

 

 

 

 

 

 

дЦГ

 

 

 

 

 

 

I, и при этом производная - непрерывна, ибо

 

 

dX¥{Jl

=

Lx ((, х, (0 + lx (t),

х, (t) +

Ях (0) x (t) +

 

 

 

 

 

 

+

Lx (t, x, (/) -f- lx

(t), xt (t) -f- lx

(t)) x (t).

Следовательно,

допустимо

дифференцирование

в

(2)

под знаком интеграла и при этом

 

 

 

 

 

 

ф' (0) =

Ъ&(х, (•),

х (•)) =

J (q (t) x{t) +

p (t) x (it)) dt,

 

где

 

 

 

 

 

 

 

 

 

 

 

 

 

q (0 =

Lx (t, x, (t), x, {t)),

p (t) =

Lx (t, x, (t), x

(0).

 

Далее, если функция x*(/) подозреваема на экстре­ мум, то она допустима, и значит, для любой функции x(t), принадлежащей подпространству Ь0:

L o = ( x ( O e C , ( [ f 0, *il)l *(^о) = * ( f i) = ° Ь

функция х*( 0 + ^ ( 0 будет проходить через те же гра­ ничные точки, что и функция х*(0- Следовательно, если x„(t) есть решение задачи (1), то при условии, что

Соседние файлы в папке книги из ГПНТБ