Добавил:

ivanov666 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Башкирский Государственный Аграрный Университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

книги из ГПНТБ / Иоффе, А. Д. Теория экстремальных задач [учеб. пособие]

.pdf

Скачиваний:

Добавлен:

22.10.2023

Размер:

15.51 Mб

Скачать

☆

<<< < Предыдущая 4 5 6 7 8 9 10 11 12 13 14 1516 / 4916 17 18 19 20 21 22 23 24 25 26 27 28 > Следующая >>>

§ 2.4. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА

151

Для уравнения

X = ф (t, X, 1>)

разрешима в окрестности точки (т, лс*{т)), вектор-функ ция xk(t) определена и на отрезке [т — X, т], если X до статочно мало.

Коль скоро управление ы*(0 непрерывно в точке т, оно непрерывно и в некоторой ее ^-окрестности. Поэто

му и Xz(t) непрерывна в этой			окрестности и, следова
тельно,
** (т) =	X' (т — к) +	Хх, (т — X) +	о (X) =
=	xt (т — X) +	А,ф(т — X, х„ (т — X), и,(х — X)) -(- о (X).

Точно так же

xk( x ) = x t (т — X) + Яф(т — X, Х ' ( т — Х), v) +о(А).

Отсюда следует, что предел

Х 1 (т) — А, (т)

у(т) == lim

л^ о

существует и равен

г/(т) = ф(т, xf (x), v )— ф(т, .г,(т), u , ( t )).

(18)

На отрезке [т, t\)I иих*(. (-•), , ииххлгх(-()-) удовлетворяют урав нению

х = q>(t, х, н,(0)-

Из теоремы о непрерывности и дифференцируемости решения дифференциального уравнения по начальным данным следует, что при достаточно малых X > 0 век тор-функции xk(t) определены на [т, Л], сходятся равно мерно к х*(/) и предел

		y{t) = lim		хк(0 — X, (t)
		y{t) = lim			_
		к+ о
существует при		всяком / е		[т, ^]. Имеем при t > т
			t
	Xl(t) =	Xk{x )+	J ф(5,		xx(s),	u,(s))ds,
			t
bUJJ	x, (0 =	-V. (т) +	J	Ф(s,	X, (s),	u, (s)) ds,
bUJJ			T
			T

152 ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ

так	что
^ (0 - *. (О
	X	t
	xx ( t ) — X, (т)	t	qp(s, хк (S), и, (s)) — ф (s, х„ (s), и, (s))	^
—	xx ( t ) — X, (т)	t С	qp(s, хк (S), и, (s)) — ф (s, х„ (s), и, (s))	^
—	Я	+ J	X	a s '
		X

Переходя к пределу при А | 0, получаем

y(t) = У (т) + J Ф* (s, х. (s), и. ($)) у (s) ds. X

(Переход к пределу под знаком интеграла возможен, поскольку ф непрерывно дифференцируема по х, а u„(t)— ограниченная вектор-функция.) Таким образом,

у{1) есть на [т, решение уравнения

У= ф*0> *„(0» и * ( ( ) ) У

сначальными условиями (18).

Имеем при t ^ т

4 г (Р (О IУ (0) =			(р (0 I у (0) + (р (0 I у (0) =
= -	(ф; 0,	(0,	и.	(0) р (0 I у (0) + (/, 0, ** (0, н* (0) I у щ +
+	(р (0 1ф, 0,		*, (0. «, (0) р W) = Их 0. х, (0,			«. (0) IУ (0),
т. е. поскольку			p(/i) = 0,
	(р (0 IУ (0) =			— Jи (f* (S,	л:, (S). «* («)) IУ (Л) ds■
				t
В частности, согласно (18)
(р(т)\|ф(т,		х,(т),	ы»(т) ) — фЛ>		**Ы, «)) =
				л			(19)
				= J (Л0. *,0). и,(0) 1р(О)			(19)
				г
Далее, поскольку				(х„ (/), н, (()) — оптимальный		процесс,
	Пт А"1[ Д М			■), « * (• ) ) - ■ ? (*.(•), м . ( - ) ) ] > 0 .
	Я+0

§ 2.4

ПРИ Н иИ П МАКСИМУМА ПОШРЯГИНА

153

Вычислим

этот предел.

Он,

очевидно, равен

Пт л 1

[[/(/,

xk{t), v ) — f(t,

x,{t), ut (t)) ] dt -f-

A\K>

t—К

+ lim A,-1

xk(t),

x,(t),

u,{t))]dt =

/( T, X, (t ),

v )— f( T, X, (t), Ы. (t )) +

ifx (t,

X, (/),

и. (/)) I у (t)) dt.

Отсюда, используя равенство

(19), получаем

(р(т)|<р(т,

х. (т),

u,(x)))— f(x,

х. (т),

и. (т ))>

>(р (т)| ф (т,

х. (т),

v))— f( т, х+(т), и).

Но

т — произвольная

точка

непрерывности

управ

ления

м*(/) и

v — произвольный

элемент

множества U.

Отсюда

следует,

что

соотношение

(15)

выполняется

во всех точках непрерывности управления и*(/), чт0 и

требовалось.

максимума

вариационное

исчисле

2.4.3.

Принцип

ние. Принцип максимума Понтрягина содержит необхо

димые

условия (первого порядка)

в классическом ва

риационном исчислении. Мы покажем сейчас, как из

принципа максимума можно получить уравнение Эй

лера

условия Вейерштрасса, а также

канонические

уравнения

условия

Вейерштрасса — Эрдмана,

о ко

торых мы ранее не упоминали. Ограничимся простейшей вариационной задачей. Читатель при желании может проделать соответствующие выкладки для задач более общего вида.

Итак, рассмотрим простейшую задачу

и предположим, что функция х*(/) (непрерывно диффе ренцируемая) доставляет сильный минимум в этой за даче. Можно переписать задачу в форме задачи

154		ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
оптимального		управления следующим образом:
		и
		) А (/,	х, и) dt-+ inf;
		*0
	х — и, u e R ,		x(t[j) =	x0,		x(t[) =	x
Тогда,	если	положить	ut (t) =	xt (t), то			управляемый
процесс	(*(•),»(•))		оптимален		в	последней задаче.
Имеем		// = ри — l 0L (/,			.т,	и).
		// = ри — l 0L (/,			.т,	и).

Сопряженное уравнение имеет вид

Р = А0Аа. (/, xt {t), X' (/)),

а из принципа максимума следует (поскольку ограни чения на и отсутствуют), что

Hu = P - h L	i {x^ Ut(tt) =	0	(20)
почти везде. Но поскольку	управление	ut (t)	непрерыв

но, написанное соотношение должно выполняться при

всех t. Если бы >„0 равнялось нулю, то			в силу (20)		и
p(t) равнялась бы тождественно нулю,			что невозможно.
Поэтому можно считать,	что ).0 =	1, и	мы	приходим	к
уравнению Эйлера
P(() = - ^ Lx(t, x,(t),	u,(t)) =	Lx (t,	x,(t),	xjt)).

Далее, из принципа максимума следует, что почти при всех t

т а x(p (t)u — L(t, xjt), и)) = р (t) ujt) — L (t, x jt), ujt)). U

Это равенство, очевидно, выполняется во всех точках непрерывности функции н*(0> т. е. при всех t. Прини мая во внимание формулу (20), получаем

L(t, xjt), u) — L(t, xjt), xjt)) —

— (и — i (t)) Lx (t, x. (t), x, (0) > 0

при всех t и и. Мы пришли к условию Вейерштрасса. Эти рассуждения позволяют, в частности, сделать

вывод о том, что обычно используемое в вариационном

§ 2.4. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА

155

исчислении требование непрерывной дифференцируемо сти экстремальной функции является излишним. Те же соотношения выполняются (но уже не при всех, а только почти при всех t), когда экстремальная функция абсо лютно непрерывна, а ее производная ограничена.

В частности, с помощью условия принципа максиму ма легко получаются необходимые условия Вейерштрасса — Эрдмана для так называемых ломаных экс тремалей. Действительно, если сильная минималь х*(/) имеет кусочно-непрерывную производную, то уравнение

Эйлера и	условие	Вейерштрасса должны		выполняться
в каждой	точке	ее непрерывности.	Пусть при t — т
функция	x*(t) не дифференцируема		(т. е.	ее производ

ная терпит разрыв первого рода). Во всех точках не прерывности i* (0 верна формула

x,{t)L k(t, х:,(/), x J t))— L(t, xt (t), x,(t)) =
=	x,(t), P(t)).

Согласно принципу максимума, гамильтониан непреры вен, отсюда следует, что

i . (т — 0) Lk(т, х, (т), х, (т — 0)) — L (т, х, (т), х, (т — 0)) =

= X, (т + 0) L* (т, X, (т), X, (т + 0)) — L (т,	х„ (т),	х, (т + 0)).
Точно так же, поскольку функция/?( / ) =	Lk(t,	(/),i*(/)),

будучи решением сопряженного уравнения, непрерывна,

U (т, лг. (т), X, (т — 0)) = Lk (т, х, (т), X, (т + 0)).

Эти два соотношения называются условиями Вейер штрасса — Эрдмана. Они характеризуют возможные значения разрывов производных у ломаных экстрема* лей. Для простейшей векторной задачи условия Вейер штрасса— Эрдмана пишутся совершенно аналогично.

В заключение скажем несколько слов о канониче ских уравнениях. Мы уже отмечали, что в задаче опти мального управления фазовая траектория и решение сопряженного уравнения удовлетворяют системе урав нений

х	дИ		дН
	др	Р =	дх •

156	ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ

Предположим теперь, что лагранжиан L простейшей задачи вариационного исчисления дважды непрерывно дифференцируем и удовлетворяет усиленному условию Лежандра: Lkk > 0, т. е., в частности, — это выпуклая функция по последнему аргументу. Тогда по теореме о неявной функции в окрестности каждой точки

(/, x*(t), i * ( / ) ) уравнение

p = Li(t, х, и)

однозначно разрешимо относительно и, т. е. суще ствует такая непрерывно дифференцируемая функция u(t, х, р), что

p = Lk {t, х, u(t, х, р)),

где	u(t,xt (t),p{t)) =		i* (0 . P(t) = Lt{t,x,(t),x*(t)).
В	точке	и — u(t,x,p)	производная	функции	и->ри —
— L(t, х, и) — Н (t, х, и, р) равна нулю. Коль					скоро эта
функция		вогнута, она	достигает	максимума	в точке
u(t, х, р),		т. е.

II {t, х, a(t, х, р), р) =

= ри (I, х, р) — L (t, х, и (t, х, р)) = Ж (t, х, р).

Последнее соотношение определяет так называемое

преобразование Лежандра функции L по последнему ар

гументу.	Обобщение			этого		преобразования — преобра
зование	Юнга — Фенхеля — мы						будем	подробно изу
чать в следующей главе. Имеем									____
	дЖ_ _ д И _			дН_ди_ _		дН_ , (		г \ ди
	дх	их	'	ди	дх	дх	' у		х’ дх
Но на экстремали p =					Lk {t,	xt (/),	*,(/)).	Поэтому
	дЖ (t, xt {t),		p (t))		dH (t, х„ (t), xt (Q,				p (Q)
		дх					dx
Аналогично					и из	(21)	следует,		что **(•) и

р(-) являются решениями такой системы уравнений:

дЖ . дЖ

Х==Т ^ ' Р = - ~ д 7 -

Полученная система уравнений первого порядка, оче видно, эквивалентная уравнению Эйлера, называется

§ 2,4 ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА			157
канонической формой уравнения	Эйлера	или	просто —
канонической системой.		в классическом
2.4.4. Некоторые иллюстрации. Как и
вариационном исчислении, при	решении	задач опти

мального управления с помощью принципа максимума можно встретиться с самыми различными ситуациями. Для линейных задач с ограниченным множеством управлений типична ситуация, когда существует един ственный допустимый управляемый процесс, удовлет воряющий принципу максимума, и этот процесс

оптимален.			1.	В задаче
П р и м е р			1.	В задаче
		I
	J х dt - >			in f;	х =	и, \| и \^	1,	х (0) =	0,
	о
принципу		максимума			удовлетворяет			только процесс
(x(t) =	— t, u(i) = — 1 ) ,					очевидно, являющийся опти
мальным.		В самом деле, в этой задаче
					Н =	ри — х,
сопряженное уравнение имеет вид
						Р = 1>
откуда	(так		как	мы	рассматриваем задачу со свобод
ным правым			концом		н,	значит,	/7(1) = 0)		(/) = / — I

и максимум функции Н достигается при ц = — 1. Вообще же, в задачах оптимального управления

можно столкнуться с теми же ситуациями, что и в вариационном исчислении: отсутствие решения, суще ствование множества допустимых процессов, удовлетво ряющих принципу максимума и являющихся или не являющихся оптимальными и т. д. Тот факт, что в за дачах оптимального управления часто рассматривают ог раниченные множества допустимых управлений, может породить (и порой порождает) иллюзию, будто реше ния в таких задачах непременно существуют и всегда могут быть найдены с помощью принципа максимума. Эго, конечно, неверно. Для иллюстрации рассмотрим пример, который позволит нам заодно обратить внима ние на весьма важное явление — скользящие режимы.

158

ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ

П р и м е р

2. С к о л ь з я щ и й

ре жи м .

Рассмотрим

такую задачу

J х- dt -> inf;

х —

и,

! и [ = 1,

х(0) =

а,

*(1) =

При |а|

1, очевидно,

не существует

ни

одного

до

пустимого управляемого

процесса.

При

|сс| =

такой

процесс

единствен

соответствует

управлению

u(t) =

= siVn

ос. Пусть

теперь

ос = 0. Легко

понять,

что лю

бому

допустимому

управ

ляемому

процессу

соответ

ствует

положительное

зна

чение

функционала.

Вместе

с тем на последовательно

сти -МО, x2(t), *з(t)..........

изображенной

на

рис.

у у функционал стремится к ну

Рис. 8.

лю. Заметим, что здесь по

следовательность

фазовых

мерно, а

траекторий

сходится равно

последовательность управлений,

наоборот,

ни

к чему не сходится. Такие последовательности назы ваются скользящими режимами.

Итак, задача не имеет решения. Предлагаем чита телю проверить, что ни один управляемый процесс не

удовлетворяет принципу		максимума (при				ос ~ 0 ) .
§ 2.5. Доказательство принципа максимума
Напомним, что мы рассматриваем						следующую
задачу:
У{ х ( - ) ,	«(•)) =		[ f(t,	х,	и) dt -> inf;		(1)
	* =	ф {t, х,		и),			(2)
		и	U ,				(3)
Ло(*о.	(<>)) =	0,	hAtu		*(<■)) =	<).	(4)

Мы не можем воспользоваться здесь правилом множи телей Лагранжа из-за ограничений, наложенных на уп равления, и из-за невозможности дифференцирования

%2.5. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА

159

по и. Наше доказательство опирается на экстремальный принцип для гладко-выпуклых задач. Связь его с зада чей оптимального управления не столь очевидна, как, скажем, связь правила множителей Лагранжа с клас сической задачей Лагранжа, да и вывод принципа мак

симума	Понтрягипа	из экстремального			принципа		для
гладко-выпуклых задач требует больших усилий.
Первым шагом в наших построениях будет редукция
задачи	(1) — (4) к эквивалентной в некотором смысле
гладко-выпуклой задаче. Мы			сделаем	это с		помощью
предложенного А. Я. Дубовицким и А. А. Милютиным
приема, использующего замену времени.							процесс
2.5.1.	Редукция задачи.		Пусть управляемый
(хН), м(0). определенный на отрезке [/о*,/и], опти
мален в задаче (1)		— (4). Выберем		неотрицательную,
ограниченную и измеримую			на отрезке		[0, 1]	функцию
у, (т), подчиненную условию
	1
	j	vt (x)dx =	tlt— /0„				(5)
	о

н положим

/= Ч (т ) = /<>.+ |Ч ( £ ) ^ .

о	(6)
Д (VJ = (т е [0, 1]\|и. (т) >	0}.

Зафиксируем далее измеримую г-мерную вектор-функ цию ш*(т), принимающую значения в U и почти всюду на множестве А (и*) удовлетворяющую равенству

W. (т) = И, (/. (т)),			(7)
Теперь мы можем сформулировать ту редукционную
задачу, о которой говорилось в начале параграфа:
I			(8)
J vf(t,	у, w, (T))dr->inf;
и	vcp(t,	у, w,(т)),	(9а)
y' =
	t' =	v,	(96)
	v > 0 ,		(10)
А0(/(О), !/(0)) = 0,		А,(/( 1), //(!)) = 0	(11)
К И Ш

(штрихами обозначены производные по т),

160	ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ

Это тоже задача оптимального управления, и управ ляющим параметром в ней служит скаляр и. В каче стве допустимых управлений в этой задаче мы будем брать всевозможные неотрицательные, ограниченные и измеримые функции v(x), каждая из которых обра щается в нуль на одном пз

множеств

вида (6). Пусть функция чена и измерима на отре

Л* = {т<=[0, 1]Цш,(т)|>/г)

(fe = 0, 1, . . . )

■

(своем для каждой функ ции). Множество таких функций обозначим бук вой Т.

Положим

У. (*) = х, (t, (т)),

где /*(т) определяется фор


мулой		(6).		1.
Л е м м а					Управляе
мый	процесс			(/*(т),		г/*(т),
и*(т)) допустим					в	задаче
(8) — (11) и				доставляет ей
локальный минимум.
Для		доказательства лем
мы	нужно		более		подробно
рассмотреть			преобразования
(т) неотрицательна,						огранн-
е [0,1]		(рис.		9,а).	Положим

t ( T) = t(0) +	J y(n) dr\,
	о
А( ц ) ={ т <=[0,	1]\| а (т) > 0}.

Функция /(т) непрерывна и не убывает. Обратная функция тоже не убывает, но может, вообще говоря, иметь разрывы первого рода в не более чем счетном множестве точек |2, ... (рис. 9,6). Положим для определенности

т(/) — min (т е [0, 1]Щт) = Л, если /=^/(1), т ( / ( 1) ) =1 .

<<< < Предыдущая 4 5 6 7 8 9 10 11 12 13 14 1516 / 4916 17 18 19 20 21 22 23 24 25 26 27 28 > Следующая >>>

Соседние файлы в папке книги из ГПНТБ