FIZTEX-exist
.pdfКурс лекций А.В. Дмитрука "Математическая теория оптимального управления"
ФИВТ, весна 2013 года
Существование решения в задачах на экстремум
Приведем два классических примера, в которых решение не существует.
Пример 1 (К. Вейерштрасс). |
|
|
|
|
J = ∫0 |
1 t2u2 dt → min, |
x˙ = u, |
x(0) = 0, |
x(1) = 1. |
Пусть решение ищется в классе u L∞[0, 1]. Ясно, что на любой допустимой функции J(u) > 0. Покажем, что inf J = 0. Действительно, ε > 0 положим u"(t) = 1/ε на [0, ε], и равной нулю вне этого отрезка. Тогда
J(u") = ∫0 |
" |
1 |
|
1 |
|
|
t2 |
dt = |
ε → 0. |
||||
|
||||||
ε2 |
3 |
Нетрудно убедиться, что и в любом другом классе интегрируемых функций u, со-
держащем L∞[0, 1] (или только C[0, 1]), |
решения не существует. |
|
||||
Пример 2 (О. Больца). |
|
|
|
|||
J = |
∫0 |
1 |
(x2 + (u2 − 1)2) dt → min, |
x˙ = u, |
x(0) = 0, |
x(1) = 0. |
Здесь опять на любой допустимой функции J(u) > 0. Действительно, если J(u) = 0, то x(t) ≡ 0, почти всюду x˙ (t) = u(t) = 0, но тогда (u2 − 1)2 = 1, и J(u) > 0, противоречие.
Покажем, что inf J = 0. Для любого n положим un(t) = sign sin (2πn t). Тогда |un(t)| ≡ 1, а |xn(t)| 6 const n1 → 0 при n → ∞, поэтому J(un) → 0.
Еще проще этот эффект проявляется в задачах оптимального управления (так как в них есть возможность выбора ограничения на множество допустимых управлений).
Пример 3 (задача оптимального управления).
∫ 1
J = x2 dt → min, x˙ = u, x(0) = x(1) = 0, u U = {−1, +1}.
0
Здесь опять на любой допустимой функции J(u) > 0, а последовательность un(t) = sign sin (2πn t) дает inf J = 0.
Возникает естественный вопрос: при каких условиях на задачу можно гарантировать, что решение (т.е. точка глобального минимума) в ней существует? Ответ на
1
него дается теоремами существования. Для их формулировки потребуется следующее понятие.
Полунепрерывные снизу функции. Пусть X − топологическое пространство. Функция f : X → IR называется полунепрерывной снизу в точке x0 , если
f(x0) 6 lim f(x), |
(0.1) |
x7→x0 |
|
и полунепрерывной снизу на X, если это неравенство верно для всех x0 X .
Лемма 1. Пусть f : X → IR − произвольная функция. Тогда следующие три
свойства эквивалентны: |
|
|
а) |
f полунепрерывна снизу на X ; |
X × IR ; |
б) |
её надграфик epi f = {(x, z) X × IR : z > f(x)} замкнут в |
|
в) |
µ IR нижнее лебегово множество L (f) = {x | f(x) ≤ µ} |
замкнуто в X . |
Теорема Вейерштрасса. Пусть пространство X компактно, a функция f : X → IR полунепрерывна снизу на X. Тогда f достигает на X своего минимума.
Доказательство можно провести двумя способами. Обозначим A = inf f. (Априори не исключен случай A = −∞. )
1) Возьмем любую минимизирующую последовательность xn X, т.е. такую, для которой f(xn) → A. Поскольку X − компакт (но, вообще говоря, без первой аксиомы счетности), из этой последовательности можно выбрать поднаправленность (т.е. обобщенную последовательность) xn , параметризованную индексом α из некоторого направленного множества, сходящуюся к некоторой точке xˆ X. Для нее попрежнему f(xn ) → A. В силу (0.1) имеем f(ˆx) 6 A, но так как знак < здесь быть не может, получаем f(ˆx) = A.
(Если X обладает первой аксиомой счетности (напр. метрическое), то вместо поднаправленности можно брать обычную подпоследовательность; в этом случае доказательство очень прозрачно.)
2) Для любого µ > A множество подуровня L (f) очевидно непусто и замкнуто. Семейство этих множеств центрировано, так как любое конечное число таких множеств имеет непустое пересечение (надо взять минимальное из данных µ, тогда соответствующее непустое L (f) будет содержаться в каждом множестве из данного набора). Поскольку X − компакт, то и все эти множества имеют непустое пересече-
ние, т.е. найдется точка x,ˆ принадлежащая всем им: |
f(ˆx) 6 µ для любого µ > A. |
Но тогда f(ˆx) 6 A, и значит f(ˆx) = A, и A > −∞. |
2 |
Практически все теоремы существования решения в задачах на экстремум так или иначе основаны на теореме Вейерштрасса.
Обратим внимание на следующее обстоятельство. Пусть мы ищем минимум функции f на некотором множестве X. На этом множестве может не быть никакой топологии, и мы можем задавать ее в определенном смысле произвольно. При этом чем сильнее будет топология (т.е. чем больше запас открытых и замкнутых подмножеств в X ), тем, с одной стороны,
2
больше "шансов" для функции f быть полунепрерывной снизу на X, но с другой стороны, меньше "шансов" для множества X быть компактом. Таким образом, полунепрерывность снизу функции f и компактность X диктуют противоположные требования к топологии (первое требует ее усиления, а второе ослабления). Если удается найти топологию, удовлетворяющую обоим требованиям, то выполнены условия теоремы Вейерштрасса, и тогда минимум существует.
Задача оптимального управления, выпуклая по управлению
На фиксированном отрезке времени |
∆ = [0, T ] рассмотрим следующую задачу Е: |
||
J = ∫0T L(t, x, u) dt + φ(x(0), x(T )) → min, |
(1.1) |
||
x˙ = f(t, x, u) = a(t, x) + B(t, x) u, |
(1.2) |
||
u(t) U |
для п.в. t ∆, |
(1.3) |
|
(x(0), x(T )) M, |
(1.4) |
||
x(t) S(t) |
t ∆. |
(1.5) |
|
Здесь, как обычно, x : ∆ → IRn |
− абсолютно непрерывная, а |
u : ∆ → IRr − |
измеримая ограниченная функции. |
|
|
|||
Предположения: |
|
|
|
|
|
А1) функция L(t, x, u) непрерывна на |
∆ × IRn × U и выпукла по u , |
||||
А2) вектор-функция |
a(t, x) и матрица |
B(t, x) |
(соответствующих размерностей) |
||
непрерывны на ∆ × IRn, |
концевая функция φ(x0, xT ) непрерывна на IR2n, |
||||
А3) множество M IR2n |
замкнуто (как правило, оно задается некоторым набо- |
||||
ром ограничений типа равенства |
η(x(0), x(T )) = 0 |
и неравенства ζ(x(0), x(T )) 6 0 |
|||
с непрерывными функциями |
η и |
ζ ), |
|
|
|
А4) при каждом t ∆ |
множество S(t) IRn |
замкнуто, и хотя бы при одном |
t0 ∆ оно ограничено: |S(t0)| 6 c0,
А5) множество U IRr есть выпуклый компакт,
А6) тройка (f, S, U) удовлетворяет условию Филиппова: существует такое число
K, что t ∆, x S(t), u U выполнена оценка |
|
|(x, f(t, x, u))| 6 K (|x|2 + 1). |
(1.6) |
Можно ограничиться и более слабой оценкой |
|
sign (t − t0) (x, f(t, x, u)) 6 K (|x|2 + 1). |
(1.7) |
(В случае, когда S(t) равномерно ограничено, слева в (1.6) стоит ограниченная величина, поэтому условие Филиппова автоматически выполнено.)
3
При этих предположениях верна следующая теорема существования (некоторая модификация теоремы, доказанной А.Ф. Филипповым в 1959 году ):
Теорема 1. Пусть в задаче Е существует хотя бы один допустимый процесс. Тогда существует и (глобально) оптимальный процесс, т.е. функционал J достигает своего минимума.
Доказательство состоит из нескольких этапов. Обозначим через D множество всех допустимых процессов (x(t), u(t)). Мы покажем, что D есть компакт в некоторой топологии, а J полунепрерывен снизу в этой топологии. Будем рассматривать допустимые процессы как элементы пространства C(∆) × L∞(∆).
1) Покажем, что множество всех допустимых траекторий x(t) равномерно ограничено в пространстве C(∆). Обозначим z = |x|2+1. Тогда в силу (1.2) и (1.6) имеем
|z˙| = 2 |(x, f(t, x, u))| 6 2Kz, и так как в силу А4 |z(t0)| 6 (c20 + 1) , то t ∆ |z(t)| 6 |z(t0)| e2K(t−t0) 6 (c20 + 1) e2KT ,
и тогда |x(t)| 6 const = K0 . (При выполнении лишь оценки (1.7) надо отдельно рассмотреть случаи t < t0 и t > t0 .) Отсюда, из равномерной ограниченности значений u(t) и непрерывности f вытекает в силу (1.2), что и |x˙ (t)| 6 const = K1 .
Таким образом, множество всех допустимых траекторий x(t), рассматриваемое в пространстве C(∆), равномерно ограничено и равномерно липшицево (а следовательно, равностепенно непрерывно). По теореме Асколи–Арцела это предкомпакт в
C(∆).
2)Рассмотрим теперь множество всех допустимых управляющих функций
U = {u L∞(∆) : u(t) U п.в. на ∆}.
Поскольку U ограничено, то U содержится в некотором замкнутом шаре пространства L∞(∆), а так как по теореме Алаоглу такой шар есть компакт в слабой-* топологии, то наше U есть предкомпакт в слабой-* топологии. (Напомним, что это топология сходимости на каждом элементе пространства L1(∆), см. КФ.)
Слабая-* топология в любом шаре пространства, сопряженном к сепарабельному (как у нас: L1 = L∞), метризуема, и поэтому сходимость в этой топологии можно рассматривать на обычных последовательностях.
Итак, множество D всех допустимых процессов (x(t), u(t)) есть предкомпакт в пространстве C(∆)×L∞(∆) относительно топологии C ×σ − произведения равномерной топологии по x и слабой-* топологии по u (т.е. относительно равномерной сходимости x и слабой-* сходимости u ).
Покажем теперь, что D замкнуто в этой топологии. Возьмем любую последо-
сл.−
вательность (xn, un) D, такую что xn = xˆ C(∆), un −→ uˆ L∞(∆), и
4
покажем, что предельная пара (ˆx, uˆ) D, т.е. что она удовлетворяет всем ограничениям задачи Е.
3) Так как множества M и S(t) замкнуты, для предельного xˆ ограничения (1.4)
и(1.5) очевидно выполнены.
4)Для проверки дифференциального уравнения (1.2) представим его в интегральной форме. Для любого t ∆ имеем
∫ t
xn(t) = xn(0) + (a(τ, xn) + B(τ, xn) un) dτ.
0
Так как xn(t) = xˆ(t), левая часть и первые два члена в правой части очевидно сходятся к соответствующим пределам. Покажем, что t ∆
∫ t ∫ t
B(τ, xn) un dτ → B(τ, xˆ) uˆ dτ.
0 0
Разность этих интегралов представим в виде
∫ t ∫ t
[B(τ, xn) un − B(τ, xˆ) un ] dτ + [B(τ, xˆ) un − B(τ, xˆ) uˆ ] dτ.
0 0
Первый интеграл стремится к нулю, так как в силу непрерывности функции B его подинтегральное выражение равномерно стремится к нулю, а второй стремится к нулю
сл.−
так как un −→ u,ˆ а функция B(τ, xˆ(τ)) ограничена и следовательно, принадлежит
L1(∆).
Итак, для предельной пары выполнено равенство
∫ t
xˆ(t) = xˆ(0) + (a(τ, xˆ) + B(τ, xˆ) uˆ) dτ, t ∆.
0
Отсюда следует, что функция xˆ(t) абсолютно непрерывна, и для пары (ˆx, uˆ) почти всюду на ∆ выполнено уравнение (1.2).
5) Проверим слабую-* замкнутость множества управлений U. Так как исходное множество U IRr − выпуклый компакт, он есть пересечение некоторого семейства
замкнутых полупространств (p, u) 6 α, где p IRr, |
α IR, и пара (p, α) |
пробегает |
|||||
некоторое множество |
F IRr+1. Ясно, что достаточно рассматривать (p, α) из лю- |
||||||
бого плотного подмножества в F, а в качестве такового (в силу сепарабельности IRr) |
|||||||
можно взять некоторое счетное множество (pi, αi) F, |
i = 1, 2, . . . . Таким образом, |
||||||
U есть пересечение счетного семейства полупространств Ui = {u IRr : |
(p, u) 6 |
||||||
αi}, i = 1, 2, . . . . |
Введем соответствующие множества функций |
|
|||||
|
Ui |
= {u L∞(∆) : |
u(t) Ui |
п.в. на ∆}, |
|
||
и покажем, что |
U = |
i Ui . Включение |
здесь очевидно, надо установить лишь |
||||
включение . |
Пусть∩u Ui |
для всех |
i = 1, 2, . . . . |
Это означает, что |
i име- |
||
ется множество полной меры |
Ei ∆, |
на котором |
u(t) Ui . В силу счетной |
аддитивности меры Лебега множество |
∩i |
E |
i |
также имеет полную меру, и на нем |
|||||
u(t) |
|
∩ |
i Ui = U, и значит, u |
U |
. |
|
|
||
|
|
|
|
|
|
|
5
Теперь достаточно показать, что каждое множество Ui слабо-* замкнуто. Это вытекает из следующего простого утверждения.
Лемма 2. Пусть дана последовательность скалярных функций vn(t) из пространства L∞(∆), слабо-* сходящихся к функции vˆ(t). Пусть каждая vn(t) 6 0 почти всюду на ∆. Тогда и vˆ(t) 6 0 почти всюду на ∆.
Доказательство. |
Допустим, это не так, т.е. vˆ(t) > 0 |
на некотором множестве |
|||||
E положительной меры. Тогда для характеристической функции l(t) множества |
E |
||||||
в силу слабой-* сходимости должно выполняться |
|
|
|
||||
|
∫0T l(t) vn(t) dt |
→ ∫0T l(t) vˆ(t) dt. |
|
|
|||
Но интегралы слева |
6 0, а справа стоит |
E vˆ(t) dt > |
0 |
как интеграл от строго |
|||
положительной функции по множеству |
положительной меры. Противоречие. |
2 |
|||||
|
∫ |
|
|
|
|
||
Применяя эту лемму для каждого i |
|
к функциям |
|
|
|
||
vn(t) = (pi, un(t)) − αi |
|
сл.− |
vˆ(t) = (pi, uˆ(t)) − αi , |
|
|||
|
−→ |
|
|||||
получаем слабую-* замкнутость каждого множества Ui |
и тем самым слабую-* за- |
||||||
мкнутость множества |
U. |
|
|
|
|
|
|
6) Покажем теперь, что функционал |
J : C × L∞ → IR |
|
полунепрерывен снизу на |
||||
D относительно введенной сходимости. Для этого рассмотрим сначала более простой |
|||||||
функционал I : L∞(∆) → IR, |
∫0T Φ(t, u) dt, |
|
|
|
|||
|
I(u) = |
|
|
|
где функция Φ непрерывна по (t, u) ∆ × U и выпукла по u.
Теорема 2. I полунепрерывен снизу на U относительно слабой-* сходимости,
сл.−
т.е. если un −→ u,ˆ то
lim I(un) > I(ˆu).
n
Здесь нам потребуются следующие два факта.
Лемма 3. Пусть un U и ||un − uˆ||1 → 0. Тогда I(un) → I(ˆu), т.е. I непрерывен на U относительно сходимости по норме L1 .
Доказательство. Из сходимости un(t) → uˆ(t) по норме L1 вытекает сходимость по мере: δ > 0 mes {t : |un(t) − uˆ(t)| > δ} → 0. Покажем, что тогда и Φ(t, un(t)) сходится по мере к Φ(t, uˆ(t)), т.е. ε > 0
mes {t : |Φ(t, un(t)) − Φ(t, uˆ(t))| > ε} → 0.
Из непрерывности Φ неравенства |u′ − u′′| < δ данных ε, δ
по (t, u) вытекает, что ε > 0 δ > 0 |
такое, что из |
следует, что t |Φ(t, u′) − Φ(t, u′′)| < ε. |
Поэтому для |
6
{t : |Φ(t, un(t)) − Φ(t, uˆ(t))| > ε} {t : |un(t) − uˆ(t)| > δ}.
Так как мера правого множества стремится к нулю, то и мера левого также стремится к нулю.
Так как функции un(t) равномерно ограничены, то и Φ(t, un(t)) равномерно ограничены (опять в силу непрерывности Φ), а тогда из их сходимости по мере к Φ(t, uˆ(t)) вытекает и сходимость интегралов от этих функций. Лемма доказана. 2
Теорема 3 (Мазур). Пусть в нормированном пространстве V дана последовательность un , слабо сходящихся к uˆ (т.е. сходящихся на каждом линейном функционале l V ). Тогда существует последовательность конечных выпуклых комбинаций
элементов |
un , сходящихся к uˆ |
по норме, т.е. n |
существует элемент |
|
mn |
|
mn |
|
∑ |
где αn(i) > 0, |
∑i |
|
vn = αn(i) ui , |
αn(i) = 1, |
|
|
i=1 |
|
=1 |
такой что |
vn = uˆ. |
|
|
Доказательство. Пусть Ω = {un , n = 1, 2 . . . .}, и пусть Q есть его выпуклая замкнутая оболочка (т.е. замыкание множества всех конечных выпуклых комбинаций элементов из Ω ). Теорема утверждает, что uˆ Q.
Действительно, если это не так, то по теореме Хана–Банаха найдется линейный функционал l V , строго отделяющий точку uˆ от Q : при некотором δ > 0
|
|
|
|
|
|
|
(l, uˆ) |
> (l, Q) + δ. |
|
|
|
|
|
|
|
Но это противоречит тому, что un Q |
и |
(l, un) → (l, uˆ). |
|
|
|
2 |
|||||||||
Теперь мы можем дать |
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
сл.− |
Доказательство теоремы 2. Пусть последовательность un L∞, un −→ u,ˆ |
|||||||||||||||
т.е. сходится относительно функционалов из L1 . Тогда (внимание!) можно считать, |
|||||||||||||||
что un L1 |
|
сл. |
относительно функционалов из |
L∞ (ибо |
L∞ L1 ). |
||||||||||
и un −→ uˆ |
|||||||||||||||
Положим |
A = |
lim I(un). Нам надо показать, что |
I(ˆu) |
6 A. |
Без нарушения |
||||||||||
общности считаем, что |
I(un) → A. Возьмем любое |
ε > 0. |
Тогда |
N такое, что |
|||||||||||
n > N имеем I(un) < (i) |
|
По теореме Мазура |
|
n |
> |
N |
найдется выпуклая |
||||||||
|
|
|
|
|
A + ε. |
|
|
|
|
|
|
|
|||
комбинация |
vn = |
|
mn |
αn |
ui такая что |
||vn − uˆ||1 → 0. |
|
|
|
|
|
||||
|
i=N |
|
|
|
|
|
|||||||||
В силу |
выпуклости функции Φ по u имеем |
|
|
|
|
|
|
||||||||
|
∑ |
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
mn |
|
|
mn |
|
|
|
|
|
|
|
|
|
|
|
|
∑ |
|
|
i∑ |
|
|
|
|
|
|
|
|
|
I(vn) 6 |
αn(i) I(ui) < |
αn(i)(A + ε) = A + ε. |
|
||||||||||
|
|
|
|
|
i=N |
|
|
=N |
|
|
|
|
|
|
|
По лемме 3 |
I(vn) → I(ˆu), |
и следовательно, I(ˆu) 6 A + ε. Это выполнено ε > 0. |
|||||||||||||
Отсюда I(ˆu) 6 A, |
ч.т.д. |
|
|
|
|
|
|
|
|
|
2 |
||||
Из теоремы 2 легко вытекает слабая полунепрерывность снизу функционала |
|||||||||||||||
T |
|
|
|
Пусть |
xn = x,ˆ |
|
сл. |
|
|
|
|
|
|
||
J = ∫0 L(t, x, u) dt. |
|
un |
−→− uˆ. Тогда |
|
|
|
|
|
J(xn, un) = (J(xn, un) − J(ˆx, un)) + J(ˆx, un).
7
Скобка справа стремится к нулю, ибо |L(t, xn(t), un(t)) − L(t, xˆ(t), un(t))| = 0 в
силу равномерной непрерывности |
L. А последний член есть I(un) |
для функции |
|
Φ(t, u) = L(t, xˆ(t), u). По теореме 2 |
lim J(ˆx, un) > J(ˆx, uˆ), |
а тогда и |
lim J(xn, un) > |
J(ˆx, uˆ). Добавление концевого функционала φ(x(0), x(T )) |
ничего не меняет, так как |
||
от просто непрерывен относительно равномерной сходимости x . |
|
Итак, мы показали, что в некоторой топологии множество всех допустимых про-
цессов D есть компакт, а функционал J |
полунепрерывен снизу. По теореме Вейер- |
|
штрасса J достигает своего минимума на |
D. Теорема 1 доказана. |
2 |
Некоторые обобщения
Рассмотренная задача Е, конечно, не охватывает всех возможных типов задач оптимального управления. Укажем некоторые обобщения этой задачи, в которых также можно установить существование решения. Точные формулировки и тем более доказательства мы здесь не приводим.
а) Мы предполагали, что функции a(t, x), B(t, x), L(t, x, u) непрерывны по совокупности своих переменных, в том числе по t. Внимательно прослеживая доказательство теоремы 1, нетрудно заметить, что от непрерывности по t можно отказаться, оставив лишь измеримость по t и потребовав, чтобы на любом ограниченном множестве значений x (или, соответственно, x, u ) все эти функции были равностепенно относительно t непрерывны по x (или x, u ), т.е. чтобы они имели общий t ∆ модуль непрерывности по x (или x, u ).
б) Множество U IRr может зависеть от t, т.е. ограничение на управление может иметь вид u(t) U(t). Здесь надо требовать, чтобы для п.в. t ∆ множество U(t) было выпуклым компактом и содержалось в некотором шаре, не зависящем от t, и кроме того, чтобы многозначное отображение t 7→U(t) было измеримым. (Одно из
эквивалентных определений: |
для любого открытого множества G IRr множество |
{t : U(t) ∩ G ̸= Ø} измеримо.) |
|
Для доказательства слабой-* замкнутости соответствующего множества функций |
|
U здесь надо использовать теорему об измеримом выборе (см. ИТ). |
|
в) Множество U может зависеть также и от x, и тогда мы фактически име- |
|
ем смешанное ограничение |
u(t) U(t, x(t)). Здесь надо требовать, чтобы множе- |
ство U(t, x) было выпуклым компактом, и чтобы многозначное отображение (t, x) 7→ U(t, x) имело замкнутый график (это эквивалентно его полунепрерывности сверху). Доказательство того, что предельная пара (ˆx, uˆ) удовлетворяет этому ограничению, т.е. uˆ(t) U(t, xˆ(t)), опирается на т.н. Q− свойство Чезари, состоящее в следую-
щем. Для любых (t, x) и любого |
ε > 0 |
пусть |
Q"(t, x) есть замыкание выпук- |
лой оболочки объединения U(t′, x′) |
по всем |
(t′, x′) |
из ε− окрестности (t, x). Тогда |
∩">0 Q"(t, x) = U(t, x). |
|
|
|
8
г) Управляемая система x˙ = f(t, x, u) может быть нелинейной по u. |
Тогда на- |
до требовать, чтобы ограниченным было множество возможных скоростей |
f(t, x, U) |
этой системы, а выпуклым и замкнутым было множество скоростей расширенной системы:
y˙ = L(t, x, u) + v, x˙ = f(t, x, u), u U, v > 0 .
Выпуклость самого множества U не играет уже роли. Здесь надо рассматривать равномерную сходимость траекторий (y(t), x(t)) в пространстве C[0, T ]×Cn[0, T ], а для представления предельной траектории в виде решения указанной системы при некоторых управлениях u(t), v(t) применять один из вариантов теоремы об измеримом выборе, например, лемму Филиппова о включении:
пусть функция φ(t, u) измерима по t и непрерывна по u U. Тогда любая
измеримая функция |
v(t) φ(t, U) |
может быть реализована с помощью некоторой |
измеримой функции |
u(t) U : |
v(t) = φ(t, u(t)) . |
д) Задачи на нефиксированном отрезке времени t [t0, t1] можно сводить на фиксированный отрезок с помощью введения нового времени τ [0, 1] следующим образом:
dt |
= z, |
dz |
= 0, |
dx |
= z [a(t, x) + B(t, x) u]. |
|
dτ |
dτ |
dτ |
||||
|
|
|
Обратим внимание, что здесь z − фазовая переменная, а не управление, как было раньше (при выводе ПМ). При этом новая управляемая система остается линейной по управлению. Для существования решения исходной задачи надо требовать, чтобы нашлась минимизирующая последовательность, на которой t0 и t1 ограничены.
Тогда после сведения ее на фиксированный отрезок времени получим ограниченность z, и при выполнении тех же условий А1—А6 решение будет существовать.
е) Пусть в задаче Е множество U − компакт, но не выпуклый. Здесь множе-
ство управляющих функций U |
уже не будет слабо-* замкнутым. Можно показать, |
||||||||
что его слабое-* замыкание состоит из функций |
u(t) co U. (Покажите!) |
Обозна- |
|||||||
чим через |
E задачу с этим расширенным множеством управлений. Так как |
co U − |
|||||||
выпуклый |
компакт, по доказанной теореме 1 минимум в задаче |
E существует и до- |
|||||||
e |
(ˆx, uˆ), |
|
uˆ(t) |
|
co U. |
|
связан с инфимумом |
||
стигается на некотором процессе |
|
где |
|
|
|
Как он |
e |
|
в исходной задаче Е ? Рассмотрим случай, когда управляемая система полностью линейна: x˙ = A(t)x+B(t)u, а фазовое ограничение (1.5) отсутствует. Поскольку данное управление uˆ(t) есть слабый-* предел некоторых управлений un(t) U, то нетрудно показать, что соответствующие фазовые компоненты равномерно сходятся (при сходимости их начальных условий): xn(t) = xˆ(t), и более того, в силу линейности системы последовательность un(t) U может быть выбрана таким образом, чтобы концы xn просто совпадали с концами данной траектории xˆ. Тогда процессы (xn, un) допустимы в задаче Е, lim J(xn, un) = J(ˆx, uˆ), поэтому инфимум в задаче
e
Е равен минимуму в задаче E.
Процесс (ˆx, uˆ), вообще говоря, не является допустимым в задаче Е; он называется скользящим режимом, поскольку реализуется как предел последовательности
9
процессов, у которых управление "очень часто" переключается ("скользит") между точками множества U, принимая в пределе значение uˆ(t) co U.
Аналогичное явление "овыпукления" возникает также в случае, когда подинтегральная функция целевого функционала L(t, x, u) не выпукла по u (как в примере Больца). Если управляемая система линейна, множество U − выпукло, и опять фазовое ограничение (1.5) отсутствует, то справедлива классическая теорема Боголюбо-
e
ва, утверждающая, что инфимум в исходной задаче Е равен инфимуму в задаче E, в которой функцию L(t, x, u) надо замененить на ее овыпукление по u, т.е. взять
e
функцию L(t, x, u), которая при любых (t, x) есть наибольшая выпуклая по u миноранта функции L(t, x, u) .
ж) Наконец, множество U может быть неограниченным, например, U = IRr. Здесь надо добиться того, чтобы, тем не менее, на минимизирующей последовательности норма ||un||p при некотором p > 1 была равномерно ограничена, и тогда можно считать, что множество управлений u(·) лежит в некотором шаре пространства Lp(∆), и следовательно, компактно в слабой топологии. Для этого на функцию L(t, x, u) накладываются условия достаточно быстрого роста по u.
Такой случай рассматривался еще в КВИ, где была установлена теорема Тонелли и ее различные варианты (см. ИТ, ОПУ).
Литература
[АФ] А.Ф. Филиппов. О некоторых вопросах теории оптимального регулирования. Вестник МГУ, сер. матем., мех., астрон., физ., хим., 1959, №2, с. 25–32.
[ИТ] А.Д. Иоффе, В.М. Тихомиров. Теория экстремальных задач. М., Наука, 1974.
[АТФ] В.М. Алексеев, В.М. Тихомиров, С.В. Фомин. Оптимальное управление. М., Наука, 1979, Физматлит, 2006.
[КФ] А.Н. Колмогоров, С.В. Фомин. Элементы теории функций и функционального анализа. М.: Наука, 1968.
[ОПУ] Оптимальное управление. Коллективная монография кафедры ОПУ (под ред. Н.П. Осмоловского и В.М. Тихомирова), М., МЦНМО, 2008.
10