Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

FIZTEX-exist

.pdf
Скачиваний:
18
Добавлен:
03.06.2015
Размер:
103.26 Кб
Скачать

Курс лекций А.В. Дмитрука "Математическая теория оптимального управления"

ФИВТ, весна 2013 года

Существование решения в задачах на экстремум

Приведем два классических примера, в которых решение не существует.

Пример 1 (К. Вейерштрасс).

 

 

 

J = 0

1 t2u2 dt → min,

x˙ = u,

x(0) = 0,

x(1) = 1.

Пусть решение ищется в классе u L[0, 1]. Ясно, что на любой допустимой функции J(u) > 0. Покажем, что inf J = 0. Действительно, ε > 0 положим u"(t) = 1на [0, ε], и равной нулю вне этого отрезка. Тогда

J(u") = 0

"

1

 

1

 

t2

dt =

ε → 0.

 

ε2

3

Нетрудно убедиться, что и в любом другом классе интегрируемых функций u, со-

держащем L[0, 1] (или только C[0, 1]),

решения не существует.

 

Пример 2 (О. Больца).

 

 

 

J =

0

1

(x2 + (u2 1)2) dt → min,

x˙ = u,

x(0) = 0,

x(1) = 0.

Здесь опять на любой допустимой функции J(u) > 0. Действительно, если J(u) = 0, то x(t) 0, почти всюду x˙ (t) = u(t) = 0, но тогда (u2 1)2 = 1, и J(u) > 0, противоречие.

Покажем, что inf J = 0. Для любого n положим un(t) = sign sin (2πn t). Тогда |un(t)| ≡ 1, а |xn(t)| 6 const n1 0 при n → ∞, поэтому J(un) 0.

Еще проще этот эффект проявляется в задачах оптимального управления (так как в них есть возможность выбора ограничения на множество допустимых управлений).

Пример 3 (задача оптимального управления).

1

J = x2 dt → min, x˙ = u, x(0) = x(1) = 0, u U = {−1, +1}.

0

Здесь опять на любой допустимой функции J(u) > 0, а последовательность un(t) = sign sin (2πn t) дает inf J = 0.

Возникает естественный вопрос: при каких условиях на задачу можно гарантировать, что решение (т.е. точка глобального минимума) в ней существует? Ответ на

1

него дается теоремами существования. Для их формулировки потребуется следующее понятие.

Полунепрерывные снизу функции. Пусть X − топологическое пространство. Функция f : X → IR называется полунепрерывной снизу в точке x0 , если

f(x0) 6 lim f(x),

(0.1)

x7→x0

 

и полунепрерывной снизу на X, если это неравенство верно для всех x0 X .

Лемма 1. Пусть f : X → IR произвольная функция. Тогда следующие три

свойства эквивалентны:

 

а)

f полунепрерывна снизу на X ;

X × IR ;

б)

её надграфик epi f = {(x, z) X × IR : z > f(x)} замкнут в

в)

µ IR нижнее лебегово множество L (f) = {x | f(x) ≤ µ}

замкнуто в X .

Теорема Вейерштрасса. Пусть пространство X компактно, a функция f : X → IR полунепрерывна снизу на X. Тогда f достигает на X своего минимума.

Доказательство можно провести двумя способами. Обозначим A = inf f. (Априори не исключен случай A = −∞. )

1) Возьмем любую минимизирующую последовательность xn X, т.е. такую, для которой f(xn) → A. Поскольку X − компакт (но, вообще говоря, без первой аксиомы счетности), из этой последовательности можно выбрать поднаправленность (т.е. обобщенную последовательность) xn , параметризованную индексом α из некоторого направленного множества, сходящуюся к некоторой точке xˆ X. Для нее попрежнему f(xn ) → A. В силу (0.1) имеем fx) 6 A, но так как знак < здесь быть не может, получаем fx) = A.

(Если X обладает первой аксиомой счетности (напр. метрическое), то вместо поднаправленности можно брать обычную подпоследовательность; в этом случае доказательство очень прозрачно.)

2) Для любого µ > A множество подуровня L (f) очевидно непусто и замкнуто. Семейство этих множеств центрировано, так как любое конечное число таких множеств имеет непустое пересечение (надо взять минимальное из данных µ, тогда соответствующее непустое L (f) будет содержаться в каждом множестве из данного набора). Поскольку X − компакт, то и все эти множества имеют непустое пересече-

ние, т.е. найдется точка x,ˆ принадлежащая всем им:

fx) 6 µ для любого µ > A.

Но тогда fx) 6 A, и значит fx) = A, и A > −∞.

2

Практически все теоремы существования решения в задачах на экстремум так или иначе основаны на теореме Вейерштрасса.

Обратим внимание на следующее обстоятельство. Пусть мы ищем минимум функции f на некотором множестве X. На этом множестве может не быть никакой топологии, и мы можем задавать ее в определенном смысле произвольно. При этом чем сильнее будет топология (т.е. чем больше запас открытых и замкнутых подмножеств в X ), тем, с одной стороны,

2

больше "шансов" для функции f быть полунепрерывной снизу на X, но с другой стороны, меньше "шансов" для множества X быть компактом. Таким образом, полунепрерывность снизу функции f и компактность X диктуют противоположные требования к топологии (первое требует ее усиления, а второе ослабления). Если удается найти топологию, удовлетворяющую обоим требованиям, то выполнены условия теоремы Вейерштрасса, и тогда минимум существует.

Задача оптимального управления, выпуклая по управлению

На фиксированном отрезке времени

∆ = [0, T ] рассмотрим следующую задачу Е:

J = 0T L(t, x, u) dt + φ(x(0), x(T )) min,

(1.1)

x˙ = f(t, x, u) = a(t, x) + B(t, x) u,

(1.2)

u(t) U

для п.в. t ,

(1.3)

(x(0), x(T )) M,

(1.4)

x(t) S(t)

t .

(1.5)

Здесь, как обычно, x : ∆ IRn

абсолютно непрерывная, а

u : ∆ IRr

измеримая ограниченная функции.

 

 

Предположения:

 

 

 

 

 

А1) функция L(t, x, u) непрерывна на

× IRn × U и выпукла по u ,

А2) вектор-функция

a(t, x) и матрица

B(t, x)

(соответствующих размерностей)

непрерывны на ∆ × IRn,

концевая функция φ(x0, xT ) непрерывна на IR2n,

А3) множество M IR2n

замкнуто (как правило, оно задается некоторым набо-

ром ограничений типа равенства

η(x(0), x(T )) = 0

и неравенства ζ(x(0), x(T )) 6 0

с непрерывными функциями

η и

ζ ),

 

 

А4) при каждом t

множество S(t) IRn

замкнуто, и хотя бы при одном

t0 ∆ оно ограничено: |S(t0)| 6 c0,

А5) множество U IRr есть выпуклый компакт,

А6) тройка (f, S, U) удовлетворяет условию Филиппова: существует такое число

K, что t , x S(t), u U выполнена оценка

 

|(x, f(t, x, u))| 6 K (|x|2 + 1).

(1.6)

Можно ограничиться и более слабой оценкой

 

sign (t − t0) (x, f(t, x, u)) 6 K (|x|2 + 1).

(1.7)

(В случае, когда S(t) равномерно ограничено, слева в (1.6) стоит ограниченная величина, поэтому условие Филиппова автоматически выполнено.)

3

При этих предположениях верна следующая теорема существования (некоторая модификация теоремы, доказанной А.Ф. Филипповым в 1959 году ):

Теорема 1. Пусть в задаче Е существует хотя бы один допустимый процесс. Тогда существует и (глобально) оптимальный процесс, т.е. функционал J достигает своего минимума.

Доказательство состоит из нескольких этапов. Обозначим через D множество всех допустимых процессов (x(t), u(t)). Мы покажем, что D есть компакт в некоторой топологии, а J полунепрерывен снизу в этой топологии. Будем рассматривать допустимые процессы как элементы пространства C(∆) × L(∆).

1) Покажем, что множество всех допустимых траекторий x(t) равномерно ограничено в пространстве C(∆). Обозначим z = |x|2+1. Тогда в силу (1.2) и (1.6) имеем

|z˙| = 2 |(x, f(t, x, u))| 6 2Kz, и так как в силу А4 |z(t0)| 6 (c20 + 1) , то t |z(t)| 6 |z(t0)| e2K(t−t0) 6 (c20 + 1) e2KT ,

и тогда |x(t)| 6 const = K0 . (При выполнении лишь оценки (1.7) надо отдельно рассмотреть случаи t < t0 и t > t0 .) Отсюда, из равномерной ограниченности значений u(t) и непрерывности f вытекает в силу (1.2), что и |x˙ (t)| 6 const = K1 .

Таким образом, множество всех допустимых траекторий x(t), рассматриваемое в пространстве C(∆), равномерно ограничено и равномерно липшицево (а следовательно, равностепенно непрерывно). По теореме Асколи–Арцела это предкомпакт в

C(∆).

2)Рассмотрим теперь множество всех допустимых управляющих функций

U = {u L(∆) : u(t) U п.в. на ∆}.

Поскольку U ограничено, то U содержится в некотором замкнутом шаре пространства L(∆), а так как по теореме Алаоглу такой шар есть компакт в слабой-* топологии, то наше U есть предкомпакт в слабой-* топологии. (Напомним, что это топология сходимости на каждом элементе пространства L1(∆), см. КФ.)

Слабая-* топология в любом шаре пространства, сопряженном к сепарабельному (как у нас: L1 = L), метризуема, и поэтому сходимость в этой топологии можно рассматривать на обычных последовательностях.

Итак, множество D всех допустимых процессов (x(t), u(t)) есть предкомпакт в пространстве C(∆)×L(∆) относительно топологии C ×σ − произведения равномерной топологии по x и слабой-* топологии по u (т.е. относительно равномерной сходимости x и слабой-* сходимости u ).

Покажем теперь, что D замкнуто в этой топологии. Возьмем любую последо-

сл.

вательность (xn, un) D, такую что xn = xˆ C(∆), un −→ uˆ L(∆), и

4

покажем, что предельная пара (ˆx, uˆ) D, т.е. что она удовлетворяет всем ограничениям задачи Е.

3) Так как множества M и S(t) замкнуты, для предельного xˆ ограничения (1.4)

и(1.5) очевидно выполнены.

4)Для проверки дифференциального уравнения (1.2) представим его в интегральной форме. Для любого t ∆ имеем

t

xn(t) = xn(0) + (a(τ, xn) + B(τ, xn) un) dτ.

0

Так как xn(t) = xˆ(t), левая часть и первые два члена в правой части очевидно сходятся к соответствующим пределам. Покажем, что t

t t

B(τ, xn) un dτ → B(τ, xˆ) uˆ dτ.

0 0

Разность этих интегралов представим в виде

t t

[B(τ, xn) un − B(τ, xˆ) un ] + [B(τ, xˆ) un − B(τ, xˆ) uˆ ] dτ.

0 0

Первый интеграл стремится к нулю, так как в силу непрерывности функции B его подинтегральное выражение равномерно стремится к нулю, а второй стремится к нулю

сл.

так как un −→ u,ˆ а функция B(τ, xˆ(τ)) ограничена и следовательно, принадлежит

L1(∆).

Итак, для предельной пары выполнено равенство

t

xˆ(t) = xˆ(0) + (a(τ, xˆ) + B(τ, xˆ) uˆ) dτ, t .

0

Отсюда следует, что функция xˆ(t) абсолютно непрерывна, и для пары (ˆx, uˆ) почти всюду на ∆ выполнено уравнение (1.2).

5) Проверим слабую-* замкнутость множества управлений U. Так как исходное множество U IRr выпуклый компакт, он есть пересечение некоторого семейства

замкнутых полупространств (p, u) 6 α, где p IRr,

α IR, и пара (p, α)

пробегает

некоторое множество

F IRr+1. Ясно, что достаточно рассматривать (p, α) из лю-

бого плотного подмножества в F, а в качестве такового (в силу сепарабельности IRr)

можно взять некоторое счетное множество (pi, αi) F,

i = 1, 2, . . . . Таким образом,

U есть пересечение счетного семейства полупространств Ui = {u IRr :

(p, u) 6

αi}, i = 1, 2, . . . .

Введем соответствующие множества функций

 

 

Ui

= {u L(∆) :

u(t) Ui

п.в. на ∆},

 

и покажем, что

U =

i Ui . Включение

здесь очевидно, надо установить лишь

включение .

Пустьu Ui

для всех

i = 1, 2, . . . .

Это означает, что

i име-

ется множество полной меры

Ei ,

на котором

u(t) Ui . В силу счетной

аддитивности меры Лебега множество

i

E

i

также имеет полную меру, и на нем

u(t)

 

i Ui = U, и значит, u

U

.

 

 

 

 

 

 

 

 

 

5

Теперь достаточно показать, что каждое множество Ui слабо-* замкнуто. Это вытекает из следующего простого утверждения.

Лемма 2. Пусть дана последовательность скалярных функций vn(t) из пространства L(∆), слабо-* сходящихся к функции vˆ(t). Пусть каждая vn(t) 6 0 почти всюду на ∆. Тогда и vˆ(t) 6 0 почти всюду на ∆.

Доказательство.

Допустим, это не так, т.е. vˆ(t) > 0

на некотором множестве

E положительной меры. Тогда для характеристической функции l(t) множества

E

в силу слабой-* сходимости должно выполняться

 

 

 

 

0T l(t) vn(t) dt

0T l(t) vˆ(t) dt.

 

 

Но интегралы слева

6 0, а справа стоит

E vˆ(t) dt >

0

как интеграл от строго

положительной функции по множеству

положительной меры. Противоречие.

2

 

 

 

 

 

Применяя эту лемму для каждого i

 

к функциям

 

 

 

vn(t) = (pi, un(t)) − αi

 

сл.

vˆ(t) = (pi, uˆ(t)) − αi ,

 

 

−→

 

получаем слабую-* замкнутость каждого множества Ui

и тем самым слабую-* за-

мкнутость множества

U.

 

 

 

 

 

 

6) Покажем теперь, что функционал

J : C × LIR

 

полунепрерывен снизу на

D относительно введенной сходимости. Для этого рассмотрим сначала более простой

функционал I : L(∆) IR,

0T Φ(t, u) dt,

 

 

 

 

I(u) =

 

 

 

где функция Φ непрерывна по (t, u) ∆ × U и выпукла по u.

Теорема 2. I полунепрерывен снизу на U относительно слабой-* сходимости,

сл.

т.е. если un −→ u,ˆ то

lim I(un) > Iu).

n

Здесь нам потребуются следующие два факта.

Лемма 3. Пусть un U и ||un − uˆ||1 0. Тогда I(un) → Iu), т.е. I непрерывен на U относительно сходимости по норме L1 .

Доказательство. Из сходимости un(t) → uˆ(t) по норме L1 вытекает сходимость по мере: δ > 0 mes {t : |un(t) − uˆ(t)| > δ} → 0. Покажем, что тогда и Φ(t, un(t)) сходится по мере к Φ(t, uˆ(t)), т.е. ε > 0

mes {t : |Φ(t, un(t)) Φ(t, uˆ(t))| > ε} → 0.

Из непрерывности Φ неравенства |u− u′′| < δ данных ε, δ

по (t, u) вытекает, что ε > 0 δ > 0

такое, что из

следует, что t |Φ(t, u) Φ(t, u′′)| < ε.

Поэтому для

6

{t : |Φ(t, un(t)) Φ(t, uˆ(t))| > ε} {t : |un(t) − uˆ(t)| > δ}.

Так как мера правого множества стремится к нулю, то и мера левого также стремится к нулю.

Так как функции un(t) равномерно ограничены, то и Φ(t, un(t)) равномерно ограничены (опять в силу непрерывности Φ), а тогда из их сходимости по мере к Φ(t, uˆ(t)) вытекает и сходимость интегралов от этих функций. Лемма доказана. 2

Теорема 3 (Мазур). Пусть в нормированном пространстве V дана последовательность un , слабо сходящихся к uˆ (т.е. сходящихся на каждом линейном функционале l V ). Тогда существует последовательность конечных выпуклых комбинаций

элементов

un , сходящихся к uˆ

по норме, т.е. n

существует элемент

 

mn

 

mn

 

где αn(i) > 0,

i

 

vn = αn(i) ui ,

αn(i) = 1,

 

i=1

 

=1

такой что

vn = uˆ.

 

 

Доказательство. Пусть Ω = {un , n = 1, 2 . . . .}, и пусть Q есть его выпуклая замкнутая оболочка (т.е. замыкание множества всех конечных выпуклых комбинаций элементов из Ω ). Теорема утверждает, что uˆ Q.

Действительно, если это не так, то по теореме Хана–Банаха найдется линейный функционал l V , строго отделяющий точку uˆ от Q : при некотором δ > 0

 

 

 

 

 

 

 

(l, uˆ)

> (l, Q) + δ.

 

 

 

 

 

 

Но это противоречит тому, что un Q

и

(l, un) (l, uˆ).

 

 

 

2

Теперь мы можем дать

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

сл.

Доказательство теоремы 2. Пусть последовательность un L, un −→ u,ˆ

т.е. сходится относительно функционалов из L1 . Тогда (внимание!) можно считать,

что un L1

 

сл.

относительно функционалов из

L(ибо

LL1 ).

и un −→ uˆ

Положим

A =

lim I(un). Нам надо показать, что

Iu)

6 A.

Без нарушения

общности считаем, что

I(un) → A. Возьмем любое

ε > 0.

Тогда

N такое, что

n > N имеем I(un) < (i)

 

По теореме Мазура

 

n

>

N

найдется выпуклая

 

 

 

 

 

A + ε.

 

 

 

 

 

 

 

комбинация

vn =

 

mn

αn

ui такая что

||vn − uˆ||1 0.

 

 

 

 

 

 

i=N

 

 

 

 

 

В силу

выпуклости функции Φ по u имеем

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

mn

 

 

mn

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

I(vn) 6

αn(i) I(ui) <

αn(i)(A + ε) = A + ε.

 

 

 

 

 

 

i=N

 

 

=N

 

 

 

 

 

 

По лемме 3

I(vn) → Iu),

и следовательно, Iu) 6 A + ε. Это выполнено ε > 0.

Отсюда Iu) 6 A,

ч.т.д.

 

 

 

 

 

 

 

 

 

2

Из теоремы 2 легко вытекает слабая полунепрерывность снизу функционала

T

 

 

 

Пусть

xn = x,ˆ

 

сл.

 

 

 

 

 

 

J = 0 L(t, x, u) dt.

 

un

−→uˆ. Тогда

 

 

 

 

 

J(xn, un) = (J(xn, un) − Jx, un)) + Jx, un).

7

Скобка справа стремится к нулю, ибо |L(t, xn(t), un(t)) − L(t, xˆ(t), un(t))| = 0 в

силу равномерной непрерывности

L. А последний член есть I(un)

для функции

Φ(t, u) = L(t, xˆ(t), u). По теореме 2

lim Jx, un) > Jx, uˆ),

а тогда и

lim J(xn, un) >

Jx, uˆ). Добавление концевого функционала φ(x(0), x(T ))

ничего не меняет, так как

от просто непрерывен относительно равномерной сходимости x .

 

Итак, мы показали, что в некоторой топологии множество всех допустимых про-

цессов D есть компакт, а функционал J

полунепрерывен снизу. По теореме Вейер-

штрасса J достигает своего минимума на

D. Теорема 1 доказана.

2

Некоторые обобщения

Рассмотренная задача Е, конечно, не охватывает всех возможных типов задач оптимального управления. Укажем некоторые обобщения этой задачи, в которых также можно установить существование решения. Точные формулировки и тем более доказательства мы здесь не приводим.

а) Мы предполагали, что функции a(t, x), B(t, x), L(t, x, u) непрерывны по совокупности своих переменных, в том числе по t. Внимательно прослеживая доказательство теоремы 1, нетрудно заметить, что от непрерывности по t можно отказаться, оставив лишь измеримость по t и потребовав, чтобы на любом ограниченном множестве значений x (или, соответственно, x, u ) все эти функции были равностепенно относительно t непрерывны по x (или x, u ), т.е. чтобы они имели общий t ∆ модуль непрерывности по x (или x, u ).

б) Множество U IRr может зависеть от t, т.е. ограничение на управление может иметь вид u(t) U(t). Здесь надо требовать, чтобы для п.в. t ∆ множество U(t) было выпуклым компактом и содержалось в некотором шаре, не зависящем от t, и кроме того, чтобы многозначное отображение t 7→U(t) было измеримым. (Одно из

эквивалентных определений:

для любого открытого множества G IRr множество

{t : U(t) ∩ G ̸= Ø} измеримо.)

Для доказательства слабой-* замкнутости соответствующего множества функций

U здесь надо использовать теорему об измеримом выборе (см. ИТ).

в) Множество U может зависеть также и от x, и тогда мы фактически име-

ем смешанное ограничение

u(t) U(t, x(t)). Здесь надо требовать, чтобы множе-

ство U(t, x) было выпуклым компактом, и чтобы многозначное отображение (t, x) 7→ U(t, x) имело замкнутый график (это эквивалентно его полунепрерывности сверху). Доказательство того, что предельная пара (ˆx, uˆ) удовлетворяет этому ограничению, т.е. uˆ(t) U(t, xˆ(t)), опирается на т.н. Q− свойство Чезари, состоящее в следую-

щем. Для любых (t, x) и любого

ε > 0

пусть

Q"(t, x) есть замыкание выпук-

лой оболочки объединения U(t, x)

по всем

(t, x)

из ε− окрестности (t, x). Тогда

">0 Q"(t, x) = U(t, x).

 

 

 

8

г) Управляемая система x˙ = f(t, x, u) может быть нелинейной по u.

Тогда на-

до требовать, чтобы ограниченным было множество возможных скоростей

f(t, x, U)

этой системы, а выпуклым и замкнутым было множество скоростей расширенной системы:

y˙ = L(t, x, u) + v, x˙ = f(t, x, u), u U, v > 0 .

Выпуклость самого множества U не играет уже роли. Здесь надо рассматривать равномерную сходимость траекторий (y(t), x(t)) в пространстве C[0, T ]×Cn[0, T ], а для представления предельной траектории в виде решения указанной системы при некоторых управлениях u(t), v(t) применять один из вариантов теоремы об измеримом выборе, например, лемму Филиппова о включении:

пусть функция φ(t, u) измерима по t и непрерывна по u U. Тогда любая

измеримая функция

v(t) φ(t, U)

может быть реализована с помощью некоторой

измеримой функции

u(t) U :

v(t) = φ(t, u(t)) .

д) Задачи на нефиксированном отрезке времени t [t0, t1] можно сводить на фиксированный отрезок с помощью введения нового времени τ [0, 1] следующим образом:

dt

= z,

dz

= 0,

dx

= z [a(t, x) + B(t, x) u].

 

 

 

Обратим внимание, что здесь z − фазовая переменная, а не управление, как было раньше (при выводе ПМ). При этом новая управляемая система остается линейной по управлению. Для существования решения исходной задачи надо требовать, чтобы нашлась минимизирующая последовательность, на которой t0 и t1 ограничены.

Тогда после сведения ее на фиксированный отрезок времени получим ограниченность z, и при выполнении тех же условий А1—А6 решение будет существовать.

е) Пусть в задаче Е множество U − компакт, но не выпуклый. Здесь множе-

ство управляющих функций U

уже не будет слабо-* замкнутым. Можно показать,

что его слабое-* замыкание состоит из функций

u(t) co U. (Покажите!)

Обозна-

чим через

E задачу с этим расширенным множеством управлений. Так как

co U −

выпуклый

компакт, по доказанной теореме 1 минимум в задаче

E существует и до-

e

x, uˆ),

 

uˆ(t)

 

co U.

 

связан с инфимумом

стигается на некотором процессе

 

где

 

 

 

Как он

e

 

в исходной задаче Е ? Рассмотрим случай, когда управляемая система полностью линейна: x˙ = A(t)x+B(t)u, а фазовое ограничение (1.5) отсутствует. Поскольку данное управление uˆ(t) есть слабый-* предел некоторых управлений un(t) U, то нетрудно показать, что соответствующие фазовые компоненты равномерно сходятся (при сходимости их начальных условий): xn(t) = xˆ(t), и более того, в силу линейности системы последовательность un(t) U может быть выбрана таким образом, чтобы концы xn просто совпадали с концами данной траектории xˆ. Тогда процессы (xn, un) допустимы в задаче Е, lim J(xn, un) = Jx, uˆ), поэтому инфимум в задаче

e

Е равен минимуму в задаче E.

Процесс (ˆx, uˆ), вообще говоря, не является допустимым в задаче Е; он называется скользящим режимом, поскольку реализуется как предел последовательности

9

процессов, у которых управление "очень часто" переключается ("скользит") между точками множества U, принимая в пределе значение uˆ(t) co U.

Аналогичное явление "овыпукления" возникает также в случае, когда подинтегральная функция целевого функционала L(t, x, u) не выпукла по u (как в примере Больца). Если управляемая система линейна, множество U − выпукло, и опять фазовое ограничение (1.5) отсутствует, то справедлива классическая теорема Боголюбо-

e

ва, утверждающая, что инфимум в исходной задаче Е равен инфимуму в задаче E, в которой функцию L(t, x, u) надо замененить на ее овыпукление по u, т.е. взять

e

функцию L(t, x, u), которая при любых (t, x) есть наибольшая выпуклая по u миноранта функции L(t, x, u) .

ж) Наконец, множество U может быть неограниченным, например, U = IRr. Здесь надо добиться того, чтобы, тем не менее, на минимизирующей последовательности норма ||un||p при некотором p > 1 была равномерно ограничена, и тогда можно считать, что множество управлений u(·) лежит в некотором шаре пространства Lp(∆), и следовательно, компактно в слабой топологии. Для этого на функцию L(t, x, u) накладываются условия достаточно быстрого роста по u.

Такой случай рассматривался еще в КВИ, где была установлена теорема Тонелли и ее различные варианты (см. ИТ, ОПУ).

Литература

[АФ] А.Ф. Филиппов. О некоторых вопросах теории оптимального регулирования. Вестник МГУ, сер. матем., мех., астрон., физ., хим., 1959, №2, с. 25–32.

[ИТ] А.Д. Иоффе, В.М. Тихомиров. Теория экстремальных задач. М., Наука, 1974.

[АТФ] В.М. Алексеев, В.М. Тихомиров, С.В. Фомин. Оптимальное управление. М., Наука, 1979, Физматлит, 2006.

[КФ] А.Н. Колмогоров, С.В. Фомин. Элементы теории функций и функционального анализа. М.: Наука, 1968.

[ОПУ] Оптимальное управление. Коллективная монография кафедры ОПУ (под ред. Н.П. Осмоловского и В.М. Тихомирова), М., МЦНМО, 2008.

10

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]