Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
15
Добавлен:
16.04.2015
Размер:
59.98 Кб
Скачать

Лекция 27. Методы спуска на основе первой вариации функционала.

Рассмотрим следующую задачу оптимального управления:

t, x, u t

, x

 

 

M

 

Rn,

 

x˙ = f(T

(

))

(0)

 

 

0

 

(1)

I(u) = t0

φ(t, xt, u(t)) dt + g(xT ) −→ min.

(2)

Здесь, как и ранее, u D, D — класс кусочно-непрерывных на T0, вектор-функций, u(t) U, t T0 = [t0, T ], t0, T фиксированы.

Сформулируем следующие условия на параметры задачи (1), (2).

А. Вектор-функция f(t, x, u) и функция φ(t, x, u) определены и непрерывны по совокупности своих аргументов на T0××U вместе с частными производными ∂f/∂x, ∂φ/∂x; функция g(x) непрерывна в множестве Ω и имеет непрерывную производную ∂g/∂x; множество U компактно в пространстве Rr; Ω — область в Rn.

Б. Дополнительно к условиям A предположим, что существует и непрерывна производная ∂f/∂u; U — выпуклое множество.

Для функционала (2) было получено следующее представление приращения:

I(u, u) = δI(u, u) + o(u, µ),

(3)

где

(4)

µ = ( ∆uf L) .

В зависимости от условий A и и вида вариации управления вариацию δI(u, u) представим либо в виде неклассической вариации

δI(u, u) = 0 T Ψ (t, xt)∆uf(t, xt, u(t))dt

(5)

или

 

δI(u, u) = 0 T W (t, xt, u˜(t)) dt,

(6)

либо в виде классической вариации

 

δI(u0, εδu) = −ε G(u0), u − u0 + o(ε).

(7)

При этом в случае игольчатой вариации ∆u = ∆u", а в случае классической вариации ∆u = εδu. При этом величина µ имеет порядок ε.

Будем говорить, что функция ω(α) является строго положительной при α > 0, если

ω(α) = inf(δ) : δ ≥ α} > 0, α > 0.

Предполагаем далее, что при всяком допустимом управлении u = u(t) и допустимой вариации ∆u = ∆u(t) возможно построение однопараметрического семейства вариаций, обозначаемого через ∆"u, такого, что:

а) ∆ u является допустимой вариацией при ε [0, εˆ], εˆ > 0, при этом

"

"u "=^"= ∆"^u = ∆u;

115

б) вариация

δI(u, u)

при ∆u

=

"u удовлетворяет неравенству

а

(

)

 

 

δI(u, "u)

≤ −εω β(u) , ε [0, εˆ], где ω — строго положительная функция,

β(u) некоторый функционал на D или его подмножестве;

в) величина µ, определенная равенством (4), имеет порядок малости не меньше ε, а следовательно, остаточный член o(u, µ) в приращении (3) более высокого порядка малости, чем ε.

Функционал β(u) введем следующим образом:

)

 

β

(

u

) = u~2D(

δI(u, u˜

(8)

 

sup

 

u) .

 

Будем говорить, что управление u0 = u0(t) есть стационарное управление, если выполняется равенство β(u0) = 0.

В силу доказательства необходимых условий оптимальности в задаче управления пучком оптимальные управления являются стационарными, а стационарные управления удовлетворяют необходимым условиям оптимальности.

Из равенства (3) и условий a)–в) для приращения функционала при вариации

управления ∆"u имеем

 

I(u, "u) ≤ −εω(β(u)) + o(u, ε).

(9)

Будем предполагать, что величина o(u, ε) имеет равномерно по u D более высокий порядок малости, чем ε.

Построим следующий алгоритм определения стационарных управлений. Пусть u1 = u1(t) —допустимое управление. Фиксируем некоторое εˆ > 0 и вычислим β(u1). Допустим, что

β(u1) = −δI(u1, u) = −δI(u1, uˆ − u) > 0,

(10)

где ∆u — вариация, на которой достигается супремум (8). По вариации ∆u построим

однопараметрическое семейство вариаций ∆"u "=^"= ∆u,удовлетворяющее условиям a)–в). Очевидно, что тогда из этих условий вытекает существование ε¯ [0, εˆ], такого, что

I(u1, "u) < 0.

(11)

Более того, найдем такое ε0, что

I(u1, "0 u) = min ∆I(u1, "u).

(12)

"2[0;"^]

 

При этом из неравенства (11) следует, что

I(u1, "0 u) < 0.

(13)

Возьмем теперь в качестве следующего управления

u2(t) = u1(t) + ∆"0 u(t).

(14)

Учитывая (13), имеем I(u2) < I(u1).

Для управления u2 можно повторить те же построения, что и для управления u1. В случае, если β(u2) = 0, полагаем u3 = u2. Следовательно, повторяя этот процесс,

116

мы получим последовательность управлений

 

u1, u2, . . . , uk, . . . ,

(15)

такую, что

(16)

I(u1) ≥ I(u2) ≥ . . . ≥ I(uk) ≥ . . . .

Последовательность управлений, для которой имеют место неравенства (16), будем называть невозрастающей последовательностью для функционала (2).

Рассмотрим поведение функции β(u) на этой последовательности.

Теорема 1 Пусть функционал (2) ограничен снизу и пусть построена последова-

тельность управлений (15) по указанному ранее алгоритму. Тогда β(uj) −−−→ 0.

j!1

Доказательство Предположим, что теорема неверна. Тогда существуют β0 > 0 и подпоследовательность управлений {uj} последовательности (15), на которой выполняется неравенство

β(uj) ≥ β0 > 0.

(17)

Пронумеруем эту подпоследовательность заново: считаем в дальнейшем j = 1, 2, . . ..

По построению каждому управлению uj соответствует однопараметрическое семейство вариаций ∆u"uj, удовлетворяющих условиям a)–в). Поэтому согласно (9) для приращения функционала имеем

I(uj, "uj) ≤ −εω(β(uj)) + o(uj, ε),

(18)

причем, так как o(u, ε) на (9) более высокого порядка малости, чем ε, равномерно по управлениям u D, то существует ε˜ [0, εˆ], такое, что

|o(uj, ε)| ≤

1

εω(β(uj))

(19)

2

для всякого uj из указанной подпоследовательности при ε [0, ε˜].

Выпишем с учетом неравенств (17) и (19) следующую цепочку неравенств:

min ∆I(u

, u

)

min ∆I(u

, u

 

)

 

 

 

"

2

[0;"^]

j

" j

 

 

"

2

[0;"~]

 

 

 

j

"

 

 

j

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ε

 

 

 

 

 

 

 

 

)] ≤ −

ε˜

 

 

 

 

 

 

 

 

 

min

 

 

ω β(u

)

ω(β

) < 0.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

"2[0;"~]

[2

(

 

 

 

j

 

 

2 0

 

Это означает, что для произвольного j = 1, 2, . . . имеем

 

 

 

 

 

 

 

I(uj+1) − I(uj) ≤ −

ε˜

ω(β0),

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

или, суммируя по j от l до k, получаем

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

I(u

 

 

)

I(u

) +

−kε˜

ω(β

).

 

 

 

 

 

 

 

 

 

k+1

 

 

1

 

 

 

2

 

 

 

 

 

 

0

 

 

 

 

Отсюда следует, что I(uk) −−−→ −∞, но это противоречит ограниченности снизу

k!1

функционала I(u).

117

Замечание 1 Отметим, что при доказательстве теоремы существенно предположение о том, что величина o(u, ε) из соотношения (9) имеет более высокий порядок малости, чем ε, равномерно по u D. Однако на самом деле используется только равномерность по управлениям из последовательности {uj}. Вопросы, связанные с возможностью построения такой последовательности, на которой

o(uj, ε)/ε −−→0 равномерно по uj, рассмотрены, например, в работах [].

"!0

Выбор вариации ∆u,способ построения по ней однопараметрического семейства вариаций ∆"u и алгоритм минимизации в одномерном направлении (по ε) определяют тот или иной метод спуска. В каждой конкретной задаче он обусловлен, например, ресурсами ЭВМ, простотой вычислительных схем и, естественно, тем результатом, который ожидается, и за какое время.

118

Соседние файлы в папке Лекции по ТУ