
ТУ - лекции Шмырова / Лекции по ТУ / 27 исправленная
.pdfЛекция 27. Методы спуска на основе первой вариации функционала.
Рассмотрим следующую задачу оптимального управления:
t, x, u t |
, x |
|
|
M |
|
Rn, |
|
|
x˙ = f(T |
( |
)) |
(0) |
|
|
0 |
|
(1) |
I(u) = ∫t0 |
φ(t, xt, u(t)) dt + g(xT ) −→ min. |
(2) |
Здесь, как и ранее, u D, D — класс кусочно-непрерывных на T0, вектор-функций, u(t) U, t T0 = [t0, T ], t0, T фиксированы.
Сформулируем следующие условия на параметры задачи (1), (2).
А. Вектор-функция f(t, x, u) и функция φ(t, x, u) определены и непрерывны по совокупности своих аргументов на T0×Ω×U вместе с частными производными ∂f/∂x, ∂φ/∂x; функция g(x) непрерывна в множестве Ω и имеет непрерывную производную ∂g/∂x; множество U компактно в пространстве Rr; Ω — область в Rn.
Б. Дополнительно к условиям A предположим, что существует и непрерывна производная ∂f/∂u; U — выпуклое множество.
Для функционала (2) было получено следующее представление приращения:
∆I(u, ∆u) = δI(u, ∆u) + o(u, µ), |
(3) |
где |
(4) |
µ = ( ∆uf L) . |
В зависимости от условий A и и вида вариации управления вариацию δI(u, ∆u) представим либо в виде неклассической вариации
δI(u, ∆u) = − ∫0 T Ψ (t, xt)∆uf(t, xt, u(t))dt |
(5) |
или |
|
δI(u, ∆u) = ∫0 T W (t, xt, u˜(t)) dt, |
(6) |
либо в виде классической вариации |
|
δI(u0, εδu) = −ε G(u0), u − u0 + o(ε). |
(7) |
При этом в случае игольчатой вариации ∆u = ∆u", а в случае классической вариации ∆u = εδu. При этом величина µ имеет порядок ε.
Будем говорить, что функция ω(α) является строго положительной при α > 0, если
ω(α) = inf{ω(δ) : δ ≥ α} > 0, α > 0.
Предполагаем далее, что при всяком допустимом управлении u = u(t) и допустимой вариации ∆u = ∆u(t) возможно построение однопараметрического семейства вариаций, обозначаемого через ∆"u, такого, что:
а) ∆ u является допустимой вариацией при ε [0, εˆ], εˆ > 0, при этом
"
∆"u "=^"= ∆"^u = ∆u;
115

б) вариация |
δI(u, ∆u) |
при ∆u |
= |
∆"u удовлетворяет неравенству |
|
а |
— |
( |
) |
|
|
δI(u, ∆"u) |
≤ −εω β(u) , ε [0, εˆ], где ω — строго положительная функция, |
β(u) некоторый функционал на D или его подмножестве;
в) величина µ, определенная равенством (4), имеет порядок малости не меньше ε, а следовательно, остаточный член o(u, µ) в приращении (3) более высокого порядка малости, чем ε.
Функционал β(u) введем следующим образом: |
) |
|
|||||
β |
( |
u |
) = u~2D(− |
δI(u, u˜ |
− |
(8) |
|
|
sup |
|
u) . |
|
Будем говорить, что управление u0 = u0(t) есть стационарное управление, если выполняется равенство β(u0) = 0.
В силу доказательства необходимых условий оптимальности в задаче управления пучком оптимальные управления являются стационарными, а стационарные управления удовлетворяют необходимым условиям оптимальности.
Из равенства (3) и условий a)–в) для приращения функционала при вариации
управления ∆"u имеем |
|
∆I(u, ∆"u) ≤ −εω(β(u)) + o(u, ε). |
(9) |
Будем предполагать, что величина o(u, ε) имеет равномерно по u D более высокий порядок малости, чем ε.
Построим следующий алгоритм определения стационарных управлений. Пусть u1 = u1(t) —допустимое управление. Фиксируем некоторое εˆ > 0 и вычислим β(u1). Допустим, что
β(u1) = −δI(u1, ∆u) = −δI(u1, uˆ − u) > 0, |
(10) |
где ∆u — вариация, на которой достигается супремум (8). По вариации ∆u построим
однопараметрическое семейство вариаций ∆"u "=^"= ∆u,удовлетворяющее условиям a)–в). Очевидно, что тогда из этих условий вытекает существование ε¯ [0, εˆ], такого, что
∆I(u1, ∆"u) < 0. |
(11) |
Более того, найдем такое ε0, что
∆I(u1, ∆"0 u) = min ∆I(u1, ∆"u). |
(12) |
"2[0;"^] |
|
При этом из неравенства (11) следует, что
∆I(u1, ∆"0 u) < 0. |
(13) |
Возьмем теперь в качестве следующего управления
u2(t) = u1(t) + ∆"0 u(t). |
(14) |
Учитывая (13), имеем I(u2) < I(u1).
Для управления u2 можно повторить те же построения, что и для управления u1. В случае, если β(u2) = 0, полагаем u3 = u2. Следовательно, повторяя этот процесс,
116

мы получим последовательность управлений |
|
u1, u2, . . . , uk, . . . , |
(15) |
такую, что |
(16) |
I(u1) ≥ I(u2) ≥ . . . ≥ I(uk) ≥ . . . . |
Последовательность управлений, для которой имеют место неравенства (16), будем называть невозрастающей последовательностью для функционала (2).
Рассмотрим поведение функции β(u) на этой последовательности.
Теорема 1 Пусть функционал (2) ограничен снизу и пусть построена последова-
тельность управлений (15) по указанному ранее алгоритму. Тогда β(uj) −−−→ 0.
j!1
Доказательство Предположим, что теорема неверна. Тогда существуют β0 > 0 и подпоследовательность управлений {uj} последовательности (15), на которой выполняется неравенство
β(uj) ≥ β0 > 0. |
(17) |
Пронумеруем эту подпоследовательность заново: считаем в дальнейшем j = 1, 2, . . ..
По построению каждому управлению uj соответствует однопараметрическое семейство вариаций ∆u"uj, удовлетворяющих условиям a)–в). Поэтому согласно (9) для приращения функционала имеем
∆I(uj, ∆"uj) ≤ −εω(β(uj)) + o(uj, ε), |
(18) |
причем, так как o(u, ε) на (9) более высокого порядка малости, чем ε, равномерно по управлениям u D, то существует ε˜ [0, εˆ], такое, что
|o(uj, ε)| ≤ |
1 |
εω(β(uj)) |
(19) |
2 |
для всякого uj из указанной подпоследовательности при ε [0, ε˜].
Выпишем с учетом неравенств (17) и (19) следующую цепочку неравенств:
min ∆I(u |
, ∆ u |
) |
≤ |
min ∆I(u |
, ∆ u |
|
) |
≤ |
|
|
|
|||||||||||||||||
" |
2 |
[0;"^] |
j |
" j |
|
|
" |
2 |
[0;"~] |
|
|
|
j |
" |
|
|
j |
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
ε |
|
|
|
|
|
|
|
|
)] ≤ − |
ε˜ |
|
|
||||
|
|
|
|
|
|
|
≤ |
min |
|
|
ω β(u |
) |
ω(β |
) < 0. |
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||
|
|
|
|
|
|
|
"2[0;"~] |
[−2 |
( |
|
|
|
j |
|
|
2 0 |
|
|||||||||||
Это означает, что для произвольного j = 1, 2, . . . имеем |
|
|
|
|||||||||||||||||||||||||
|
|
|
|
I(uj+1) − I(uj) ≤ − |
ε˜ |
ω(β0), |
|
|
|
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
||||||||||||||||||||
|
|
|
|
2 |
|
|
|
|||||||||||||||||||||
или, суммируя по j от l до k, получаем |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
I(u |
|
|
) |
≤ |
I(u |
) + |
−kε˜ |
ω(β |
). |
|
|
|
||||||||||||
|
|
|
|
|
|
k+1 |
|
|
1 |
|
|
|
2 |
|
|
|
|
|
|
0 |
|
|
|
|
Отсюда следует, что I(uk) −−−→ −∞, но это противоречит ограниченности снизу
k!1
функционала I(u).
117

Замечание 1 Отметим, что при доказательстве теоремы существенно предположение о том, что величина o(u, ε) из соотношения (9) имеет более высокий порядок малости, чем ε, равномерно по u D. Однако на самом деле используется только равномерность по управлениям из последовательности {uj}. Вопросы, связанные с возможностью построения такой последовательности, на которой
o(uj, ε)/ε −−→0 равномерно по uj, рассмотрены, например, в работах [].
"!0
Выбор вариации ∆u,способ построения по ней однопараметрического семейства вариаций ∆"u и алгоритм минимизации в одномерном направлении (по ε) определяют тот или иной метод спуска. В каждой конкретной задаче он обусловлен, например, ресурсами ЭВМ, простотой вычислительных схем и, естественно, тем результатом, который ожидается, и за какое время.
118