
ТУ - лекции Шмырова / Лекции по ТУ / 27
.pdf
Лекция 27. Методы спуска на основе первой вариации функционала.
Рассмотрим следующую задачу оптимального управления:
x = f |
¡T |
( )¢ |
|
(0) 2 |
|
0 |
½ |
Rn; |
(1) |
|
|
t; x; u t |
; |
x |
|
M |
|
|
|||
I(u) = Zt0 |
¡ |
|
¢ |
|
|
|
|
|
(2) |
|
' t; xt |
; u(t) |
dt + g(xT ) ¡! min: |
Здесь, как и ранее, u 2 D, D класс кусочно-непрерывных íà T0, вектор-функций, u(t) 2 U, t 2 T0 = [t0; T ], t0; T фиксированы.
Сформулируем следующие условия на параметры задачи (1), (2).
À. Вектор-функция f(t; x; u) и функция '(t; x; u) определены и непрерывны по
совокупности своих аргументов на T0£-£U вместе с частными производными @f=@x, @'=@x; функция g(x) непрерывна в множестве - и имеет непрерывную производную @g=@x; множество U компактно в пространстве Rr; - область в Rn.
Á. Дополнительно к условиям A предположим, что существует и непрерывна производная @f=@u; U выпуклое множество.
Для функционала (2) было получено следующее представление приращения:
¢I(u; ¢u) = ±I(u; ¢u) + o(u; ¹);
ãäå
¹ = max (k¢ufkL) :
x02M0
(3)
(4)
В зависимости от условий A и и вида вариации управления вариацию ±I(u; ¢u) представим либо в виде неклассической вариации
èëè |
±I(u; ¢u) = ¡ Z0T |
ª¤(t; xt)¢uf(t; xt; u(t))dt |
(5) |
±I(u; ¢u) = Z0T W (t; xt; u~(t)) dt; |
(6) |
||
либо в виде классической вариации |
|
|
|
|
±I(u0; "±u) = ¡"-G(u0); u ¡ u0® + o("): |
(7) |
При этом в случае игольчатой вариации ¢u = ¢u", а в случае классической вариации ¢u = "±u. При этом величина ¹ имеет порядок ".
Будем говорить, что функция !(®) является строго положительной при ® > 0,
åñëè |
!(®) = inff!(±) : ± ¸ ®g > 0; ® > 0: |
|
Предполагаем далее, что при всяком допустимом управлении u = u(t) и допустимой вариации ¢u = ¢u(t) возможно построение однопараметрического семейства вариаций, обозначаемого через ¢"u, такого, что:
à) ¢"u является¯ допустимой вариацией при " 2 [0; "^], "^ > 0, ïðè ýòîì
¢"u¯"=^"= ¢"^u = ¢u;
115

á) |
вариация |
±I(u; ¢u) |
ïðè ¢u |
= |
¢"u удовлетворяет неравенству |
|
|
|
¯(u) |
¡ |
¢ |
D |
|
|
±I(u; ¢"u) · ¡"! ¯(u) , " 2 [0; "^], ãäå ! строго положительная функция, |
|||||
|
à |
|
некоторый функционал на |
|
или его подмножестве; |
|
â) |
величина ¹, определенная равенством (4), имеет порядок малости не меньше ", |
|||||
|
а следовательно, остаточный член o(u; ¹) в приращении (3) более высокого по- |
|||||
|
рядка малости, чем ". |
|
|
|
Функционал ¯(u) введем следующим образом:
u~2D¡¡ |
|
¡ |
¢ |
(8) |
¯(u) = sup |
±(u; u~ |
|
u) : |
Будем говорить, что управление u0 = u0(t) есть стационарное управление, если выполняется равенство ¯(u0) = 0.
В силу доказательства необходимых условий оптимальности в задаче управления |
|
пучком оптимальные управления являются стационарными, а стационарные управ- |
|
ления удовлетворяют необходимым условиям оптимальности. |
|
Из равенства (3) и условий a) в) для приращения функционала при вариации |
|
управления ¢"u имеем |
|
¢I(u; ¢"u) · ¡"!¡¯(u)¢ + o(u; "): |
(9) |
Будем предполагать, что величина o(u; ") имеет равномерно по u 2 D более вы-
сокий порядок малости, чем ".
Построим следующий алгоритм определения стационарных управлений. Пусть u1 = u1(t) допустимое управление. Фиксируем некоторое "^ > 0 и вычислим ¯(u1).
Допустим, что
|
|
|
(10) |
¯(u1) = ¡±I(u1; ¢u) = ¡±I(u1; u^ ¡ u) > 0; |
ãäå ¢u вариация, на которой достигается супремум¯ (8). По вариации ¢u построим однопараметрическое семейство вариаций ¢"u¯"=^"= ¢u,удовлетворяющее условиям a) в). Очевидно, что тогда из этих условий вытекает существование "¹ 2 [0; "^], такого,
÷òî
(11)
Более того, найдем такое "0, ÷òî
¢I(u1; ¢"0 u) = min ¢I(u1; ¢"u): |
(12) |
"¹2[0;"^] |
|
При этом из неравенства (11) следует, что |
|
¢I(u1; ¢"0 u) < 0: |
(13) |
Возьмем теперь в качестве следующего управления |
|
u2(t) = u1(t) + ¢"0 u(t): |
(14) |
Учитывая (13), имеем I(u2) < I(u1).
Для управления u2 можно повторить те же построения, что и для управления u1. В случае, если ¯(u2) = 0, полагаем u3 = u2. Следовательно, повторяя этот процесс,
116

мы получим последовательность управлений
|
u1; u2; : : : ; uk; : : : ; |
(15) |
такую, что |
I(u1) ¸ I(u2) ¸ : : : ¸ I(uk) ¸ : : : : |
(16) |
|
Последовательность управлений, для которой имеют место неравенства (16), будем называть невозрастающей последовательностью для функционала (2).
Рассмотрим поведение функции ¯(u) на этой последовательности.
Теорема 1 Пусть функционал (2) ограничен снизу и пусть построена последовательность управлений (15) по указанному ранее алгоритму. Тогда ¯(uj) ¡¡¡! 1.
j!1
Доказательство Предположим, что теорема неверна. Тогда существуют ¯0 > 0 и подпоследовательность управлений fujg последовательности (15), на которой выпол-
няется неравенство |
¯(uj) ¸ ¯0 |
> 0: |
(17) |
|
Пронумеруем эту подпоследовательность заново: считаем в дальнейшем j = 1; 2; : : :.
По построению каждому управлению uj соответствует однопараметрическое семей-
ство вариаций ¢u"uj, удовлетворяющих условиям a) в). Поэтому согласно (9) для приращения функционала имеем
¢I(uj; ¢"uj) · ¡"!¡¯(uj)¢ + o(uj; "); |
(18) |
причем, так как o(u; ") íà (9) более высокого порядка малости, чем ", равномерно по управлениям u 2 D, то существует "~ 2 [0; "^], такое, что
jo(uj; ")j · |
1 |
"!¡¯(uj)¢ |
(19) |
2 |
для всякого uj из указанной подпоследовательности при " 2 [0; "~].
Выпишем с учетом неравенств (17) è (19) следующую цепочку неравенств:
min ¢I(u |
; ¢ |
u |
) |
· |
min ¢I(u |
; ¢ |
u |
) |
· |
|
|
|
|
|
||||
" [0;"^] |
j |
" |
j |
|
" [0;"~] |
|
j |
" |
|
j |
|
|
|
|
|
|
||
2 |
|
|
|
|
|
2 |
|
|
¡ ( |
|
j)¢i · ¡2 |
|
|
|
||||
|
|
|
|
|
· "2[0;"~] h¡ |
2 |
|
( |
0) |
0 |
||||||||
|
|
|
|
|
|
min |
" |
! ¯ u |
|
|
|
"~ |
! ¯ |
|
< : |
|||
|
|
|
|
|
|
|
|
|
|
|
Это означает, что для произвольного j = 1; 2; : : : имеем
"~
I(uj+1) ¡ I(uj) · ¡2!(¯0);
или, суммируя по j îò l äî k, получаем
¡k"~
I(uk+1) · I(u1) + 2 !(¯0):
Отсюда следует, что I(uk) ¡¡¡! ¡1, но это противоречит ограниченности снизу
k!1
функционала I(u).
117

Замечание 1 Отметим, что при доказательстве теоремы существенно предположение о том, что величина o(u; ") из соотношения (9) имеет более высокий
порядок малости, чем ", равномерно по u 2 D. Однако на самом деле используется только равномерность по управлениям из последовательности fujg. Вопросы,
связанные с возможностью построения такой последовательности, на которой o(uj; ")=" ¡¡!0 равномерно по uj, рассмотрены, например, в работах [].
"!0
Выбор вариации ¢u,способ построения по ней однопараметрического семейства ва-
риаций ¢"u и алгоритм минимизации в одномерном направлении (по ") определяют
тот или иной метод спуска. В каждой конкретной задаче он обусловлен, например, ресурсами ЭВМ, простотой вычислительных схем и, естественно, тем результатом, который ожидается, и за какое время.
118