
ТУ - лекции Шмырова / Лекции по ТУ / 28
.pdf
Лекция 28. Градиентный метод оптимизации.
Исследуем задачу минимизации (1)-(2) лекции 27. При этом будем предполагать, что управление u = u(t) 2 D ½ L22(0; T ), u(t) 2 U, t 2 [0; T ], U выпуклое компакт- ное множество в пространстве Rr. Будем также считать, что выполнены условия A,
Б лекции 27.
Пусть u 2 D è ¢u = ¢u(t) допустимая вариация управления u. Рассмотрим управление u~ = u + "¢u. В силу выпуклости множества U управление u~ 2 D ïðè " 2 [0; 1]. Для приращения функционала в данном случае имеем
|
|
|
|
|
¢I(u; "¢u) = "±I(u; "¢u) + o(u; "); |
|
|
|
|
(1) |
|||||||||||||
ãäå |
|
±I(u; "¢u) = h¡G(u); ¢ui = ¡ Z0T l¤(t; u)¢u(t) dt; |
|
(2) |
|||||||||||||||||||
|
|
|
|
|
|
l¤(t; u) = |
|
|
¡ |
t |
|
@u; |
t |
|
|
¢ |
|
|
|
|
|
(3) |
|
|
|
|
|
|
|
|
|
|
@H t; x |
; ª(t; x |
); u(t) |
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
H = ª¤f ¡ '; |
|
|
|
|
|
|
|
|
|
(4) |
|||||
а функция ª(t; x) удовлетворяет на траекториях системы (??) уравнению |
|
||||||||||||||||||||||
|
|
dt |
= ¡ Ã |
¡ |
@x |
|
|
¢! |
¤ |
ª + Ã |
|
¡ |
@x |
¢! |
; |
(5) |
|||||||
|
|
dª |
|
|
|
@f t; x(t); u(t) |
|
|
|
@' t; x(t); u(t) |
|
|
|
|
|
||||||||
при конечном условии |
|
|
|
|
|
|
= ¡³ |
¡@x |
¢ |
´¤: |
|
|
|
|
|
|
|||||||
|
Функционал |
|
|
, |
|
ª T; x(T ) |
|
|
|
|
|
(6) |
|||||||||||
|
|
|
|
|
¡ |
|
|
¢ |
|
|
@g x(T ) |
|
|
|
|
|
|
называют |
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
¡G(u) |
|
определяемый в (2), и вектор-функцию |
¡l(t; u) |
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
градиентом функционала I(u). Вектор-функцию l(t; u) будем называть антиградиен-
том функционала I(u). Формулы (1) (4) позволяют строить различные градиентные |
|
методы минимизации в рассматриваемой задаче [24, 80, 113]. |
|
Метод условного градиента. Определим функционал |
|
¯(u) = sup hG(u); u~ ¡ ui : |
(7) |
u~2D |
|
Построим невозрастающую последовательность управлений (1) (4) с учетом определения (7) äëÿ ¯(u). Пусть uk 2 D è u¹k определяются из условия
sup hG(uk); ui = hG(uk); u¹ki : |
(8) |
|||||||
u2D |
|
|
|
|
|
|
||
Очевидно, что ¯(uk) = hG(uk); u¹k ¡ uki. Полагаем |
|
|||||||
|
|
|
|
|
|
|
|
(9) |
uk+1 = uk + "¢uk; |
|
¢uk = u¹k ¡ uk: |
||||||
Выберем "k из условия |
|
|
|
|
|
|
||
I(uk+1) = inf |
I(uk + "¢uk): |
(10) |
||||||
"2[0;1] |
|
|
|
|
|
|
Отметим, что существуют разные способы выбора величины "k. Так, например, воз- 119
можно априорное задание величины "k из условий [?]
|
|
1 |
|
|
Xk |
0 · " · 1; k = 0; 1; : : : ; |
klim "k = 0; |
"k = +1: |
|
!1 |
=1 |
Построение последовательности приближений по правилу (8) (10) называют методом условного градиента.
Рассмотрим теперь метод проекции градиента. Пусть H гильбертово пространство. Под проекцией точки u 2 H на множество V 2 H понимается точка w 2 H, такая, что
ku ¡ wkH = inf ku ¡ wkH:
v2V
Åñëè V выпуклое замкнутое множество в H, то всякая точка u 2 H имеет един-
ственную проекцию на это множество [?]. |
|
|
|
|
Пусть uk 2 D, à |
l(t; uk) íà D. |
¡ |
¢ |
u¹k íà (11), получим |
|
u¹k = PD |
|
l(t; uk) |
(11) |
есть проекция антиградиента |
|
Заменив в формуле (9) |
|
последовательность управлений fukg, соответствующую методу проекции градиента.
Величина "k, как и в предыдущем случае, может выбираться разными способами.
Этот метод удобен, когда имеется явная формула для проекции градиентна (антиградиента). Так, в задачах управления ограничения на множество U часто имеют
âèä |
U = ©u = (u1; : : : ; ur)¤ : ®i · ui · ¯iª: |
(12) |
|||||
В этом случае |
® ; |
l |
t; u ) < ® ; |
|
|
||
Отметим, что в |
|
u¹ki = 8 li(it; uk); |
®i(i |
· lki(t; uk)i |
· ¯i; |
(13) |
|
: |
li(t; uk) ¸ ¯i: |
|
|
||||
|
|
|
< ¯i; |
|
|
||
|
|
рассмотренных случаях построено однопараметрическое семей- |
|||||
|
|
|
|||||
ство вариаций ¢"u = "¢uk,удовлетворяющее условиям a) в) из предыдущей лекции. |
|||||||
При этом в последнем случае в качестве функционала ¯(u) следует взять |
|
||||||
|
|
|
¯(u) = Z0T l¤(t; u)PD¡l(t; u)¢dt; |
(14) |
а функцию !(®) следует положить равной ® в обоих случаях. Поведение функционала k ¡! 1 определяется теоремой 1 лекции 27.
Возможны, как уже говорилось, и другие методы построения минимизирующей последовательности на основе градиента. Так, полезными и эффективными в задачах управления оказываются овражные методики и методы, использующие специальные весовые функции [?,?].
Таким образом, общие схемы построения минимизирующих последовательностей на основе градиента для задач управления сохраняются.
Обсудим вычислительный аспект спуска по антиградиенту. Одна из основных трудностей здесь вычисление антиградиента l(t; u).
120

Представим интеграл (3) â âèäå
|
|
|
N |
¡ |
¢ |
|
|
|
|
Xi |
(15) |
||
|
|
|
l(t; u) ' |
S t; x(t; x0i; u) ; |
||
|
¡ |
¢ |
=1 |
|
|
|
x(t) |
|
|
u = u(t) |
x0. |
||
ãäå S |
t; x(t; x0i; u) |
подынтегральная функция (3), вычисленная в момент t в точке |
||||
траектории системы (??) при управлении |
, исходящей из точки |
|
||||
Для вычисления S |
¡t; x(t; x0i; u)¢ нужно |
|
|
1.проинтегрировать систему (??) îò 0 äî T при управлении u(t) с начальными условиями x(0) = x0i, i = 1; N;
2.проинтегрировать в обратном порядке от T äî 0 уравнение (5) при условии на правом конце (6).
При этом возможны два подхода к интегрированию вспомогательного уравнения (5). А именно: можно интегрировать уравнение (5), предварительно запомнив решения прямой системы, либо интегрировать в обратном порядке прямую (??) и вспомогательную (5) системы уравнений вместе. Первый способ используется обычно при достаточной памяти ЭВМ, второй когда этого нет либо ЭВМ имеет большое быстродействие.
Отметим, что так как все вычисления проводятся с некоторой погрешностью, то в результате построения последовательности fujg при некотором j = k можно
получить управление, такое, что
¯(uk) ¸ ";~ "~ > 0; ¢I(uk; ¢"uk ) ¸ 0; " 2 [0; "¹]:
Здесь "~ константа, характеризующая точность вычиcлений. Следовательно, стаци-
онарная точка функционала ищется с точностью, определенной точностью вычислений. В этом случае, а также тогда, когда уменьшение функционала I(u) ïðè j ¸ k
происходит меньше, чем на "0 (ãäå "0 достаточно малое число, определяемое той
точностью, с которой ищется минимум функционала I(u)), управление uk будем на-
зывать почти стационарным . Таким образом, при машинной реализации указанных алгоритмов мы находим почти стационарное управление . Очевидно, что при решении практических задач не обязательно отыскание точного минимума (10), важно лишь, чтобы происходило существенное уменьшение функционала I(u). В связи
с этим выделяется направление предполагаемого существенного уменьшения функционала I(u).
121