
ТУ - лекции Шмырова / Лекции по ТУ / 29
.pdfЛекция 29. Методы последовательного приближения на основе принципа максимума.
В главе 3 для функционала (6.2) [Ссылка из книги где впервые упомянут функ- |
|
необходимогоRt0уcловияt оптимальности. Используем его для построения последова- |
|
ционал I = |
T '(t; x ; u(t))dt + g(xT )] был получен принцип максимума в качестве |
тельных приближений в пространстве управлений. В данном разделе предполагаем, что управления u = u(t) 2 D ½ L2(0; T ); u(t) 2 U; t 2 [0; T ] и выполнены условия А Ÿ
5.1.[Ссылка] Рассмотрим задачу минимизации функционала (6.2). Опишем один из возможных способов построения последовательности приближений uk. Пусть на k-ì
шаге итерационного пропесса получено управление uk = uk(t). Определим управление u¹k
u t |
) = arg |
max H |
¡ |
t; x |
; Ã |
(t; x |
); u ; |
(1) |
¹k( |
u2U |
t |
k |
k |
¢ |
|
здесь H = äf ¡ '. Функции Ãk(t; x) è ¸k(t; x) определяются на указанном пучке траекторий из уравнений
|
dt = ¡ Ã |
¡ |
@x |
¢ |
! |
¤ |
ª + |
à |
¡ |
@x |
¢! |
; |
|
(2) |
||||||
|
dª |
|
|
@f t; x(t); u(t) |
|
|
|
|
|
|
|
@' t; x(t); u(t) |
|
|
|
|
|
|||
при конечных условиях |
|
ª¡T; x(T )¢ = ¡³ |
|
¡@x |
¢ |
´¤; |
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
(3) |
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
@g x(T ) |
|
|
|
|
|
|
||
Введем функционалы |
h |
|
³ |
|
|
|
|
|
|
´ |
³ |
|
|
|
|
|
´i |
|
||
Qk(u) = Z0T |
|
|
|
|
|
|
|
|
|
|
|
|
(4) |
|||||||
|
H t; xt; Ãk(t; xt); u(t) ¡ H |
t; xt; Ãk(t; xt); uk(t) |
dt |
|||||||||||||||||
è |
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
¯(uk) = |
|
sup Qk(u) |
|
|
|
|
|
(5) |
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
T u2D |
|
|
|
|
|
|
|
|
Управление u¹k, очевидно, доставляет максимум функционалу (4) и, следовательно |
|||||||||
¯(uk) = |
1 |
|
Qk(¹uk). Рассмотрим функцию |
|
|
|
|
||
|
|
|
|
|
|||||
T |
!k(t) = hH³t; xtÃk(t; xt); u¹k(t)´ ¡ H³t; xt; Ãk(t; xt); uk(t)´i |
|
|||||||
Величина |
(6) |
||||||||
1 |
|
1 |
Z0 |
T |
|
||||
|
|
|
|
|
|||||
|
|
|
|
|
(7) |
||||
|
|
|
¯(uk) = |
|
Qk(u¹k) = |
|
!k(t)dt |
||
|
|
|
T |
T |
есть среднее значение функции !k(t) на отрезке T0 = [0; T ]: Определим однопара-
метрическое семейство измеримых подмножеств Tk(") отрезка T0, удовлетворяющих условиям:
1. |
Tk(") ½ T0; " 2 [0; T ]; mesTk(") = "; |
|
2. |
1 |
RTk(") !k(t)dt ¸ ¯(uk); " 2 (0; T ]; |
|
" |
122

и таких, что управления uk(t; ") образуемые по правилу
uk(t; ") = |
u¹k(t); t |
Tk("); |
(8) |
||
(uk(t); t |
2 |
T0 |
2 Tk("); |
||
|
|
|
n |
|
являются допустимыми управлениями при " 2 [0; T ]. Åñëè ¯(uk) = 0, òî uk - стацио- нарное управление. Если же ¯(uk) > 0; то построим однопараметрическое семейство управлений (8). Параметр " затем выбирается из условия I(uk(t; ")) < I(uk). Выберем "k, например, в соответствии с методом наискорейшего спуска
I(uk(t; "k)) = min I(uk(t; ")) |
(9) |
"2[0;T ] |
|
и положим uk+1 = uk(t; "k): Построенная таким образом последовательность управлений uk является невозрастающей последовательностью, а однопараметрическое се-
мейство вариаций |
4"uk = uk(t; ") ¡ uk(t); " 2 [0; T ] |
(10) |
|
управления uk удовлетворяет условиям а) в) Ÿ 6.1. Действительно, для приращения функционала имеем (см. Ÿ 3.3)
4I(uk; 4"uk) = ±I(uk; 4"uk) + o(uk; ");
ãäå |
Z |
±I(uk; 4"uk) = ¡ |
!k(t)dt · ¡"¯(uk) |
|
Tk(") |
(11)
(12)
удовлетворяет условию б). Условия а), в)[ссылка на условия]выполняются по построению. При этом в качестве допустимой вариации 4u по которой строится однопара-
метрическое семейство вариаций (10), рассматривается вектор-функция
4u¹k = 4"ukj"=T = u¹k(t) ¡ uk(t):
При условии, что o(uk; ") имеет более высокий порядок малости, чем ", равномерно по всем uk; k = 1; 2; : : : по теореме 6.1 [Ссылка] следует ¯(uk) ! 0, ïðè k ! 1 Вопросы построения рассмотренных выше множеств Tk(") подробно рассмотрены в работах [25; 70; 96; 112]. Отметим, что возможны и другие способы направленного улучшения
неоптимального управления на основе принципа максимума [15, 16, 24, 32, 52, 53, 73, 91, 93, 114]. Рассмотрим следующую процедуру улучшения управления uk(t). Äëÿ
функции (6) по построению имеем !k(t) ¸ 0; t 2 T0. В случае, если !k(t) = 0 при почти всех t 2 T0 управление uk(t) является стационарным управлением. Выделим точку µk 2 T0, такую, что !k(µk) > 0. Предполагаем, что µk - точка непрерывности управлений uk(t) è u¹k(t). Построим по точке µk множество Tk("):
T |
(") = [µ |
k ¡ |
" |
µk |
; µ |
|
+ " |
T ¡ µk |
]; " |
2 |
[0; T ]: |
(13) |
|
|
|
||||||||||
k |
|
|
T |
k |
|
T |
|
|
Управления uk(t; ") построим по формуле (8). Так как при достаточно малых "
±I(uk; ±"uk) = ¡!k(µk)" + 0(uk; "); |
(14) |
ãäå !k(µk) > 0, то уменьшение значения функционала I(u) гарантировано и рассмот-
123

ренная схема улучшения управления является корректной. Отметим, что в качестве µk можно брать, например, точку максимума функции (6) íà T0 [96]. Отметим, что
в случае, если управление входит в правую часть уравнения (6.1) [ссылка]линейно, а ограничения имеют вид типа juij · 1; i = 1; r, то из принципа максимума следу-
ет вид оптимального управления. А именно оптимальные управления есть кусочнопостоянные вектор-функции. Учитывая это, оптимальное управление можно искать сразу в этом классе функций и задачу поиска оптимального управления рассматривать как задачу параметрической оптимизации, используя выражения для производных функционала по точкам переключения (см. Ÿ 3.7) [15, 16, 79, 80, 84, 85]. Следует также отметить, что построение методов последовательных приближений может быть основано на рассмотрении уравнений с частными производными, с использованием которых были получены формулы для полного приращения минимизируемого функционала и его вариации.
124