
ТУ - лекции Шмырова / Лекции по ТУ / 29 исправленная
.pdf
Лекция 29. Методы последовательного приближения на основе принципа максимума.
В главе 3 для функционала (6.2) [Ссылка из книги где впервые упомянут функ-
ционал I = R T '(t; xt; u(t))dt + g(xT )] был получен принцип максимума в качестве
t0
необходимого уcловия оптимальности. Используем его для построения последовательных приближений в пространстве управлений. В данном разделе предполагаем, что управления u = u(t) 2 D L2(0; T ); u(t) 2 U; t 2 [0; T ] и выполнены условия А § 5.1.[Ссылка] Рассмотрим задачу минимизации функционала (6.2). Опишем один из возможных способов построения последовательности приближений uk. Пусть на k-м шаге итерационного пропесса получено управление uk = uk(t). Определим управление uk из условия максимума
k( ) = arg u2U |
|
t |
; |
k( |
t; x |
k) |
|
(1) |
|
u t |
max H |
|
t; x |
|
|
; u ; |
|
||
здесь H = f '. Функции |
k(t; x) и k(t; x) определяются на указанном пучке |
траекторий из уравнений
dt = |
|
@x |
! |
|
@x |
|
||
+ |
||||||||
d |
|
@f t; x(t); u(t) |
|
|
|
@' t; x(t); u(t) |
|
!
;(2)
при конечных условиях |
|
|
|
|
|
@x |
|
|
|
|
|
T; x(T ) |
= |
|
|
|
; |
(3) |
|||||
|
|
|
|
|
@g x(T ) |
|
|
|
|
||
Введем функционалы |
|
|
|
|
|
|
|
|
|
|
|
Qk(u) = Z0 T hH t; xt; |
k(t; xt); u(t) H t; xt; |
k(t; xt); uk(t)idt |
(4) |
||||||||
и |
|
|
1 |
|
|
|
|
|
|
|
|
|
(uk) = |
sup Qk(u) |
|
|
|
|
(5) |
||||
|
|
|
|
|
|
||||||
|
|
|
T u2D |
|
|
|
|
|
Управление uk, очевидно, доставляет максимум функционалу (4) и, следовательно(uk) = T1 Qk(uk). Рассмотрим функцию
!k(t) = hH t; xt; k(t; xt); uk(t) H t; xt; k(t; xt); uk(t)i |
(6) |
||||||
Величина |
T Z0 |
T |
|
||||
(uk) = T Qk(uk) = |
(7) |
||||||
!k(t)dt |
|||||||
|
1 |
|
1 |
|
|
|
есть среднее значение функции !k(t) на отрезке T0 = [0; T ]: Определим однопараметрическое семейство измеримых подмножеств Tk(") отрезка T0, удовлетворяющих условиям:
1. |
Tk(") T0; " 2 [0; T ]; mesTk(") = "; |
|
2. |
1 |
RTk(") !k(t)dt (uk); " 2 (0; T ]; |
" |
122

и таких, что управления uk(t; ") образуемые |
по правилу |
|
||
uk(t; ") = |
(uk(t); t |
T0 |
2 Tk("); |
(8) |
|
uk |
(t); t |
Tk("); |
|
|
|
2 |
n |
|
являются допустимыми управлениями при " 2 [0; T ]. Если (uk) = 0, то uk - стационарное управление. Если же (uk) > 0; то построим однопараметрическое семейство управлений (8). Параметр " затем выбирается из условия I(uk(t; ")) < I(uk). Выберем "k, например, в соответствии с методом наискорейшего спуска
I(uk(t; "k)) = min I(uk(t; ")) |
(9) |
"2[0;T ] |
|
и положим uk+1 = uk(t; "k): Построенная таким образом последовательность управлений uk является невозрастающей последовательностью, а однопараметрическое семейство вариаций
4"uk = uk(t; ") uk(t); " 2 [0; T ] |
(10) |
управления uk удовлетворяет условиям а) в) § 6.1. Действительно, для приращения функционала имеем (см. § 3.3)
4I(uk; 4"uk) = I(uk; 4"uk) + o(uk; "); |
(11) |
|
где |
|
|
I(uk; 4"uk) = Z |
!k(t)dt " (uk) |
(12) |
Tk(")
удовлетворяет условию б). Условия а), в)[ссылка на условия]выполняются по построению. При этом в качестве допустимой вариации 4u по которой строится однопараметрическое семейство вариаций (10), рассматривается вектор-функция
4uk = 4"ukj"=T = uk(t) uk(t):
При условии, что o(uk; ") имеет более высокий порядок малости, чем ", равномерно по всем uk; k = 1; 2; : : : по теореме 6.1 [Ссылка] следует (uk) ! 0, при k ! 1 Вопросы построения рассмотренных выше множеств Tk(") подробно рассмотрены в работах [25; 70; 96; 112]. Отметим, что возможны и другие способы направленного улучшения неоптимального управления на основе принципа максимума [15, 16, 24, 32, 52, 53, 73, 91, 93, 114]. Рассмотрим следующую процедуру улучшения управления uk(t). Для функции (6) по построению имеем !k(t) 0; t 2 T0. В случае, если !k(t) = 0 при почти всех t 2 T0 управление uk(t) является стационарным управлением. Выделим точку k 2 T0, такую, что !k( k) > 0. Предполагаем, что k - точка непрерывности управлений uk(t) и uk(t). Построим по точке k множество Tk("):
T |
(") = [ |
k |
" |
k |
; |
|
+ " |
T k |
]; " |
2 |
[0; T ]: |
(13) |
T |
|
T |
||||||||||
k |
|
|
|
k |
|
|
|
Управления uk(t; ") построим по формуле (8). Так как при достаточно малых "
I(uk; "uk) = !k( k)" + 0(uk; "); |
(14) |
где !k( k) > 0, то уменьшение значения функционала I(u) гарантировано и рассмот-
123

ренная схема улучшения управления является корректной. Отметим, что в качествеk можно брать, например, точку максимума функции (6) на T0 [96]. Отметим, что в случае, если управление входит в правую часть уравнения (6.1) [ссылка]линейно, а ограничения имеют вид типа juij 1; i = 1; r, то из принципа максимума следует вид оптимального управления. А именно оптимальные управления есть кусочнопостоянные вектор-функции. Учитывая это, оптимальное управление можно искать сразу в этом классе функций и задачу поиска оптимального управления рассматривать как задачу параметрической оптимизации, используя выражения для производных функционала по точкам переключения (см. § 3.7) [15, 16, 79, 80, 84, 85]. Следует также отметить, что построение методов последовательных приближений может быть основано на рассмотрении уравнений с частными производными, с использованием которых были получены формулы для полного приращения минимизируемого функционала и его вариации.
124