ТУ - лекции Шмырова / Лекции по ТУ / 19
.pdfЛекция 19. Исследование приращения функционала и его вариация.
Полное приращение функционала. Рассмотрим систему (1) лекции 18 и функ- |
||
ционал |
I(u) = Z0 T '(t; xt)dt + g(xT ); |
(1) |
заданный на траекториях этой системы. Относительно функций '(t; x) è g(x) предполагаем, что они определены и непрерывны вместе со своими производными по x íà
T0 £- (T0 = [0; T ]) è - соответственно. Исследуем задачу минимизации функционала (1) по управлениям u 2 D.
Выпишем полное приращение функционала (1) при некотором управлении u = u(t) и допустимой вариации этого управления ¢u(t). Пусть u~ = u(t) + ¢u(t), тогда
Z T Z T
¢I(u; ¢u) = I(~u) ¡ I(u) = '(t; x~t)dt + g(~xT ) ¡ '(t; xt)dt ¡ g(xT ):
0 0
Выделим линейную часть в функциях
'(t; x~(xt)) = '(t; xt + ¢x(t; xt)) = |
|
||||
= '(t; xt) + |
@'(t; xt) |
¢x(t; xt) + o(k¢x(t; xt)k); |
(2) |
||
@x |
|||||
g(~x(xT )) = g(xT + ¢x(T; xT )) = |
|
||||
= g(xT ) + |
@g(xT ) |
¢x(T; xT ) + o(k¢x(T; xT )k): |
(3) |
||
|
@x |
Здесь o('; k¢x(t; xt)k) è o(g; k¢x(T; xT )k) величины более высокого порядка малости, чем k¢xk. Тогда приращение функционала преобразуется к виду
¢I(u; ¢u) = Z0 |
µ |
@x |
t |
¢x + o(k¢x(t; xt)k)¶dt+ |
(4) |
||
T |
|
@'(t; x ) |
|
|
|
|
|
|
|
+ |
@g(xT ) |
¢x + o(k¢x(t; xt)k); |
|
||
|
|
|
|
|
|
||
|
|
|
@x |
|
Таким образом, в выражении (4) для приращения функционала мы выделили линейную часть по ±x, которую в дальнейшем будем называть первой вариацией
функционала и обозначать ±I(u; ¢u):
±I(u; ¢u) = Z0 |
T @'(t; x |
) |
|
@g(x |
) |
|
|
|
|
t |
|
±xdt + |
T |
|
±x: |
(5) |
|
|
@x |
|
@x |
|
Вариация функционала. Введем в рассмотрение вектор-функцию ª(t; x), которая удовлетворяет на траекториях системы (??) дифференциальному уравнению
|
dt |
= ¡³@xf(t; x; u)´¤ |
ª + ³ |
|
@x |
)´¤ |
(6) |
|||||
dª |
@ |
|
|
|
@'(t; x |
|
|
|
||||
при конечном условии |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ª(T; x(T )) = ¡³ |
|
(@x |
|
´¤ |
|
|
(7) |
|||
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
@g x(T )) |
|
|
|
|
86
Учитывая уравнение в вариациях (??), выпишем очевидное равенство |
|
|||||
ª¤ |
µ dt |
¡ @x±x ¡ ¢uf¶ |
= 0; |
(8) |
||
|
|
d±x |
|
@f |
|
|
Преобразуем вариацию функционала (5) с использованием вспомогательной функциии ª, введенной соотношениями (6) (7). Проинтегрируем уравнение (8) îò 0 äî T ,
применяя обычный прием введения множителей Лагранжа при преобразовании вариаций функционала; прибавим полученные выражения к правой части равенства (5). После преобразований получим
±I(u; ¢u) = ¡ Z0 |
½ª¤¢uf + µª_ ¤ |
+ ª¤ @x ¡ @x ¶¾±xdt+ |
(9) |
|||
T |
|
|
|
|
@f @' |
|
+ µª¤(T; xT ) + |
@g(x |
) |
¶±x(T; xT ): |
|
||
T |
|
|
||||
@x |
|
|
||||
Отсюда на основании равенств (6) (7) находим |
|
|
|
|
||
±I(u; ¢u) = ¡ Z0T ª¤(t; xt)¢uf(t; xt; u(t))dt: |
(10) |
Необходимые условия оптимальности в форме принципа максимума.
Введем функцию H, зависящую от переменных t, x1; : : : ; xn, u1; : : : ; ur тельных переменных ª1, : : :, ªn,:
Xn
H(t; x; ¸; ª; u) = ªi(t; x)fi(t; x; u);
i=1
или кратко H = ª¤f.
Теорема 1 Пусть u0 = u0(t) оптимальное управление, а функция ¸0(t; x) и вектор-функция ª0(t; x) удовлетворяют на оптимальном процессе уравнениям (6) (7). Тогда при почти всех t 2 [0; T ] (кроме разве что точек разрыва управления u0(t))
выполняется следующее условие максимума: |
|
|
|
|
|
|
|
|
|
|
|
|
´ |
|
|
||||||||||||||||
|
u2U |
³ |
t |
|
|
|
t |
´ |
|
³ |
|
|
t |
|
|
|
|
|
t |
|
|
|
|
|
|||||||
|
maxH |
|
t; x |
; ª0(t; x |
); u |
=H |
t; x |
; ª0 |
(t; x |
); u0(t) |
: |
(12) |
|||||||||||||||||||
Доказательство Введем следующее обозначение: |
|
|
|
|
|
|
|
|
|||||||||||||||||||||||
|
h(t; u) = |
ZMt;u0 |
H³t; xt; ¸0(t; xt); ª0(t; xt); u´dxt: |
|
|
||||||||||||||||||||||||||
Предположим, что при некотором |
|
|
2 [0; T ] |
,не являющемся точкой разрыва управле- |
|||||||||||||||||||||||||||
t |
|||||||||||||||||||||||||||||||
0 |
|
|
|
|
|
|
|
|
|
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
(t)).Построимтогда в точке tигольчатую |
||||||||||||||||||||
íèÿ u |
(t), существует u,такое, что h(t; u) > h(t; u |
||||||||||||||||||||||||||||||
вариаию управления u0(t): |
½ |
0;¡ |
|
|
|
|
|
t 2= [t ¡ ±;Tt + ±): |
|
|
|
|
|
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
(13) |
||||||||||||||||||
|
¢u±(t) = |
|
u |
|
u0(t); t 2 [0 |
; T ] |
|
[ |
t |
¡ ±; |
t |
+ ±); |
|
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Здесь ± положительное вещественное число. Тогда при достаточно малом ± èç
87
представления (10) следует
±I(u0; ¢u±)
ãäå
! =
= ¡h( |
|
|
|
|
|
|
|
|
(14) |
|
t; u0(t)) ¡ h(t; u)¢!± + o(±); |
||||||||||
½ |
1; |
|
|
t = 0 t = T: |
|
|||||
|
2; |
|
|
t |
2 (0; T ); |
|
Обозначим h(t; u) ¡ h(t; u0(t)) = h,причемпопредположению h > 0. Выберем ± äî-
статочно малым так, чтобы выполнялись неравенства o(¹) < h±=4,o(±) < h±=4.Тогда из равенств (4) è (14) получаем
¢I(u0; ¢u±) = ¡ |
|
|
|
|
(15) |
h!± + o(±) + o(¹) < ¡h(! ¡ 1=2)± < 0; |
что противоречит оптимальности управления u0(t).
88