
ТУ - лекции Шмырова / Лекции по ТУ / 30 исправленная
.pdf
Лекция 30. Параметрическая оптимизация. Необходимые условия оптимальности.
Пучок траекторий. Рассмотрим динамический управляемый процесс, описываемый системой дифференциальных уравнений
dx=dt = f(t; x; u); |
(1) |
где t независимая переменная, называемая в дальнейшем временем; x n вектор фазовых координат x1; x2; : : : ; xn; u = u(t) r-мерная вектор-функция на интервале T0 = [t0; T ] R1, параметры t0; T фиксированы; f(t; x; u) n-мерная векторфункция. Предполагаем, что f(t; x; u) определена и вместе с частными производ-
ными @f=@x, @divxf=@x (divxf |
= |
in=1 @fi=@xi) непрерывна по переменным x; u и |
|||||||||||
|
t |
|
T0 |
|
|
U |
|
|
|
множество в Rn, U |
|||
кусочно-неперерывна по |
|
на |
|
|
P |
|
|
, где |
|
открытое |
r |
. Под кусочно- |
|
ограниченное и замкнутое множество (компакт) в пространстве R |
непрерывными функциями будем понимать функции, имеющие лишь конечное число разрывов первого рода. Считаем, что управления u = u(t) (допустимые управления) составляют класс D векторных кусочно-непрерывных на интервале T0 функций со значениями в U , т.е. u(t) 2 U при 8t 2 T0. При сделанных предположениях для
любой точки (t; x) 2 T0 существует единственное решение задачи Коши системы
(1) с начальным условием x(t) = x при произвольном допустимом управлении. Пусть M0 открытое ограниченное множество, содержащееся в , а M0 его
замыкание. Будем предполагать, что при любом управлении u 2 D решение
x = x(t; x0; u); |
(2) |
такое, что x = x0 при t = t0, определено на всем интервале T0 при любом x0 2 M0. Таким образом, каждому управлению u = u(t) можно сопоставить согласно си-
стеме (1) семейство траекторий x(t) = x(t; x0; u), отвечающих различным начальным
условиям x(t0) = x0; x0 2 M0. Это семейство траекторий, исходящих из множества
M0 (или из M0), будем называть пучком траекторий, соответствующих управлению u = u(t), или просто пучком.
Пусть Mt;u образ множества M0 в силу системы (1) при управлении u = u(t) в момент t, т.е.
Mt;u = fxt = x(t; x0; u) : x0 2 M0g:
Множество Mt;u и соответственно множество Mt;u для пучка траекторий, исходящего
из M0, будем называть сечением пучка траекторий, соответствующих управлению
u = u(t) в момент t. Сечения Mt;u, t 2 T0, являются компактными множествами. Действительно, при сделанных предположениях решения системы (1) непрерывны и непрерывно дифференцируемы по начальным данным [?, ?]. Поэтому преобразование множества M0 в множество Mt;u, определяемое траекториями (1), является непрерывным, более того, непрерывно дифференцируемым. Следовательно, из компактности множества M0 вытекает компактность множества Mt;u. При этом граница @M0 множества M0 переходит в границу @Mt;u множества Mt;u. Положительность меры сечения Mt;u следует из положительности меры множества M0 и равенств
ZZ
mes(Mt;u) = |
Mt;u dxt = |
M0 |
det(@x(t; x0 |
; u)=@x0) dx0; |
|
|
|
|
|
125

где det(@x(t; x0; u)=@x0) якобиан указанного преобразования, представимый по формуле Лиувилля [?] в виде
det |
@x00 |
|
t |
Sp |
@x0 |
|
d : |
; u) |
= exp Zt0 |
|
|||||
|
(@x(t; x |
|
|
(@f( ; x( ; x0 |
; u); u( )) |
||
|
|
|
|
|
|
|
|
Здесь Sp(@f=@x) след матрицы Якоби, при этом Sp(@f=@x) = divxf. Под мерой множества M 2 Rn подразумевается его лебегова мера mes(M).
Уравнение переноса. Рассмотрим уравнение (2). При t = t0 имеем x = x0 и якобиан det (@x(t; x0; u)=@x0) = 1. Следовательно, по теореме о неявных функциях уравнение (2) определяет неявную n-вектор-функцию:
x0 = q(t; x; u): |
(3) |
Функции qi(t; x; u), i = 1; n, являются первыми интегралами системы (1), непрерывно дифференцируемыми по t и x в некоторой окрестности точки (t0; x0).
Множество T0;u 2 T0 мы определили следующим образом:
T0;u = f(t; x) : t 2 T0; x 2 Mt;ug:
Предположим, что при 8u 2 D вектор-функция q(t; x; u) определена при всех (t; x) 2 T0;u и вместе с производными по t и x непрерывна по переменной x и кусочнонепрерывна по t. Фиксируем некоторую точку (t; x) 2 T0;u. Множество точек x0
таких, что траектории (2), исходящие при t = t0 из точек x0, в момент t = t t0 попадает в некоторую "-окрестность S"(x) точки x. Обозначим это множество точек через
G = fx0 : x(t; x0; u) 2 S"(x); x0 2 M0g:
Введем функцию |
ZG 0(x0)dx0; |
|
m(t; x; ") = mes(S"(x)) 1 |
(4) |
где mes(S"(x)) мера (объем) окрестности S"(x); 0(x) 2 C1(M0) неотрицательная функция. Будем считать, что функция 0(x) есть плотность распределения частиц (массы, заряда) в пространстве M0 в момент t0. Тогда под плотностью распределения частиц в точке x 2 Mt;u в момент t будем понимать предел
|
|
|
|
|
|
|
|
|
(5) |
(t; |
x |
) = lim m(t; |
x; "): |
||||||
"!0 |
|
|
|
|
|
Так определённую на T0;u функцию (t; x) будем называть плотностью распределения (частиц) в силу системы (1). При этом, как мы видим, функция (t; x) определяется системой (1) при заданной начальной плотности распределения (t0; x) = 0(x). Не исключается случай M0 = = Rn. Найдем уравнение, которому удовлетворяет функция (t; x). С этой целью сделаем в интеграле (4) замену переменных по формуле (3). Подставив полученное выражение в (5), получим
( |
|
|
|
) = !0 |
S"(x) ZS"(x) |
0 |
|
|
|
@x |
|
(6) |
|||
|
t; |
x |
lim mes |
1 |
|
|
|
|
(q( |
t; x; u)) det |
@x0 |
dx; |
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
126

причем по формуле Лиувилля
det |
@x0 |
|
= exp Zt |
t0 |
: |
|
divxf ; x( ; x0; u); u( ) d |
||||||
|
@x |
|
|
|
|
|
Перейдем в (6) к пределу. Учитывая произвольность выбора точки (t; x) 2 T0;u и
обозначая ее в дальнейшем через (t; x), получаем 8x0 2 M0 |
: |
|
|
(t; x) = 0 |
q(t; x; u) exp Zt0t divxf ; x( ; x( ; q(t; x; u)); u); u( ) d |
(7) |
|
или |
|
; u); u( ) d : |
|
t; x(t; x0; u) = 0(x0) exp Zt0t divxf ; x( ; x0 |
(8) |
Дифференцируя (8) по t вдоль траекторий (2), т.е. в силу системы (1), приходим к уравнению
|
|
d ( dt |
( )) (1) |
= t; x(t) divxf |
|
t; x(t); u(t) ; |
(9) |
|||||||
|
|
|
|
t; x t |
|
|
|
|
|
|
|
|||
|
@ (t; x) |
@ (t; x) |
|
|
|
|
|
|
||||||
или |
|
|
|
|
f t; x; u(t) + (t; x)divxf t; x; u(t) = 0 |
|
||||||||
|
|
|
1+ |
|
|
|
|
(10) |
||||||
|
@t |
|
@x |
|
|
|||||||||
(уравнению переноса) |
при начальном условии |
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
(t0; x) = 0(x): |
|
|
(11) |
По построению определяемая равенством (7) функция (t; x) 2 C1( T0;u) является решением уравнения (10) с начальным условием (11).
Рассмотрим произвольную область Gt0 M0, в частности возможен случай Gt0 = M0. Пусть Gt;u есть образ множества Gt0 в момент t в силу системы (1). Рассмотрим
R
интеграл Gt;u (t; xt)dxt и вычислим его производную по t. Используя равенства (8), (9), находим
d Z Z
(t; xt)dxt =
dt Gt;u Gt;u
откуда следует
Z Z
(t; xt)dxt =
Gt;u Gt0
!
d
+ divxf dxt = 0
dt (1)
0(x0)dx0; t 2 T0: |
(12) |
Определение 1 Будем говорить, что система (1) имеет интегральный инвариант порядка n при управлении u = u(t), если для некоторой неотрицательной скалярной функции (t; x) 2 C1( T0;u) выполняется равенство (12) для любой области
Gt0 M0.
Итак, если (t; x) есть неотрицательное решение уравнения (10), то система (1) имеет интегральный инвариант порядка n (функцию (t; x) называют ядром или плотностью интегрального инварианта [?]). В физическом аспекте равенство (12)
1Уравнение (10) называют также обобщенным уравнением Лиувилля или уравнением Лиувилля [?], когда система (1) выписана в канонических сопряженных переменных, при этом divxf(t; x; u) = 0.
127

можно понимать как сохранение массы (заряда) частиц вдоль траекторий системы (1).
Пусть семейство фазовых траекторий (2) соответствует множеству случайных начальных значений координат с плотностью распределения вероятности 0(x), причём
R
M0 0(x0)dx0 = 1. Функцию (t; x) можно понимать как изменение плотности распределения вероятности во времени и фазовом пространстве координат динамической системы (1). (Уравнение (10) в этом случае называют уравнением Фоккера–Планка– Колмогорова [?].)
Постановка задачи оптимального управления пучком траекторий. Пусть заданы неотрицательные функции '(t; x; ) 2 C1(T0 R1), g(x; ) 2 C1( ; R1) и0 2 C1(M0). Введем заданные на сечениях пучка траекторий функционалы
Z T Z
I1(u) =
t0 Mt;u
' t; xt; (t; xt) dxtdt + ZMT;u g |
|
xT ; (T; xT ) dxT ; |
(13) |
|
|
|
|
|
и
2 |
(u) = |
t2T N T0 |
x2Mt;u |
|
|
(14) |
I |
max |
max ' |
|
t; x; (t; x) ; |
|
характеризующие качество управляемого процесса (динамику частиц). В силу сказанного ранее функции '(t; x; ) и g(x; ) интегрируемы по Лебегу на сечениях Mt;u и повторный интеграл в функционале (13) существует.
Задачу минимизации функционала (13) (или (14)) по управлениям u 2 D будем называть задачей программного управления пучком траекторий с учетом плотности их распределения. Управление u0 = u0(t), доставляющее минимум функционалу (13) (или (14)), будем называть оптимальным управлением по отношению к функционалу (13) (соответственно (14)).В случае, когда функционалы (13), (14) заданы только на выходном сечении MT;u, т.е. когда в функционале (13) ' 0 или в функционале (14) T N = T , сформулированную задачу оптимального управления для функционалов (13), (14) будем называть задачей терминального управления пучком траекторий с учетом плотности их распределения. Под оптимальным процессом
будем понимать оптимальное управление и соответствующие оптимальный пучок траекторий и их оптимальную плотность распределения. Вариацию u = u(t) управления u = u(t) будем называть допустимой, если управление u + u 2 D.
Функционалы (13), (14) в зависимости от выбора ' и g могут иметь разный физический смысл. Так, если ' 0 и g = jx xj2 (T; x), то функционал (13) характеризует среднеквадратичное отклонение пучка частиц в момент T от заданного состояния с весом (T; x), равным плотности распределения частиц. При ненулевой функции ' функционал (13) отражает не только конечное, но и текущее состояние пучка. Функционал (14) в отличие от функционала (13), характеризующего динамику пучка частиц в среднем, оценивает управляемый процесс по “наихудшим” частицам, т.е. частицам, которые доставляют в некоторые моменты t 2 T N наибольшее значение функции на соответствующих сечениях пучка. Так, при ' = jx xj функционал (14) определяет частицы, максимально отклонившиеся от заданного состояния x на сечениях Mt;u, t 2 T N. Если же ' = jx xj (t; x), то учитывается не только удаление частиц от x, но и их плотность распределения, играющая роль весомой функции. Если ' = ( (t; x) (t; x))2, то функционалы (13), (14) оценивают отклонение (t; x) от заданной плотности (t; x).
128

Обозначим через x^ = (x1; x2; : : : ; xk), 1 k n. Рассмотрим функцию
'(t; x) = |
0 |
(t))2 |
r (t); |
(15) |
|
(r |
(t; x) r > (t); |
|
r = (^x ; x^)1=2:
Функции такого типа называют штрафными. Они позволяют учесть ограничения, накладываемые на фазовые переменные. Так, в данном случае при невыполнении условия r (t) функционалы (13), (14) с функцией (15) будут оценивать меру нарушения предыдущего неравенства. Минимизируя эти функционалы, мы тем самым будем стремиться выполнить фазовые ограничения r (t).
Наряду с функционалами (13), (14) можно рассматривать и другие, такого же ти-
па. Пусть k проекция множества на подпространство Rk переменных x1; x2; : : : ; xk; k n, а Ik матрица размерностью k n следующего вида:
0 0 1 : : : 0 |
0 : : : 0 |
1 |
|
|||||||||
Ik = B |
1 0 : : : 0 |
0 : : : 0 |
C |
|
||||||||
|
|
: |
||||||||||
B |
0 0 : : : 1 |
0 : : : 0 |
C |
|
||||||||
B |
|
|
|
|
|
|
|
|
|
|
C |
|
B |
|
|
|
|
|
|
|
|
|
|
C |
|
@ | |
|
{z |
|
} |
| |
|
{z |
|
} |
A |
|
kn k
Тогда x^ = Ikx,x 2 n . Предположим, что заданы некоторые множества Gt k, t 2 [t0; T ], и управляемый процесс необходимо построить так, чтобы выполнялись включения x^t = Ikxt 2 Gt, 8xt 2 Mt;u, т.е. IkMt;u Gt при t 2 [t0; T ] или t 2 T N. При этом на Gt задана некоторая желаемая плотность распределения частиц (t; x). Для достижения указанной цели можно минимизировать функционалы
I3(u) = Zt0T ZGt ZMt;u |
' t; xt; y^t; (t; xt); |
|
(t; y^t) dxtdy^tdt; |
(16) |
||||||||||||
|
||||||||||||||||
|
4 |
( |
|
) = t2T N y^t2Gt |
xt2Mt;u |
|
t |
^t |
( |
|
t) |
|
( ^t) |
(17) |
||
I |
|
|
u |
max max |
min |
' |
t; x |
; y |
; |
t; x |
|
; |
|
t; y ; |
|
где функция ' может быть задана, например, в виде ' = 'i, i = 1; 4; '1 = (Ikxt y^t)2;
'2 = '1 (t; xt) (t; y^t); '3 = ( (t; xt) (t; y^t))2; '4 = '1'3.
Следует отметить, что выбор функционала существенно влияет на решение поставленной физической задачи, так как именно выбором функционала мы заканчиваем формализацию той или иной физической задачи управления и переходим к непосредственному ее решению.
В заключение укажем дальнейшие возможные обобщения функционалов, задаваемых на сечениях пучка траекторий. Рассмотрим функционал вида
I(u) = ( ks(1;1); : : : ; ksi;j; : : : ; ksn;n); |
(18) |
где функция параметров i;jks, являющихся моментами порядков k; s координат xi; xj вектора xt:
Z
(ksi;j) = (xi xi)k(xj xj)s (t; xt)dxt; (19)
Mt;u
i; j = 1; n; j i:
129

Здесь xi; i = 1; n, средние значения координат xi:
Z
xi = xi (t; xt)dxt: (20)
Mt;u
Функционалы вида (18) являются функциями функционалов, заданных на сечениях пучка.
130