ТУ - лекции Овсянникова / 30.Управление пучком траекторий
.pdfВ физическом аспекте равенство (12) можно понимать как сохранение массы (заряда) частиц вдоль траекторий системы (1).
Пусть семейство фазовых траекторий (2) соответствует множеству случайных начальных значений координат с плотностью распределения веро-
R
ятности 0(x), причем M0 0(x0)dx0 = 1. Функцию (t; x) можно понимать как изменение плотности распределения вероятности во времени и фазовом пространстве координат динамической системы (1). (Уравнение (10) в этом случае называют уравнением Фоккера–Планка–Колмогорова.)
135
Постановка задачи оптимального управления пучком траекторий. Пусть заданы неотрицательные функции '(t; x; ) 2 C1(T0 R1), g(x; ) 2 C1( ; R1) и 0 2 C1(M0). Введем заданные на сечениях пучка траекторий функционалы
I1(u) = Zt0T ZMt;u ' t; xt; (t; xt) dxtdt + ZMT;u g xT ; (T; xT ) dxT ; |
(13) |
||||
и |
t2T N T0 |
x2Mt;u |
|
|
(14) |
2 |
|||||
I (u) = |
max |
max ' |
|
t; x; (t; x) ; |
|
характеризующие качество управляемого процесса (динамику частиц). В силу сказанного ранее функции '(t; x; ) и g(x; ) интегрируемы по Лабегу на сечениях Mt;u и повторный интеграл в функционале (13) существует.
Задачу минимизации функционала (13) (или (14)) по управлениям
u 2 D будем называть задачей программного управления пучком траекторий с учетом плотности их распределения.
136
Управление u0 = u0(t), доставляющее минимум функционалу (13) (или (14)), будем называть оптимальным управлением по отношению к функционалу (13) (соответственно (14)).В случае, когда функционалы (13), (14) заданы только на выходном сечении MT;u, т.е. когда в функционале (13) ' 0 или в функционале (14) T N = T , сформулированную задачу оптимального управления для функционалов (13), (14) будем называть задачей терминального управления пучком траекторий с учетом плотности их распределения. Под оптимальным процессом будем понимать оптимальное управление и соответствующие оптимальный пучок траекторий и их оптимальную плотность распределения. Вариацию u = u(t) управления u = u(t) будем называть допустимой, если управление u + u 2 D.
Функционалы (13), (14) в зависимости от выбора ' и g могут иметь разный физический смысл. Так, если ' 0 и g = jx xj2 (T; x), то функционал (13) характеризует среднеквадратичное отклонение пучка частиц в момент T от заданного состояния с весом (T; x), равным плотности распределения частиц. При ненулевой функции ' функционал (13) отражает не только конечное, но и текущее состояние пучка.
137
Функционал (14) в отличие от функционала (13), характеризующего динамику пучка частиц в среднем, оценивает управляемый процесс по “наихудшим” частицам, т.е. частицам, которые доставляют в некоторые моменты t 2 T N наибольшее значение функции на соответствующих сечениях пучка. Так, при ' = jx xj функционал (14) определяет частицы, максимально отклонившиеся от заданного состояния x на сечениях Mt;u, t 2 T N. Если же ' = jx xj (t; x), то учитывается не только удаление частиц от x, но и их плотность распределения, играющая роль весомой функции. Если ' = ( (t; x) (t; x))2, то функционалы (13), (14) оценивают отклонение(t; x) от заданной плотности (t; x).
Обозначим через x^ = (x1; x2; : : : ; xk), 1 k n. Рассмотрим функцию
'(t; x) = |
(r |
(t))2 (t; x) r > (t); |
|
0 |
r (t); |
(15) |
r = (^x ; x^)1=2:
Функции такого типа называют штрафными.
138
Они позволяют учесть ограничения, накладываемые на фазовые переменные. Так, в данном случае при невыполнении условия r (t) функционалы (13), (14) с функцией (15) будут оценивать меру нарушения предыдущего неравенства. Минимизируя эти функционалы, мы тем самым будем стремиться выполнить фазовые ограничения r (t).
Наряду с функционалами (13), (14) можно рассматривать и другие, такого же типа. Пусть k проекция множества на подпространство Rk переменных x1; x2; : : : ; xk; k n, а Ik матрица размерностью k n следующего вида:
0 0 1 : : : 0 0 : : : 0 |
1 |
|
||||||||||
Ik = B |
1 0 : : : 0 0 : : : 0 |
C |
|
|||||||||
|
: |
|||||||||||
B |
0 0 : : : 1 |
0 : : : 0 |
C |
|
||||||||
B |
|
|
|
|
|
|
|
|
|
|
C |
|
|
|
k |
|
n k |
|
|||||||
B |
| {z } |
|
|
|
C |
|
||||||
@ |
| {z } |
A |
|
Тогда x^ = Ikx,x 2 n . Предположим, что заданы некоторые множества Gt k, t 2 [t0; T ], и управляемый процесс необходимо построить так,
139
чтобы выполнялись включения x^t = Ikxt 2 Gt, 8xt 2 Mt;u, т.е. IkMt;u Gt при t 2 [t0; T ] или t 2 T N. При этом на Gt задана некоторая желаемая плотность распределения частиц (t; x). Для достижения указанной цели можно минимизировать функционалы
I3(u) = Zt0T ZGt ZMt;u |
' t; xt; y^t; (t; xt); |
|
(t; y^t) dxtdy^tdt; |
(16) |
||||
|
||||||||
I4(u) = t2T N |
y^t2Gt |
xt2Mt;u |
' t; xt; yt; (t; xt); |
|
t |
(17) |
||
max |
max |
min |
^ |
|
|
|
(t; y^ ) ; |
|
где функция ' может быть задана, например, в виде ' = 'i, i = 1; 4;
'1 = (Ikxt y^t)2; '2 = '1 (t; xt) (t; y^t); '3 = ( (t; xt) (t; y^t))2; '4 = '1'3. Следует отметить, что выбор функционала существенно влияет на решение поставленной физической задачи, так как именно выбором функционала мы заканчиваем формализацию той или иной физической задачи
управления и переходим к непосредственному ее решению.
140
В заключение укажем дальнейшие возможные обобщения функционалов, задаваемых на сечениях пучка траекторий. Рассмотрим функционал вида
I(u) = ( ks(1;1); : : : ; ksi;j; : : : ; ksn;n); |
(18) |
где функция параметров i;jks, являющихся моментами порядков k; s координат xi; xj вектора xt:
Z
(ksi;j) = (xi xi)k(xj xj)s (t; xt)dxt; (19)
Mt;u
i; j = 1; n; j i:
Здесь xi; i = 1; n, средние значения координат xi:
Z
xi = xi (t; xt)dxt: (20)
Mt;u
Функционалы вида (18) являются функциями функционалов, заданных на
141
сечениях пучка.
142