ТУ - лекции Овсянникова / 30.Управление пучком траекторий
.pdfЛекция 30. Управление пучком траекторий.
Пучок траекторий. Рассмотрим динамический управляемый процесс, описываемый системой дифференциальных уравнений
dx=dt = f(t; x; u); |
(1) |
где t независимая переменная, называемая в дальнейшем временем;
x n-мерный вектор фазовых координат x1; x2; : : : ; xn; u = u(t) r-мерная вектор-функция на интервале T0 = [t0; T ] R1, параметры t0; T фиксированы; f(t; x; u) n-мерная вектор-функция. Предполагаем, что f(t; x; u) определена и вместе с частными производными @f=@x, @divxf=@x
(divxf = Pni=1 @fi=@xi) непрерывна по переменным x; u и кусочнонеперерывна по t на T0 U, где открытое множество в Rn,
U ограниченное и замкнутое множество (компакт) в пространстве Rr. Под кусочно-непрерывными функциями будем понимать функции, име-
ющие лишь конечное число разрывов первого рода.
125
Считаем, что управления u = u(t) (допустимые управления) составляют класс D векторных кусочно-непрерывных на интервале T0 функций со значениями в U , т.е. u(t) 2 U при 8t 2 T0. При сделанных предположениях для любой точки (t; x) 2 T0 существует единственное решение задачи Коши системы (1) с начальным условием x(t) = x при произвольном допустимом управлении.
Пусть M0 открытое ограниченное множество, содержащееся в , а M0 его замыкание. Будем предполагать, что при любом управлении u 2 D решение
x = x(t; x0; u); |
(2) |
такое, что x = x0 при t = t0, определено на всем интервале T0 при любом
x0 2 M0.
Таким образом, каждому управлению u = u(t) можно сопоставить согласно системе (1) семейство траекторий x(t) = x(t; x0; u), отвечающих различным начальным условиям x(t0) = x0; x0 2 M0.
126
Это семейство траекторий, исходящих из множества M0 (или из M0), будем называть пучком траекторий, соответствующих управлению u = u(t), или просто пучком.
Пусть Mt;u образ множества M0 в силу системы (1) при управлении u = u(t) в момент t, т.е.
Mt;u = fxt = x(t; x0; u) : x0 2 M0g:
Множество Mt;u и соответственно множество Mt;u для пучка траекторий, исходящего из M0, будем называть сечением пучка траекторий, соответ-
ствующих управлению u = u(t) в момент t. Сечения Mt;u, t 2 T0, являются компактными множествами. Действительно, при сделанных предположениях решения системы (1) непрерывны и непрерывно дифференцируемы по начальным данным. Поэтому преобразование множества M0 в множество
Mt;u, определяемое траекториями (1), является непрерывным, более того, непрерывно дифференцируемым. Следовательно, из компактности множества M0 вытекает компактность множества Mt;u.
127
При этом граница @M0 множества M0 переходит в границу @Mt;u множества Mt;u. Положительность меры сечения Mt;u следует из положительности меры множества M0 и равенств
ZZ
mes(Mt;u) = |
Mt;u dxt = |
M0 |
det(@x(t; x0; u)=@x0) dx0; |
|
|
|
|
|
|
где det(@x(t; x0; u)=@x0) якобиан указанного преобразования, представимый по формуле Лиувилля в виде
det |
@x0 |
= exp |
Z |
t |
Sp |
@x0 |
d : |
t0 |
|||||||
|
(@x(t; x0; u) |
|
|
|
|
(@f( ; x( ; x0; u); u( )) |
|
Здесь Sp(@f=@x) след матрицы Якоби, при этом Sp(@f=@x) = divxf. Под мерой множества M 2 Rn подразумевается его лебегова мера mes(M).
128
Уравнение переноса. Рассмотрим уравнение (2). При t = t0 имеем x = x0 и якобиан det (@x(t; x0; u)=@x0) = 1. Следовательно, по теореме о неявных функциях уравнение (2) определяет неявную n-вектор-функцию:
x0 = q(t; x; u): |
(3) |
Функции qi(t; x; u), i = 1; n, являются первыми интегралами системы (1), непрерывно дифференцируемыми по t и x в некоторой окрестности точки
(t0; x0).
Множество T0;u 2 T0 мы определили следующим образом:
T0;u = f(t; x) : t 2 T0; x 2 Mt;ug:
Предположим, что при 8u 2 D вектор-функция q(t; x; u) определена при всех (t; x) 2 T0;u и вместе с производными по t и x непрерывна по перемен-
ной x и кусочно-непрерывна по t. Фиксируем некоторую точку (t; x) 2 T0;u.
129
Множество точек x0 таких, что траектории (2), исходящие при t = t0 из точек x0, в момент t = t t0 попадает в некоторую "-окрестность S"(x) точки x. Обозначим это множество точек через
G = fx0 : x(t; x0; u) 2 S"(x); x0 2 M0g:
Введем функцию
Z
m(t; x; ") = mes(S"(x)) 1 0(x0)dx0; (4)
G
где mes(S"(x)) мера (объем) окрестности S"(x); 0(x) 2 C1(M0) неотрицательная функция. Будем считать, что функция 0(x) есть плотность распределения частиц (массы, заряда) в пространстве M0 в момент t0. Тогда под плотностью распределения частиц в точке x 2 Mt;u в момент t будем понимать предел
|
|
|
|
|
|
|
|
|
(5) |
(t; |
|
) = lim m(t; |
|
|
|||||
x |
x; "): |
"!0
130
Так определенную на T0;u функцию (t; x) будем называть плотностью распределения (частиц) в силу системы (1). При этом, как мы видим, функция (t; x) определяется системой (1) при заданной начальной плотности распределения (t0; x) = 0(x). Не исключается случай M0 = = Rn. Найдем уравнение, которому удовлетворяет функция (t; x). С этой целью сделаем в интеграле (4) замену переменных по формуле (3). Подставив полученное выражение в (5), получим
(t; x) = !0 |
S"(x) |
S"(x) |
0 |
|
|
@x |
|
|
(6) |
|||||||||||||||
|
|
|
|
|
|
|
|
1 |
|
|
|
Z |
|
|
|
|
@x0 |
|
|
|
||||
|
|
|
|
|
lim mes |
|
|
|
|
|
|
|
|
(q(t; x; u)) det |
|
|
|
dx; |
|
|||||
причем по формуле Лиувилля |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
det |
@x0 |
= exp |
|
t |
t0 |
; x( ; x0; u); u( ) d |
: |
|
||||||||||||||||
divxf |
|
|||||||||||||||||||||||
|
|
|
|
|
@x |
|
|
|
Z |
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
131
Перейдем в (6) к пределу. Учитывая произвольность выбора точки
(t; x) 2 T0;u и обозначая ее в дальнейшем через (t; x), получаем 8x0 2 M0:
(t; x) = 0 |
q(t; x; u) exp |
|
t0t divxf |
; x( ; x( ; q(t; x; u)); u); u( ) |
d |
|
|||
|
|
Z |
|
|
|
|
|
(7) |
|
или |
|
|
|
t0t divxf |
; x( ; x0; u); u( ) d |
|
|
(8) |
|
t; x(t; x0; u) = 0(x0) exp |
: |
|
|||||||
|
|
|
Z |
|
|
|
|
|
|
Дифференцируя (8) по t вдоль траекторий (2), т.е. в силу системы (1), при-
ходим к уравнению |
(1) |
= t; x(t) |
|
|
|
|
d ( dt |
divxf |
t; x(t); u(t) |
; |
(9) |
||
t; x(t)) |
|
|
|
|
|
|
|
|
|
132
или |
|
|
|
|
|
|
|
|
|
|
@ (t; x) |
+ |
@ (t; x) |
f |
t; x; u(t) + (t; x)divxf |
t; x; u(t) |
= 0 |
(10) |
|||
|
@t |
|
||||||||
|
1 |
|
|
|
|
|
|
|||
|
|
|
@x |
|
|
|
|
|
||
(уравнению переноса) |
при начальном условии |
|
|
|
|
|||||
|
|
|
|
|
|
(t0; x) = 0(x): |
|
|
|
(11) |
По построению определяемая равенством (7) функция (t; x) |
2 C1( T0;u) |
|||||||||
является решением уравнения (10) с начальным условием (11). |
|
Рассмотрим произвольную область Gt0 M0, в частности возможен случай Gt0 = M0. Пусть Gt;u есть образ множества Gt0 в момент t в силу
R
системы (1). Рассмотрим интеграл Gt;u (t; xt)dxt и вычислим его производ-
1Уравнение (10) называют также обобщенным уравнением Лиувилля или уравнением Лиувилля [?], когда система (1) выписана в канонических сопряженных переменных, при этом divxf(t; x; u) = 0.
133
ную по t. Используя равенства (8), (9), находим
dt |
Z |
Gt;u (t; xt)dxt = |
Gt;u |
dt |
(1) + divxf!dxt = 0 |
||
d |
|
Z |
d |
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
откуда следует
Z Z
(t; xt)dxt = 0(x0)dx0; t 2 T0: (12)
Gt;u Gt0
Определение 1 Будем говорить, что система (1) имеет интегральный инвариант порядка n при управлении u = u(t), если для некоторой неотрицательной скалярной функции (t; x) 2 C1( T0;u) выполняется равенство (12) для любой области Gt0 M0.
Итак, если (t; x) есть неотрицательное решение уравнения (10), то система (1) имеет интегральный инвариант порядка n (функцию (t; x) называют ядром или плотностью интегрального инварианта ).
134