Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
15
Добавлен:
16.04.2015
Размер:
290.64 Кб
Скачать

Лекция 30. Параметрическая оптимизация. Необходимые условия оптимальности.

Пучок траекторий. Рассмотрим динамический управляемый процесс, описываемый системой дифференциальных уравнений

dx=dt = f(t; x; u);

(1)

где t независимая переменная, называемая в дальнейшем временем; x n вектор фазовых координат x1; x2; : : : ; xn; u = u(t) r-мерная вектор-функция на интервале T0 = [t0; T ] R1, параметры t0; T фиксированы; f(t; x; u) n-мерная векторфункция. Предполагаем, что f(t; x; u) определена и вместе с частными производ-

ными @f=@x, @divxf=@x (divxf

=

in=1 @fi=@xi) непрерывна по переменным x; u и

 

t

 

T0

 

 

U

 

 

 

множество в Rn, U

кусочно-неперерывна по

 

на

 

 

P

 

 

, где

 

открытое

r

. Под кусочно-

ограниченное и замкнутое множество (компакт) в пространстве R

непрерывными функциями будем понимать функции, имеющие лишь конечное число разрывов первого рода. Считаем, что управления u = u(t) (допустимые управления) составляют класс D векторных кусочно-непрерывных на интервале T0 функций со значениями в U , т.е. u(t) 2 U при 8t 2 T0. При сделанных предположениях для

любой точки (t; x) 2 T0 существует единственное решение задачи Коши системы

(1) с начальным условием x(t) = x при произвольном допустимом управлении. Пусть M0 открытое ограниченное множество, содержащееся в , а M0 его

замыкание. Будем предполагать, что при любом управлении u 2 D решение

x = x(t; x0; u);

(2)

такое, что x = x0 при t = t0, определено на всем интервале T0 при любом x0 2 M0. Таким образом, каждому управлению u = u(t) можно сопоставить согласно си-

стеме (1) семейство траекторий x(t) = x(t; x0; u), отвечающих различным начальным

условиям x(t0) = x0; x0 2 M0. Это семейство траекторий, исходящих из множества

M0 (или из M0), будем называть пучком траекторий, соответствующих управлению u = u(t), или просто пучком.

Пусть Mt;u образ множества M0 в силу системы (1) при управлении u = u(t) в момент t, т.е.

Mt;u = fxt = x(t; x0; u) : x0 2 M0g:

Множество Mt;u и соответственно множество Mt;u для пучка траекторий, исходящего

из M0, будем называть сечением пучка траекторий, соответствующих управлению

u = u(t) в момент t. Сечения Mt;u, t 2 T0, являются компактными множествами. Действительно, при сделанных предположениях решения системы (1) непрерывны и непрерывно дифференцируемы по начальным данным [?, ?]. Поэтому преобразование множества M0 в множество Mt;u, определяемое траекториями (1), является непрерывным, более того, непрерывно дифференцируемым. Следовательно, из компактности множества M0 вытекает компактность множества Mt;u. При этом граница @M0 множества M0 переходит в границу @Mt;u множества Mt;u. Положительность меры сечения Mt;u следует из положительности меры множества M0 и равенств

ZZ

mes(Mt;u) =

Mt;u dxt =

M0

det(@x(t; x0

; u)=@x0) dx0;

 

 

 

 

 

125

где det(@x(t; x0; u)=@x0) якобиан указанного преобразования, представимый по формуле Лиувилля [?] в виде

det

@x00

 

t

Sp

@x0

 

d :

; u)

= exp Zt0

 

 

(@x(t; x

 

 

(@f( ; x( ; x0

; u); u( ))

 

 

 

 

 

 

 

 

Здесь Sp(@f=@x) след матрицы Якоби, при этом Sp(@f=@x) = divxf. Под мерой множества M 2 Rn подразумевается его лебегова мера mes(M).

Уравнение переноса. Рассмотрим уравнение (2). При t = t0 имеем x = x0 и якобиан det (@x(t; x0; u)=@x0) = 1. Следовательно, по теореме о неявных функциях уравнение (2) определяет неявную n-вектор-функцию:

x0 = q(t; x; u):

(3)

Функции qi(t; x; u), i = 1; n, являются первыми интегралами системы (1), непрерывно дифференцируемыми по t и x в некоторой окрестности точки (t0; x0).

Множество T0;u 2 T0 мы определили следующим образом:

T0;u = f(t; x) : t 2 T0; x 2 Mt;ug:

Предположим, что при 8u 2 D вектор-функция q(t; x; u) определена при всех (t; x) 2 T0;u и вместе с производными по t и x непрерывна по переменной x и кусочнонепрерывна по t. Фиксируем некоторую точку (t; x) 2 T0;u. Множество точек x0

таких, что траектории (2), исходящие при t = t0 из точек x0, в момент t = t t0 попадает в некоторую "-окрестность S"(x) точки x. Обозначим это множество точек через

G = fx0 : x(t; x0; u) 2 S"(x); x0 2 M0g:

Введем функцию

ZG 0(x0)dx0;

 

m(t; x; ") = mes(S"(x)) 1

(4)

где mes(S"(x)) мера (объем) окрестности S"(x); 0(x) 2 C1(M0) неотрицательная функция. Будем считать, что функция 0(x) есть плотность распределения частиц (массы, заряда) в пространстве M0 в момент t0. Тогда под плотностью распределения частиц в точке x 2 Mt;u в момент t будем понимать предел

 

 

 

 

 

 

 

 

 

(5)

(t;

x

) = lim m(t;

x; "):

"!0

 

 

 

 

 

Так определённую на T0;u функцию (t; x) будем называть плотностью распределения (частиц) в силу системы (1). При этом, как мы видим, функция (t; x) определяется системой (1) при заданной начальной плотности распределения (t0; x) = 0(x). Не исключается случай M0 = = Rn. Найдем уравнение, которому удовлетворяет функция (t; x). С этой целью сделаем в интеграле (4) замену переменных по формуле (3). Подставив полученное выражение в (5), получим

(

 

 

 

) = !0

S"(x) ZS"(x)

0

 

 

 

@x

 

(6)

 

t;

x

lim mes

1

 

 

 

 

(q(

t; x; u)) det

@x0

dx;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

126

причем по формуле Лиувилля

det

@x0

 

= exp Zt

t0

:

divxf ; x( ; x0; u); u( ) d

 

@x

 

 

 

 

 

Перейдем в (6) к пределу. Учитывая произвольность выбора точки (t; x) 2 T0;u и

обозначая ее в дальнейшем через (t; x), получаем 8x0 2 M0

:

 

(t; x) = 0

q(t; x; u) exp Zt0t divxf ; x( ; x( ; q(t; x; u)); u); u( ) d

(7)

или

 

; u); u( ) d :

 

t; x(t; x0; u) = 0(x0) exp Zt0t divxf ; x( ; x0

(8)

Дифференцируя (8) по t вдоль траекторий (2), т.е. в силу системы (1), приходим к уравнению

 

 

d ( dt

( )) (1)

= t; x(t) divxf

 

t; x(t); u(t) ;

(9)

 

 

 

 

t; x t

 

 

 

 

 

 

 

 

@ (t; x)

@ (t; x)

 

 

 

 

 

 

или

 

 

 

 

f t; x; u(t) + (t; x)divxf t; x; u(t) = 0

 

 

 

 

1+

 

 

 

 

(10)

 

@t

 

@x

 

 

(уравнению переноса)

при начальном условии

 

 

 

 

 

 

 

 

 

 

 

 

 

(t0; x) = 0(x):

 

 

(11)

По построению определяемая равенством (7) функция (t; x) 2 C1( T0;u) является решением уравнения (10) с начальным условием (11).

Рассмотрим произвольную область Gt0 M0, в частности возможен случай Gt0 = M0. Пусть Gt;u есть образ множества Gt0 в момент t в силу системы (1). Рассмотрим

R

интеграл Gt;u (t; xt)dxt и вычислим его производную по t. Используя равенства (8), (9), находим

d Z Z

(t; xt)dxt =

dt Gt;u Gt;u

откуда следует

Z Z

(t; xt)dxt =

Gt;u Gt0

!

d

+ divxf dxt = 0

dt (1)

0(x0)dx0; t 2 T0:

(12)

Определение 1 Будем говорить, что система (1) имеет интегральный инвариант порядка n при управлении u = u(t), если для некоторой неотрицательной скалярной функции (t; x) 2 C1( T0;u) выполняется равенство (12) для любой области

Gt0 M0.

Итак, если (t; x) есть неотрицательное решение уравнения (10), то система (1) имеет интегральный инвариант порядка n (функцию (t; x) называют ядром или плотностью интегрального инварианта [?]). В физическом аспекте равенство (12)

1Уравнение (10) называют также обобщенным уравнением Лиувилля или уравнением Лиувилля [?], когда система (1) выписана в канонических сопряженных переменных, при этом divxf(t; x; u) = 0.

127

можно понимать как сохранение массы (заряда) частиц вдоль траекторий системы (1).

Пусть семейство фазовых траекторий (2) соответствует множеству случайных начальных значений координат с плотностью распределения вероятности 0(x), причём

R

M0 0(x0)dx0 = 1. Функцию (t; x) можно понимать как изменение плотности распределения вероятности во времени и фазовом пространстве координат динамической системы (1). (Уравнение (10) в этом случае называют уравнением Фоккера–Планка– Колмогорова [?].)

Постановка задачи оптимального управления пучком траекторий. Пусть заданы неотрицательные функции '(t; x; ) 2 C1(T0 R1), g(x; ) 2 C1( ; R1) и0 2 C1(M0). Введем заданные на сечениях пучка траекторий функционалы

Z T Z

I1(u) =

t0 Mt;u

' t; xt; (t; xt) dxtdt + ZMT;u g

 

xT ; (T; xT ) dxT ;

(13)

 

 

 

 

и

2

(u) =

t2T N T0

x2Mt;u

 

 

(14)

I

max

max '

 

t; x; (t; x) ;

 

характеризующие качество управляемого процесса (динамику частиц). В силу сказанного ранее функции '(t; x; ) и g(x; ) интегрируемы по Лебегу на сечениях Mt;u и повторный интеграл в функционале (13) существует.

Задачу минимизации функционала (13) (или (14)) по управлениям u 2 D будем называть задачей программного управления пучком траекторий с учетом плотности их распределения. Управление u0 = u0(t), доставляющее минимум функционалу (13) (или (14)), будем называть оптимальным управлением по отношению к функционалу (13) (соответственно (14)).В случае, когда функционалы (13), (14) заданы только на выходном сечении MT;u, т.е. когда в функционале (13) ' 0 или в функционале (14) T N = T , сформулированную задачу оптимального управления для функционалов (13), (14) будем называть задачей терминального управления пучком траекторий с учетом плотности их распределения. Под оптимальным процессом

будем понимать оптимальное управление и соответствующие оптимальный пучок траекторий и их оптимальную плотность распределения. Вариацию u = u(t) управления u = u(t) будем называть допустимой, если управление u + u 2 D.

Функционалы (13), (14) в зависимости от выбора ' и g могут иметь разный физический смысл. Так, если ' 0 и g = jx xj2 (T; x), то функционал (13) характеризует среднеквадратичное отклонение пучка частиц в момент T от заданного состояния с весом (T; x), равным плотности распределения частиц. При ненулевой функции ' функционал (13) отражает не только конечное, но и текущее состояние пучка. Функционал (14) в отличие от функционала (13), характеризующего динамику пучка частиц в среднем, оценивает управляемый процесс по “наихудшим” частицам, т.е. частицам, которые доставляют в некоторые моменты t 2 T N наибольшее значение функции на соответствующих сечениях пучка. Так, при ' = jx xj функционал (14) определяет частицы, максимально отклонившиеся от заданного состояния x на сечениях Mt;u, t 2 T N. Если же ' = jx xj (t; x), то учитывается не только удаление частиц от x, но и их плотность распределения, играющая роль весомой функции. Если ' = ( (t; x) (t; x))2, то функционалы (13), (14) оценивают отклонение (t; x) от заданной плотности (t; x).

128

Обозначим через x^ = (x1; x2; : : : ; xk), 1 k n. Рассмотрим функцию

'(t; x) =

0

(t))2

r (t);

(15)

 

(r

(t; x) r > (t);

 

r = (^x ; x^)1=2:

Функции такого типа называют штрафными. Они позволяют учесть ограничения, накладываемые на фазовые переменные. Так, в данном случае при невыполнении условия r (t) функционалы (13), (14) с функцией (15) будут оценивать меру нарушения предыдущего неравенства. Минимизируя эти функционалы, мы тем самым будем стремиться выполнить фазовые ограничения r (t).

Наряду с функционалами (13), (14) можно рассматривать и другие, такого же ти-

па. Пусть k проекция множества на подпространство Rk переменных x1; x2; : : : ; xk; k n, а Ik матрица размерностью k n следующего вида:

0 0 1 : : : 0

0 : : : 0

1

 

Ik = B

1 0 : : : 0

0 : : : 0

C

 

 

 

:

B

0 0 : : : 1

0 : : : 0

C

 

B

 

 

 

 

 

 

 

 

 

 

C

 

B

 

 

 

 

 

 

 

 

 

 

C

 

@ |

 

{z

 

}

|

 

{z

 

}

A

 

kn k

Тогда x^ = Ikx,x 2 n . Предположим, что заданы некоторые множества Gt k, t 2 [t0; T ], и управляемый процесс необходимо построить так, чтобы выполнялись включения x^t = Ikxt 2 Gt, 8xt 2 Mt;u, т.е. IkMt;u Gt при t 2 [t0; T ] или t 2 T N. При этом на Gt задана некоторая желаемая плотность распределения частиц (t; x). Для достижения указанной цели можно минимизировать функционалы

I3(u) = Zt0T ZGt ZMt;u

' t; xt; y^t; (t; xt);

 

(t; y^t) dxtdy^tdt;

(16)

 

 

4

(

 

) = t2T N y^t2Gt

xt2Mt;u

 

t

^t

(

 

t)

 

( ^t)

(17)

I

 

 

u

max max

min

'

t; x

; y

;

t; x

 

;

 

t; y ;

 

где функция ' может быть задана, например, в виде ' = 'i, i = 1; 4; '1 = (Ikxt y^t)2;

'2 = '1 (t; xt) (t; y^t); '3 = ( (t; xt) (t; y^t))2; '4 = '1'3.

Следует отметить, что выбор функционала существенно влияет на решение поставленной физической задачи, так как именно выбором функционала мы заканчиваем формализацию той или иной физической задачи управления и переходим к непосредственному ее решению.

В заключение укажем дальнейшие возможные обобщения функционалов, задаваемых на сечениях пучка траекторий. Рассмотрим функционал вида

I(u) = ( ks(1;1); : : : ; ksi;j; : : : ; ksn;n);

(18)

где функция параметров i;jks, являющихся моментами порядков k; s координат xi; xj вектора xt:

Z

(ksi;j) = (xi xi)k(xj xj)s (t; xt)dxt; (19)

Mt;u

i; j = 1; n; j i:

129

Здесь xi; i = 1; n, средние значения координат xi:

Z

xi = xi (t; xt)dxt: (20)

Mt;u

Функционалы вида (18) являются функциями функционалов, заданных на сечениях пучка.

130

Соседние файлы в папке Лекции по ТУ