
книги из ГПНТБ / Габасов Р.Ф. Оптимизация линейных систем. Методы функционального анализа
.pdfция F (t, i ) ни при каких t,i |
не является особой матрицей [1], |
|
т. е. на рисунках графики нигде не пересекают |
временную ось. |
|
Приведенная интерпретация |
функции F(t, т) |
позволяет эври |
стически доказать формулу Коши (12). |
|
|
4. Множество достижимости. Управление u(t), t > /с, назо |
||
вем допустимым, если оно кусочно-непрерывно |
(измеримо) и в |
каждый момент t (почти всюду на оси времени) принимает зна'- чения из заданного ограниченного множества U:
|
|
u(t)ÇU, t > t 0. |
(13) |
Пусть |
tu |
^о<Д і< °°,— некоторый фиксированный |
момент |
времени. В |
n-мерном пространстве векторов-выходов |
х линей |
|
ной системы |
(3) рассмотрим множество Q, составленное из по |
ложений в момент t = t \ |
выходов x(t) системы |
(3), |
порожден |
|||||
ных всевозможными допустимыми управлениями при условии, |
||||||||
что |
в |
момент |
t = t0 все |
входы одинаковы. Другими |
словами, |
|||
|
|
Q = |
: X = |
x ( t u x0, «(•)), a(t)ÇU), |
|
|
(14) |
|
где символом x(t, |
х0, и(-)) обозначено решение в момент t урав |
|||||||
нения |
(3) с x ( t 0) — x0, и = «(•) = (и(т), |
Множество Q |
||||||
(14) |
назовем |
множеством достижимости системы |
(3). Для |
пло |
||||
ского |
случая |
( п = 2) множество достижимости изображено |
на |
|||||
рис. 4. |
Выпуклость множества достижимости для систем, линей |
|||||||
|
5. |
ных по управлению. Одно из важнейших свойств множества до стижимости линейных систем состоит в том, что оно выпукло.
Множество X называется выпуклым, если из того, что две
точки Х[, х2 принадлежат этому множеству, следует, |
что и весь |
|||
отрезок, соединяющий |
их, принадлежит множеству X. |
Анали |
||
тически выпуклость |
множества X |
означает, что |
для |
любых |
х и х2 Ç;X и чисел |
|
выполняется условие |
||
Примеры выпуклых множеств даны |
на рис. 5, а. |
Множества, |
||
изображенные на рис. 5, б, очевидно, невыпуклы. |
|
|
||
гг |
5 |
|
|
|
Выпуклое множество X называется строго выпуклым, если его граница не содержит отрезков прямой, т. е. для любых х и х2£Х, хгф х 2, и К 0 < X< 1, выполняется условие: Хл^-іД І—X) хг £\піХ.
Наиболее просто выпуклость множества достижимости до
казывается для случая, |
когда система линейна по управлению |
|||||||
и множество U в (13) выпукло. Действительно, |
пусть х х и х2— |
|||||||
две точки из Q. Следовательно, существуют два допустимых уп |
||||||||
равления Ui(t)£U, u2(i)^U |
таких, что |
траектории хг {і) и х2 {t) |
||||||
системы |
|
|
|
|
|
|
|
|
|
X = А (t) X -f В (t) и (t), |
|
|
(15) |
||||
соответствующие этим управлениям |
(соответственно), |
приходят |
||||||
из х0 в момент t = t x в точки |
х 1и х 2: хг (tu х0, иг ( •)) = хи х 2 {tu а:0, |
|||||||
иЛ')) = х2 - Построим управление |
|
|
|
|
|
|||
U\ {t) = Xj Ui (t ) -f- X2 u2(t), 0 |
Xj, |
X2 |
1, |
Xt + X2 == 1. |
||||
В силу выпуклости множества U управление uX(t) |
при всех |
|||||||
указанных |
значениях Хь |
Х2 |
допустимо: U\ (t) £ U, t >- |
Управле |
||||
нию U\ (t), |
t ^ t 0, в силу |
(15) |
соответствует траектория х\ (t). Из |
|||||
формулы |
Коши (12) при b (и, t) = B(t)u имеем |
|
|
|||||
Хх (*i) = F (tu t0) x0 + |
j /7 (tu т) В (X) их (X) dx = F (ti, t0) x0+ |
|||||||
+ §F {tu x) В (T ) [XXUI (x) + X2 u2(x)] dx = Xj F (tu to) x o+ |
||||||||
+ J F (tu x) В (X) Ui (x) dx |
+ |
X2 F {tu t0) x0 + |
jF(fbx)5(x)«*(x) dx. |
|||||
|
|
|
|
|
|
^0 |
|
|
Обращаясь опять к формуле Коши, видим, что выражения, стоящие в квадратных скобках, равны хД/,) и x 2(tî). Таким образом, для любых Хь Х2
А (/і) — ^іА (t\) “Ь ^ 2 х г (h) — ^іА *f }'2х г-
Это означает, что для любой точки х, лежащей на отрезке, со единяющем две точки множества Q, существует допустимое уп равление, приводящее траекторию системы (15) в точку х. По определению множества Q имеем х Ç Q. Выпуклость множества достижимости для линейной по управлению системы с выпук
лым множеством U доказана. |
систем, нели |
|
6. |
Выпуклость множества достижимости для |
|
нейных по управлению. По существу, выпуклость множества |
||
достижимости систем, линейных по управлению,— это |
простое |
следствие того, что такие системы осуществляют линейное пре образование входных сигналов в выходные. (Более подробно на этом обстоятельстве остановимся в § 2.IV.) Системы же, нели нейные по управлению, преобразуют входные сигналы более сложным образом. Замечательным является то, что, несмотря на нелинейность преобразования и невыпуклость множества Û', за мыкание множества достижимости системы (3)
- ^ - = A ( t ) x + b (и (t), t), и (t)ÇU, dt
всегда выпукло.
Для доказательства понадобятся три вспомогательных ут верждения. Смысл первого из них состоит в следующем.
Если g ( u ) — непрерывная векторная функция векторного аргумента и£ U, то множество Z, образованное точками
ц |
|
2 = I g(u(t))dt, и (t)ÇU, /£[гѴП], |
(16) |
когда в качестве u(t) выбираются всевозможные допустимые уп равления, всегда выпукло.
В самом деле, рассмотрим любые две точки z u z2 множест
ва Z: |
t, |
|
|
|
|
|
|
|
|
|
|
Zt = |
j g (Щ(t)) di; |
Ui (t) Ç.U; t0< |
t < tu / = |
1,2. |
|
Покажем, что элемент |
|
|
|
|
|
А = |
Хх Zj -j- X2 z2> |
0; X2 y> 0; |
Xt + X2 = |
1, |
(17) |
лежащий на отрезке, соединяющем точки z x и z 2, принадлежит
множеству Z. Это, по определению, и будет означать, что Z вы пукло. Положим
«і |
), |
+ (tt - *0), |
Щ |
|
^0 + X, (tt ~ t o X t K t , . |
Управление «х (t) строится из функций их(і), u2(t) следующим образом. Функция U\(t) «сжимается» вдоль временной оси в Х2 раз, и2(і)— в Х2 раз, и «сжатые» функции приставляются друг
Mt)
U,(t)
к другу (рис. 6). Непосредственно из построения видно, что управление их (t) допустимо (т. е. кусочно-непрерывно и прини мает значения из U) для любых Хг и Х2 из (17). Оказывается, что образ управления Ux(t) при отображении (16) совпадает с точкой 2х в (17). Действительно,
j g (их (t)) dt == |
j' g (их (t)) d t + |
J . g (Ux (0) dt = |
^0 |
^0 |
*0~ЬМЛ—U) |
Сделав в первом интеграле замену переменной интегрирования
т = (t — Х2 Q/Xj и во втором — « = (t — X, /t)/X2, получим
t, |
\ |
Л |
j g (И). (0) dt = |
Xi j g- («t (t)) dt + |
X2 J g (u2 (t)) dt = |
Г0 |
*o |
|
|
— XJZJ -j- X2Z2 = |
Zx . |
Таким образом, |
какова бы ни была точка zx отрезка z x z2, |
всегда найдется допустимое управление «х (t), t0^ t ^ . t v образ ко

дорого при отображении (16) совпадает с zx . Выпуклость мно жества Z доказана.
Следует обратить особое внимание на составление функции U\ (t) из «выпуклой комбинации» нового типа. Раньше, следуя обычным представлениям линейного анализа, выпуклая комби
нация |
|
«х (t) = À, «t (t) + Х2 и., (t) |
(18) |
составлялась «поперек оси времени» (рис. 7), теперь же она со ставлена «вдоль оси времени». Здесь существенно используется
специальное свойство оси непрерывного времени. Во всех совре менных работах по теории оптимальных процессов это свойство
имеет принципиальное значение |
(см., |
например, |
определение |
|||||
игольчатой вариации управления, стр. 91). |
(0,1), |
кри |
||||||
Когда |
параметр |
в |
(17) |
пробегает |
интервал |
|||
вая U\ (t) |
(см. рис. 6) |
деформируется от |
u2(t) до |
а |
соот |
|||
ветствующая ей точка |
z\ |
в п -мерном |
|
пространстве движется |
по отрезку, соединяющему точки z\ и z2, от точки г2 к Z\ (рис. 8). Если функция g(u) линейна, то та же картина имеет место и для выпуклой комбинации (18). Однако при нелинейной зависимо
сти |
g(u) это, в общем случае, не так. |
|
|
|
Второе вспомогательное утверждение, необходимое для до |
||
казательства выпуклости |
множества достижимости. |
Пусть |
|
f (и, |
t)— непрерывная по |
своим аргументам вектор-функция. |
Тогда для произвольного допустимого управления u(t),t0^t<^ti,
по заданному |
числу е > |
0 найдется |
такое |
разбиение отрезка |
||||
[tQ, ^і] точками |
|
|
|
|
|
|
||
|
|
^0 — х 0 |
Т1 |
х т - 1 |
<С ~т = |
^1’ |
( 1 9 ) |
|
включающими |
точки |
разрыва управления |
и (t), |
что |
||||
т - 1 |
ту + 1 |
|
|
|
|
|
|
|
2 |
f |
II / (U (t), s ) — f(u (t), T,) Il |
dt < |
S, |
Ту < |
s < Ту j1. (20) |
||
;—n |
J |
|
|
|
|
|
|
|
В самом деле, |
пусть Ѳь . . . . Ѳ*— точки разрыва управления |
|||||||||||
u(t), |
содержащиеся |
в разбиении |
(19). |
Функция |
/ (u(t),s) |
ку |
||||||
сочно-непрерывна по 1 и непрерывна по s на |
[17, |
т/+,] |
и, следо |
|||||||||
вательно, ограничена: Hf(u(t),s) I] <СМ для |
s < /j. Разделим |
|||||||||||
сумму из (20) на две подсуммы, отнеся к Si |
слагаемые, |
со |
||||||||||
держащие |
интегралы по промежуткам, на которых лежат точки |
|||||||||||
разрыва Ѳ( (таких слагаемых |
не более 2 k), а к S2— все осталь |
|||||||||||
ные |
слагаемые. |
|
|
(19) |
настолько |
мелким, |
чтобы т,+1 — |
|||||
Возьмем |
разбиение |
|||||||||||
— ту < г /( 8 Ш) . |
Тогда |
S, < |
2k ■2М • е/ (8/гМ) = г / 2. |
Если |
[т;-, |
|||||||
т -+1] |
участвует |
в S2, то |
функция |
f(u (t), s) непрерывна |
на замк |
нутом квадрате ту<Д, $<Ду+1 и по известной теореме анализа
(теорема |
Кантора) |
равномерно |
непрерывна. Дополнив |
по не |
||||||||||
обходимости |
|
разбиение |
|
(19.) |
|
новыми |
точками, |
получим |
||||||
Иf ( a { t ) , s ) - f ( u ( t ) , т;.) II |
< е/ [2 (tx—£0)] |
для |
х у < /< т у +1, |
|||||||||||
откуда |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
=/)< 2 (ti |
|
|
|
|
e |
|
||
5 2 |
^2 2(#і |
|
|
- |
to) |
|
T |
• |
||||||
Следовательно, при Ty<C,s<; ту+і |
|
|
|
|
|
|
|
|||||||
m~1 |
j |
II /.(a (t), s ) — f ( u (t), Ту) |
|
dt = ß t |
+ S2 < |
|
|
|||||||
/2-0 |
Il |
S. |
|
|||||||||||
т/ |
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Утверждение |
|
доказано. |
|
|
|
|
|
|
|
|
|
|
||
Замечание. Из доказательства оценки (20) следует, что она |
||||||||||||||
не изменится, если к точкам |
(19) добавить конечное число новых |
|||||||||||||
точек дробления отрезка. |
вспомогательное |
|
: |
|
состоит |
|||||||||
Третье, и |
последнее, |
утверждение |
||||||||||||
в следующем. Пусть / (и, |
t) — векторная |
функция, непрерывная |
||||||||||||
по совокупности переменных u£U, |
t £ [ t Q, ty\. |
Тогда замыкание |
||||||||||||
У множества |
|
У, образованного точками |
|
|
|
|
||||||||
|
|
|
|
t, |
|
|
u(t)çU, * € [ * „ , |
|
|
|
||||
|
|
|
2 = p(u(t),t)dt, |
* i ] , |
|
|
||||||||
если и (t) |
пробегает весь класс допустимых управлений, |
всегда |
||||||||||||
выпукло. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Предположим противное: пусть множество У_невыпукло |
||||||||||||||
(рис. 9). |
Тогда |
найдутся |
такие |
точки |
у и |
У2 ÇY |
и |
числа |
||||||
*іЛ £(0, \)Лі + К = 1, что |
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
Ух = КУ\ + h y £ Y - |
|
|
|
(21) |
Следовательно, расстояние от точки |
у\ |
до |
множества |
У не мень |
|||
ше положительного числа |
е, т. е. |
|
|
|
|
|
|
II У — У\ |
II > в для |
всех |
yÇY. |
(22) |
|||
В силу того, что Уі£У, |
і — 1,2, |
найдутся последовательности |
|||||
Уг(1), У?\ • • • >Уіп), |
1, 2, точек |
из |
Y, |
сходящиеся |
к г/;. За |
||
фиксируем номер п, для которого |
|
|
|
|
|||
\\Уі-УІп)\\ < |
- р |
|
* = |
1,2. |
(23) |
Так |
как yln)ÇY, |
то найдутся |
допустимые |
управления |
Ui(t)ÇV, |
||
tÇ [Л)> Уі], такие, |
что |
|
|
|
|
||
|
|
|
t, |
|
|
|
|
|
|
|
y (tn)= j f ( u i ( t ) , t ) d t , i = 1, |
2. |
(24) |
||
Исходя из только что доказанного вспомогательного утвер |
|||||||
ждения для управлений ы,- |
(t), і = 1,2, по заданному числу е/3 |
||||||
можно указать дробление отрезка [f0, |
точками (19), при ко |
||||||
тором для каждого управления и,- (t), |
і = 1, 2, будет выполнять |
||||||
ся оценка (20) |
с заменой в |
на е/3. Пусть точки (19) включают |
|||||
все точки дробления отрезка |
[/о, ^і], построенные для функций |
||||||
Uy(t) |
и u2(t) |
по числу е/3. В силу замечания, сделанного |
ко вто |
||||
рому |
вспомогательному утверждению, |
при |
ту</5 </ху+і |
|
|||
|
Ж |
и/( « / ( 0 .s) —/ ( ц г(/),т.) II Л < |
е |
(25) |
|||
|
j |
— -, / = 1,2. |
Введем точки |
|
|
|
|
|
|
|||
|
|
~ |
т—\ |
у~|-І |
|
|
|
(26} |
|
|
|
& = 2 |
f /(М О , у )^ П |
= |
1,2. |
||||
|
|
|
/= ° |
Т>/ |
|
точек yjn\ определен |
|||
Эти точки уі отстоят от соответствующих |
|||||||||
ных в (24), не более чем на |
е/3. Действительно, в силу (25) |
по |
|||||||
лучаем |
|
|
т - 1 |
X/+ 1 |
|
|
|
|
|
|
У\('•) |
|
|
|
|
|
|
||
|
Уі II |
/-0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
m-I |
x/+I |
|
|
/ («/ (0. y) II dt ( |
|
|
|
|
- |
2 |
M l |
/ («/ (0, 0 - |
— , г = 1,2. |
|
(27> |
|||
|
(=0 |
". |
|
|
|
|
3 |
|
|
На |
отрезке [f0, t %\ построим допустимое |
управление |
iii |
(t): |
|||||
|
ui |
(t) = |
u[n(t), |
t£ \-j, |
- ;+1], j = 0, |
1, . . . . от — 1. |
|
|
Оно составлено из m управлений M (0> определенных на час тичных отрезках (т-, -)+х] следующим образом:
|
|
Ui (' f - M f |
\ |
|
||
,i; |
u[n(t) = |
иі 1, |
*1 |
/ ’ |
(28> |
|
Uo (■ t - h r l+l |
||||||
|
||||||
|
|
2l |
^2 |
|
|
|
Другими |
словами, |
управление и х\t) строится из функций |
||||
Ui (t) |
и и2 (t) |
так же, как управление «х (t) в первом вспомога |
тельном утверждении. Различие состоит лишь в том, что опера
ция «сжатия» применяется |
не на всем отрезке [fo, 0], а на час |
||
тичном [т/> -х/+1].В силу первого |
вспомогательного утвержде |
||
ния |
|
|
|
Г+1 |
ь/+і |
|
Т/"М |
J/ ( ^ ( t ) , |
Xj)d t = l 1 j |
/(MO, ^ )d t + \, j f(u 2(t), ij)d t, |
|
T; |
O |
|
0 |
|
/ = |
0,..., |
m — 1. |
Просуммируем эти равенства по / и учтем определение (26) то чек уг.
т - 1 |
т/ + 1 |
_ |
^ |
2 |
j f (и^> Xj) dt = |
M l + М 2- |
|
Положим |
|
|
|
|
Уі = M i + *■>Уг- |
|
(29> |
, 27
Построим еще одну точку |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
Ух |
- = |
fj |
( u |
x |
( t ) , t ) d t . |
|
|
|
|
(30) |
||||||
Поскольку управление «х (0 |
допустимо, |
то |
точка |
ух принадле |
||||||||||||||||
жит множеству |
У, а значит, и множеству Y. |
Оценим расстояние |
||||||||||||||||||
между точкой |
у х |
, |
определенной по формуле |
(21), |
|
/\ |
||||||||||||||
и точкой г/х . |
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
^ |
|
|
|
|
^ |
|
/ч |
|
Ясно, что |
|
II |
г/х |
— Ух |
II |
< |
II Ух |
— Ух |
II |
+ |
II ух — Ух II |
• Под |
||||||||
ставим |
сюда выражение |
для Ух |
|
и г/х |
из |
(21) |
и |
(29): |
|
|||||||||||
II Ух |
— Ух |
I K |
II |
|
(У і — У\ ) + |
h |
({/г — Уг ) H+ |
II Ух — г/х |
II < |
|||||||||||
< |
II У і |
— |
y \ n)Il |
+ |
h |
й |
У і п) |
~~ |
У*Я + |
|
^2 |
II |
У і |
— |
УІ п)Il |
+ |
||||
|
|
|
+ |
h |
II У 2{п) |
— |
У іII |
+ |
Il |
Ух |
— |
Ух II . |
|
|
|
|||||
В силу (23) и (27) отсюда получаем |
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
II У х — |
УхII |
|
2 |
е + |
II |
- |
|
|
|
II |
• |
|
(31) |
|||||
|
|
< — |
ух — Ух |
|
Оценим величину || г/х — г/х ||. Из (29) и (30) с учетом (26) имеем
— т - 1 ту_|_і m — 1 X/_f_i
II Ух - Ух II = II К 2 |
f /(«» (0- xj ) d t + |
h2 |
f |
(0- y ) d t— |
i=o |
i . |
/=о |
^ . |
|
|
J |
|
j |
|
Здесь использовано определение (28) функции и (р ( t )и сделана
замена переменной интегрирования, примененная ранее при до казательстве первого вспомогательного утверждения.
Учитывая оценку (25), из последнего неравенства получаем
II ух — Ух II < s/3. |
Подставляя эту оценку в (31), |
приходим к |
||
неравенству |
Іі г/х— Ух |
II < е, |
которое противоречит |
предполо |
ж е н и ю ^ ) . |
Таким |
образом, |
доказано и третье утверждение. |
Перейдем, наконец, к основному предложению. Если в си стеме (3) матрица A(t) непрерывна (кусочно-непрерывна) на отрезке [?0, і?і] и векторная функция b (и, t) непрерывна по сво
им аргументам u£U, ££[f0>^i], то замыкание Q множества до стижимости Q выпукло. Этот результат является простым след ствием формулы Коши и предыдущего утверждения.
Действительно, по формуле (12) при t— tx каждый элемент X множества достижимости можно представить в виде
|
и |
|
|
|
|
х = хі + j F ( t u t)b(u(t),t)dt, хх = |
F(tu t0) х0, |
(32) |
|||
где и (t), t £ \ t 0, ti],— допустимое |
управление. Согласно |
доказан |
|||
ному утверждению, |
замыкание |
множества |
|
|
|
У = \у = |
|
(tu t)b (u (t) |
t) dt : и (/)£U, |
(([i0l/,] |
|
I |
<0 |
|
|
|
|
выпукло. Следовательно, и замыкание множества достижимости Q = ^ i + E тоже выпукло.
Важно отметить, что выпуклость множества Q обусловлена присутствием интегрального члена в исходном соотношении (32). Такой же интегральный член присутствует в формуле Коши для любого линейного уравнения с непрерывным временем. Следо вательно, выпуклость замыкания множества достижимости есть общее свойство всех рассматриваемых систем, для которых ре шение можно записать в виде (32), где х х не зависит от управ ления. Поэтому в дальнейшем не будем доказывать выпуклость множества достижимости остальных систем, а лишь ограничим ся доказательством формулы Коши для этих систем.
§ 2. Обыкновенные системы с общим дифференциальным оператором
1. Определение. В приложениях встречаются объекты, опи сываемые системами с производными высших порядков. Про стейшими из них являются линейные дифференциальные урав нения вида
D a (p,t)x(t) = b(u(t),t), |
(1) |
|||
где х = {хи . . . , х п), |
а = { |
и , Л |
0 (*)==£, Da (p,f) = Ep« + |
|
+ А I (0 Pa~ l + |
• • • + |
Ax-i (t) p + |
A a (t), p == |
. |
Уравнение (1) называется обыкновенной системой с общим дифференциальным оператором.