книги из ГПНТБ / Формальский А.М. Управляемость и устойчивость систем с ограниченными ресурсами
.pdf1] ОГРАНИЧЕННЫЕ ПО ВЕЛИЧИНЕ И ИМПУЛЬСУ СИЛЫ Ш
\
и, следовательно, г\ке~АхЬ8 ф О . Следовательно, для вся кого значения индекса s найдется такое значение индек са к, что имеет место соотношение (15.3). Тогда из неравен
ства (15.4) следует, что Т° > a,"+s при всех значениях
ЛІs
s = 1, . . ., г, т. е.
Т ° > Г0 = тах ( - ^ ) . |
(15.5) |
Рассмотрим соотношения (15.2), (15.3) как уравнения относительно вектора e~Axbs. При каждом фиксированном значении индекса s и при к = 1, . . ., п в системе (15.2), (15.3) содержится п уравнений. Строки r\h (к = 1, . . ., п) линейно независимы, следовательно, вектор e~Axbs яв ляется постоянным при всех значениях s. Если вектор e~Axbs не зависит от т, то множество Qs (Т) представляет собой в пространстве Х п отрезок, который «растет» при из
менении Т от 0 до значения xn+s/Ms, а при Т ф xuJ,s/Ms
Г
остается без изменения. Множество Q (Т) == 2 Qs (Т) пред- s=l
ставляет собой при этом многогранник, который не за висит от Т при Т ф То (см. прямоугольник (14.23) для системы (8.20), параллелепипед для системы (14.24)). Отсюда вытекает, что оптимальное время Т° ф Т0, что противоречит неравенству (15.5).
Таким образом, ситуация, описанная соотношения ми (15.2)—(15.4), не может иметь места. Следовательно, в процессе построения векторов г|й на каком-то шаге должен возникнуть первый случай, т. е. для одного из векторов T)Ä управление us (т), максимизирующее инте грал (2.10), определяется однозначно хотя бы для одного значения s. Максимизирующее управление us (т, %.,) имеет вид (5.12).
Предположим, что максимизирующее управление оп
ределяется однозначно при s = |
г. Подставим управление |
||
иг (т, Хо) в соотношение |
(1.6); |
тогда |
получим |
г—1 т |
|
|
|
— I (0) = 2 \ |
e -Axbsus(т) dt, |
(15.6) |
s— 1 0
142 ЗАДАЧИ БЫСТРОДЕЙСТВИЙ tlYl. II
где
Z (0) = |
X (0) + Zr (0), Ir (0) = |
$ е~А% щ . (т, Хо) d r. |
|
|||||
|
|
|
|
О |
|
|
|
|
Для определения функций |
us (т) (s = |
1, . . |
г |
— 1), |
||||
являющихся |
компонентами |
вектора |
и (т) = |
|| us (т) | |
||||
(s = 1, . . |
г) |
оптимального |
управления, |
нужно |
найти |
|||
такие функции us (х) (s = 1, |
. . |
г — |
1), |
которые осу |
||||
ществляют |
равенство (15.6) при |
Т = |
Т°. |
|
|
|
Задачу нахождения таких функций можно свести к предыдущей задаче быстродействия с меньшим на еди ницу числом управляющих воздействий. Действительно, поставим задачу определения минимального времени Т1
и соответствующего управления uj (х) (s = 1, . . ., г — 1), при котором осуществляется равенство (15.6). Равенство (15.6) можно осуществить с помощью допустимых управ лений us (х) (s = 1, . . ., г — 1) при Т Т°, поскольку существует решение исходной задачи быстродействия для системы (1.1). Поэтому решение поставленной задачи
существует, и |
Т1 |
Т°. |
Если Тг <і Т°, то управления |
|
us (х) (s = |
1, . |
. ., г — 1), |
которые осуществляют равен |
|
ство (15.6) |
при |
Т = |
Т°, можно выбрать в виде |
|
|
|
|
|
(15.7) |
|
|
|
|
при |
Функции us (х) |
(s = |
1, . . ., г — 1), осуществляющие ра |
||
венство (15.6) |
при |
Т = |
Г°, можно, очевидно, выбрать |
не только в соответствии с соотношением (15.7). Следова тельно, при 7й < Т° оптимальное управление для систе мы (1.1) не является единственным.
Проводя для новой задачи быстродействия рассуж дения, аналогичные проведенным выше, можно прийти к задаче быстродействия, в которой число управляющих воздействий не более, чем г — 2. Действуя таким образом дальше, можно найти все компоненты us (x) (s = 1, . . ., г) оптимального управления, поскольку г — конечное число.
Из сказанного следует, что оптимальное управление можно найти в классе кусочно-непрерывных функций. Каждая компонента us (т) вектора и (т) = || us (т) ||
И О г р а н и ч е н н ы е по в е л и ч и н е и и м п у л ь с у с и л ы 143
(s = Iх, . . ., г) оптимального управления принимает три значения: —M s, О, M s Задача синтеза этого управления состоит в разбиении пространства Х п+Г поверхностями переключения на области, в которых управление прини мает соответствующие значения. В следующем параграфе приводятся примеры синтеза оптимального управления.
Необходимо отметить, что приведенные выше рассуж дения не дают рецепта для конструктивного определения вектора ц и времени Т°. В каждой конкретной системе определение этих величин представляет собой самостоя тельную задачу.
§ 1 6 . Системы второго порядка. Синтез управления
Рассмотрим следующую |
систему дифференциальных |
|||
уравнений |
второго порядка: |
|
|
|
|
d x 1 |
|
|
|
|
И Г = |
|
|
(16.1) |
|
dxi |
. |
, |
|
|
—— _ vxi |
Ях2 + и. |
|
|
Здесь V и |
Я — постоянные |
величины. |
В системе (16.1) |
содержится только одно управляющее воздействие (г = 1), поэтому индекс s всюду ниже опустим. Можно считать, не ограничивая общности, что М = 1. Система (16.1) при любых значениях параметров ѵ и Я будет, как легко видеть, вполне управляемой (р = 2 ) .
Пусть сначала ѵ = Я = 0. Тогда система (16.1) при обретает вид
(16.2)
Система (16.2) имеет двукратное нулевое собственное значение. С учетом обозначений (12.6) функция це'АхЬ записывается в виде
х\е АхЬ = sin ф — т cos ф. |
(16.3) |
Построим область достижимости Q (Т) системы (16.2)
при Т >. х3 *).
3) В проведении расчетов, необходимых в этом параграфе, принимали участие студепты А. Ершов, В. Трофимов, С. Наумов, Н. Горушкина, В. Карандеев,
144 |
ЗАДАЧИ БЫСТРОДЕЙСТВИЯ |
[ГД. II |
|
|
|
Для того |
чтобы построить область Q (Т), |
вычислим |
по формуле |
(5.17) расстояния d (ц, Т) для всевозможных |
единичных векторов р, иначе говоря, для всевозможных на отрезке длиной 2л значений ф. Для вычисления инте
грала (5.17) необходимо найти |
область интегрирования |
|
Е ( Т , у „). |
Множество Е ( Т ,%0) |
определяется соотноше- |
Г ,5 Ы |
ниями (5.13) и (5.16), в по |
|
|
следнем из которых нужно |
|
|
положить N = х3. |
|
Если ф = |
+ |
я/2, |
то |
|
|
I це~А^Ъ I s |
1. |
При |
этом |
|
|
формула (5.17) для расстоя |
||||
|
ния d (т), Т) превращается |
||||
|
в формулу (5.18), |
которая |
|||
|
дает выражение |
|
|
||
|
d{r\,T) |
= |
xa (16.4) |
||
|
при ф = |
+ я /2 . |
|
||
|
Пусть теперь ср Ф + я /2 . |
||||
|
Найдем область интегриро |
||||
|
вания Е (Т , Хо)- Если ф Ф |
||||
Рис. 16.2. |
Ф Ф л/2, то \х]е~А^Ь\ф const. |
||||
Выражение (16.3) является |
|||||
|
линейной функцией време |
ни, поэтому множество Е (Т, у) является пустым либо со стоит из одного полуинтервала, примыкающего к точке т = 0 или к точке т = Т, либо — из двух полуинтерва лов, один из которых примыкает к точке т = 0, а другой — к точке X = Т. Соотношение (5.16) означает, что вели
чина Хо должна быть выбрана так, чтобы сумма длин интервалов, из которых состоит множество Е (Т, Хо)> была равна xs.
Используя это условие, после элементарных выкладок
получаем, что множество |
Е (Т, у0) |
состоит из полуинтер |
||
вала (рис. 16.1) |
|
|
|
|
Е (Т, хо) |
= |
{Т - |
Т1 |
(16.5) |
при условии, что |
|
|
|
|
tg Ф< |
J |
(Т — Хз), |
(16.6) |
1] |
ОГРАНИЧЕННЫЕ ПО ВЕЛИЧИНЕ И ИМПУЛЬСУ СИЛЫ 145 |
|||||
из двух полуинтервалов (рис. 16.2) |
|
|
||||
|
О, tg ср |
— Y (Т — ж3)| > [18 Ф+ j |
(т — *з), Т |
(16.7) |
||
при |
условии, |
что |
|
|
|
|
|
|
у (Г - х3) < |
tg ф < |
у (7’ + |
х3), |
(16.8) |
из |
одного полуинтервала |
(рис. |
16.3) |
|
|
|
|
|
Е (Т, X») = ІО, *,) |
|
(16.9) |
||
при условии, |
что |
|
|
|
|
|
|
|
|
+ х'і>- |
|
(16.10) |
|
|
|
|
|
|
Рис. 16.3.
Условие (16.6) эквивалентно двум неравенствам:
— -^ < c p < a r c tg y (71— х3), |
(16.11) |
< ф < я + arctg 4 -(71 — х3). |
(16.12) |
Условие (16.8) эквивалентно двум следующим неравен ствам:
arctg -i (Т — х3) < cp < arctg 4 іт + ж3), (16-13)
1
146 ЗАДАЧИ БЫСТРОДЕЙСТВИЯ [ГЛ. II
Условие (16.10) эквивалентно двум следующим неравен ствам:
arclg 4 -(Г + |
і а) < Ф < у2 , |
(16.15) |
л + arct.g (Т + |
х3) 9 < Щ- |
(16.16) |
При условиях (16.11), (16.12) для расстояния d (г\, Т) нз соотношений (5.17), (16.5) получаем выражение
d (г), Т) = d (cp, Т) — |
^ |
I sin ф — х cos ф | dt |
|
Т —х з |
|
= |
Х я |
( Т ------ 1- Х 3 j COS ф — sin ф . (16.17) |
При условиях (16.13), (16.14) из соотношений (5.17),
(16.7) получается |
выражение |
|
tff <р — — |
d ( ц , Т) = d ( ф , Т) = |
Isin ф — Xcos ф I dr |
+Isin cp — Xcos ф I dx
|
t g < p + — (T —Хз) |
|
|
|
(tg ф — 71) sin ф + |
Гг2 _ i - ( T — T3)2 COS ф |
(16.18) |
||
При условиях (16.15), (16.16) из соотношений |
(5.17) |
|||
(16.9) получаем |
|
|
|
|
d(Л, T) = d{ф, Т) = |
|
|
|
|
Х3 |
|
|
|
|
= ^ j sin ф — |
XCOS ф I <іт = х3 SU1 ф ------- Y |
х 3 COS ф . |
(16.19) |
|
Границей |
области |
Q (Т) является |
огибающая |
одно |
параметрического семейства опорных прямых
cos ф + х%sin ф = d (ф, Т). |
(16.20) |
1І ОГРАНИЧЕННЫЕ ПО ВЕЛИЧИНЕ И ИМПУЛЬСУ СИЛЫ 14?
При условии (16.11) все прямые (16.20) проходят через точку с координатами
хг = х3 \Т — Y х3\ , х%= — х3. |
(16.21) |
Рассмотрим теперь условия (16.13). Если продиффе ренцировать соотношение (16.20) по параметру ф, то по лучается выражение
—хг sin ф + х2 cos ф = d' (ф, Т). |
(16.22) |
Из уравнений (16.20), (16.22) получается параметрическое уравнение огибающей семейства опорных прямых
хх = |
d (ф, Т) cos ф — d' (ф, Т) sin ф, |
|
х2 = |
d (ф, Т) sin ф + d' (ф, Т) cos ф. |
(16.23) |
Подставляя в уравнения (16.23) выражение (16.18), по лучаем
*і = |
у 2 - 1 ( Г - * з ) 2] - tg» Ф> |
х2 = |
2tg ф — Т. |
Исключая из этих уравнений параметр ф, получаем урав нение параболы
= | [т '2~ h T ~ Х*У\ - р Ч г 1 -)2• (16-24)
Условиям (16.13) удовлетворяет лишь «кусок» параболы (16.24), один конец которого находится в точке (16.21), а второй в точке с координатами
хг = — уЖз, х2 = х3. |
(16.25) |
Через точку (16.25) проходят все прямые семейства (16.20), удовлетворяющие условиям (16.15). Это легко видеть из выражения (16.19).
При ф = Y уравнение (16.20), как видно из выраже
ния (16.4), приобретает вид
х 2 — а'з- |
(16. 26) |
148 |
ЗАДАЧИ БЫСТРОДЕЙСТВИЯ |
[ГЛ. II |
При условиях (16.12) все прямые (16.20) проходят |
||
через |
точку |
|
|
хх = — х3 [т — у ^ з ), х2 = х3, |
(16.27) |
симметричную относительно начала координат точке
(16.21).
Точки (16.21), (16.25) и симметричные им являются угловыми точками границы Г (Г) области Q (Г). Отрезок прямой (16.26), соединяющий точки (16.25), (16.27),
а также симметричный ему отрезок, представляет собой плоский участок границы Г (Т). При Т = х3 точки (16.25) и (16.27) совпадают; при этом плоский участок
вырождается в точку. |
Q (Т) ограничена |
прямыми |
Таким образом, область |
||
х2 = |
+ ж 3 |
(16.28) |
и симметричными одна другой относительно начала коор динат параболами
х і = dz - Ö |
у 2 |
ХзY |
Х2 —f- Т \2 |
(16.29) |
|
|
|
||||
Граница этой области имеет два плоских участка и че |
|||||
тыре угловые точки. |
При условии Т = |
|
х3 область Q (Т) |
||
является строго |
выпуклой и имеет две |
угловые точки, |
в которых пересекаются параболы (16.29). На рис. 16.4 показаны области Q (Т) при Т = 1, 0; 1,5; 2,0 для
х3 = 1.
Выясним теперь, что представляет собой область уп равляемости Q. В соответствии с результатами, изложен ными в § 8 (теорема 8.1), область Q представляет собой множество точек, расположенных между прямыми (16.28). Кроме того, на прямых (16.28) также есть точки, принад лежащие области Q. Эти выводы следуют непосредственно из результатов настоящего параграфа. Действительно, для всякой точки, лежащей между прямыми (16.28), найдется такое Т, при котором эта точка принадлежит области Q (Т). Формулы (16.21), (16.27) позволяют вы яснить, какие именно точки на прямых (16.28) принадле жат области Q. Точки (16.21), (16.27) принадлежат обла сти Q при всех х3 Т < оо. Следовательно, выражения (16.21), (16.27) являются параметрическими уравнениями
ИОГРАНИЧЕННЫЕ ПО ВЕЛИЧИНЕ И ИМПУЛЬСУ СИЛЫ 149
двух принадлежащих области Q лучей. Эти лучи можно описать также следующими соотношениями:
х2 = — х3; |
(16.30) |
хх^ — -|-ж3, х2 = х3. |
(16.31) |
Представляет определенный интерес сравнение обла стей Q5 (Г), Q5, построенных в настоящем параграфе
с учетом ограничений (1.2), (1.4), с областями ()4 (Т), (?4, построенными в § 5 (см. рис. 5.2) для той же системы (16.2) с учетом только ограничения (1.4). Области управ ляемости Qi и Q5, например, совпадают с точностью до множества меры нуль.
Имеет смысл построить область управляемости Q в полупространстве х3 0 трехмерного пространства Х 3, содержащего координаты xlt х2, х3. Границы (16.28) об ласти Q в этом пространстве представляют собой стороны двугранного угла (рис. 16.5). Построим теперь картину синтеза оптимального управления в пространстве Х 3.
Для точек, принадлежащих области Q (Т) при Т <; х3, оптимальное управление будет чисто релейным (прини мает значения + 1 ) , и линией переключения является
150 ЗАДАЧИ БЫСТРОДЕЙСТВИЯ [ГЛ. И
кривая, состоящая из двух ветвей параболы [9, 47, 53]
хх = — -|-х2 \х21. |
(16.32) |
При этом синтез управления осуществляется по формуле
— 1 |
при |
:Г!> — ~ х г \хг |
\ |
|
|
или |
при |
хх = |
— уЖа \х2 |
1 |
и х2^>0, |
и |
|
|
|
|
(16.33) |
1 |
при |
жі < |
— Y хі I хчI |
|
|
или |
при |
Xx = |
------2"x 2 [ X2 [ |
и ж2 0. |
Построение оптимального управления в точках, для которых время быстродействия Т х3, осуществляется с помощью формул (5.12)—(5.14).
Рис. 16.5.
Для лежащих на границе области Q (Т) точек, у ко торых параметр ср удовлетворяет неравенству (16.11),