![](/user_photo/_userpic.png)
книги из ГПНТБ / Формальский А.М. Управляемость и устойчивость систем с ограниченными ресурсами
.pdf1] ОГРАНИЧЕННЫЕ ПО ВЕЛИЧИНЕ И ИМПУЛЬСУ СИЛЫ 151
оптимальное управление имеет вид
0 |
при |
0 < т < Г — х3, |
|
“ СО = {1 |
при |
Т — х3 X ^ Т. |
(16.34) |
|
|
|
Нельзя забывать о том, что для точки касания опорной прямой П(т], Т) с областью Q (Т) оптимальное управление получается путем умножения функции (5.12) на —1.
Для лежащих на границе Г (Т) точек, у которых па раметр ф удовлетворяет неравенству (16.13), оптимальное управление имеет вид
и (т) = |
|
|
(16.35) |
- 1 |
при |
0 < т < tg ф — у {Т — х3), |
|
О |
при |
tg ф — -і (Т — хя) < |
т < tg ф + -і- (Т — х3), |
1 |
при |
tg ф + -і- (Т — х3) < |
х. |
Для граничных точек, у которых параметр ф удовле творяет неравенству (16.15), оптимальное управление определяется выражением
н(т) = |
— 1 |
при |
0 ^ т < ^ х 3, |
О |
при |
(16.36) |
|
|
х3<1 X ^ Т. |
||
Для граничных точек, |
у которых параметр ф удовле |
творяет неравенствам (16.12), (16.14) и (16.16), оптималь ное управление получается умножением на —1 выраже ний (16.34), (16.35) и (16.36) соответственно.
Управление (16.34)—(16.36) принимает на отрезке [О, Т] каждое из трех значений — 1, 0 и 1 не более одного
раза. |
Это |
объясняется |
монотонностью функции (16.3). |
|||
На рис. |
16.4 показана одна из возможных при |
х3— 1 |
||||
оптимальных траекторий АВСО. На отрезке AB траекто |
||||||
рии и = 1, |
на отрезке ВС и = 0, на отрезке СО, являю |
|||||
щемся |
частью |
линии |
переключения (16.32), и = |
—1. |
||
В работе [4] |
для системы (16.2) решается задача |
ми- |
||||
|
|
|
т |
|
|
|
нимизации |
интеграла ^ |
\u(x)\dx при ограничении |
(1.2) |
о
Оптимальное управление в этой задаче имеет ту же струк туру, что и управление (16.34)—(16.36),
152 |
ЗАДАЧИ БЫСТРОДЕЙСТВИЯ |
[ГЛ. И |
||
|
|
|
|
|
|
Формулы (16.34)—(16.36) позволяют найти значение |
|||
оптимального управления в |
начальный |
момент времени |
||
и (0) при любых значениях |
хІУх2, х3. |
Найти |
величину |
и (0) в виде функции от координат хг, х2, х3 — это и зна
чит |
решить задачу синтеза |
оптимального |
управления |
||
(для автономной системы). |
(16.27), (16.34) |
следует, что |
|||
Из |
выражений (16.21), |
||||
и (0) |
= |
0 при |
|
|
|
|
|
•И > 4 - 4 , |
|
*2 = — Хз, |
(16.37) |
либо |
при |
4, |
|
|
|
|
|
Хі<С — 4~ |
= х3. |
(16.38) |
Соотношения (16.37) и (16.38) совпадают с соотношениями (16.30) и (16.31) соответственно, если в последних поста вить знаки строгого неравенства.
Из выражений (16.24), (16.25), (16.33), (16.35), (16.36)
следует, что и (0) = —1 при
Жц> —уЖ2|ж2|, |
> 2|< х 3, |
(16.39) |
либо при |
|
|
Х\ —— 4 I х2], |
0<Ж2<>3. |
(16.40) |
Пользуясь симметрией фазового портрета оптимальной системы, из выражений (16.39), (16.40) получаем, что
и (0) = 1 при
^ i< — 4 жз>2|, |
> 2|< > з, |
(16.41) |
либо при |
|
|
Х 1 = — —хг \х2\, |
— х3< ж 2< 0 . |
(16.42) |
Рассматривая соотношения (16.37)—(16.42) в полу пространстве х3 0 пространства Х 3, можно полностью представить себе картину синтеза оптимального управ ления. Эта картина изображена на рис. 16. 5. В нескольких словах картину синтеза можно описать так. Внутри дву гранного угла, с одной стороны от цилиндрической по верхности (16.32) управление и = —1, с другой стороны
1J ОГРАНИЧЕННЫЕ ПО |
ВЕЛИЧИНЕ |
И ИМПУЛЬСУ СИЛЫ і5 з |
||
и = |
-t 1. |
На одной |
половине |
поверхности (16.32) |
и = |
—1, |
на другой половине и = |
-fl. На сторонах дву |
гранного угла и = 0. На рис. 16.5 показана возможная оптимальная траектория АВСО. Отрезок AB траектории расположен внутри двугранного угла, на нем и = 1, отрезок ВС расположен на границе угла, на нем и —0, отрезок СО расположен на пересечении поверхности (16.32) со стороной угла, на нем и = —1. Если отрезок ВС расположен в сечении х3 = 1, то траектория АВСО на рис. 16.4 представляет собой проекцию на плоскость
х3 = 1 траектории АВСО на рис. 16.5. |
|
|
Таким образом, задача быстродействия для системы |
||
(16.2) при ограничениях (1.2), (1.4) решена. |
к |
0. |
Рассмотрим теперь систему (16.1) при ѵ = 0, |
||
Уравнения (16.1) при этом преобретают вид |
|
|
X1 = хг, х2 = кх2 -f и. |
(16.43) |
Система (16.43) имеет одно нулевое и одно ненулевое соб ственное значение к. Относительно знака величины к
никаких предположений не делаем. |
|
||
Путем невырожденного |
преобразования |
|
|
Уі = |
О, |
У2 = Ьу -f х2 |
(16.44) |
система (16.43) приводится к виду |
|
||
Уі = |
+ |
У2, У2 = и. |
(16.45) |
Наряду с обозначениями (16.44) введем также обозначе
ние уз = |
х3. При к = |
0 |
система |
(16.45) превращается |
|||
в систему |
(16.2). |
|
имеем |
|
|
||
Для системы (16.45) |
0 |
|
|||||
|
А = |
к |
111 |
|
Ъ= |
|
|
|
|
0 |
о|| ’ |
|
1 |
|
|
|
е~Ат= |
1 |
е ’ Х Т |
|
!р >-Хт— |
|
|
|
|
1 |
|
|
|||
|
|
|
о |
|
|
|
|
|
це~АхЬ = Y (е_Лт— 1) cos cp -f sin cp. |
(16.46) |
Вычислим расстояния d (ц, Т) до опорных прямых области достижимости Q (Т) при Т ]> у 3. Соответствую щие рассуждения будем проводить не так подробно, как для системы (16.2).
![](/html/65386/283/html_S3xg7SNfQN.WJol/htmlconvd-hCtyjn154x1.jpg)
154 |
ЗАДАЧИ БЫСТРОДЕЙСТВИЙ |
trn. и |
||
При ер = |
+ я /2 |
получаем выражение, |
аналогичное |
|
выражению |
(16.4): |
|
|
|
|
d (т|, Т) |
= уз |
при ф = Н-я/2. |
(16.47) |
Пусть теперь ф =х= + я /2 . |
После некоторых выкладок |
получаем, что область интегрирования Е(Т,%0) в форму
ле (5.17) состоит из |
одного |
|
полуинтервала |
|
|||
|
Е (Т, Хо) = |
(Т — уз, |
Т] |
(16.48) |
|||
при условии, |
что |
|
|
|
|
|
|
|
ЬдФ< 1 ( 1 |
|
-еМш-г)), |
(16.49) |
|||
из двух полуинтервалов |
|
|
|
|
|
||
|
[п и |
Т |
1 |
щ 2(1 ~ Xtg(p)N |
|
||
|
Уз |
1 |
X |
|
1 _|_ е * ( Т-Ѵг) ) ’ |
(16.50) |
|
|
|
_1 іп 2 (1 |
Кtg ф) |
гр |
|||
|
|
|
|||||
при условии, |
(■ % |
1 + е Ч Т - у 3) ' |
|
|
|||
что |
|
|
|
|
|
|
|
і (1 - еМш-т)) < |
tg ф < |
і |
(2 - е-ьт - <гх«.), |
(16.51) |
|||
из одного полуинтервала |
|
|
|
|
|
||
|
Е (Т, Хо) |
= [0, уз) |
|
(16.52) |
|||
при условии, |
что |
|
|
|
|
|
|
|
tg ф > |
і (2 — е-ѵг — e_Xl/»)* |
(16.53) |
||||
При условии (16.49) для расстояний d (rj, Т) из соот |
|||||||
ношений (5.17), (16.48) получается выражение |
|
||||||
d (Д, Т) = d (ф, Т) = |
|
|
|
|
|
|
|
1 |
|
|
1 |
1 |
|
(16.54) |
|
JT, е-хт (1 — ехУ») + |
J- УзJ cos ф — у3 sin ф . |
||||||
При условии (16.51) из соотношений (5.17), (16.50) |
|||||||
получаем |
|
|
|
|
|
|
|
d (т), Т) = d(ф, Т) = |
|
|
|
|
|
|
|
(sin ф _ |
± COS ф) (уз - |
|
2Т - 4 |
In |
+ |
+ р(е-хт + 2Хідф — l)cos ф . (16.55)
1] ОГРАНИЧЕННЫЕ ПО ВЕЛИЧИНЕ И |
ИМПУЛЬСУ |
СИЛЫ 155 |
При условии (16.53) из соотношений (5.17), (16.52) |
||
получаем |
|
|
d(T),2,) = d(4>, Т) = _1 (1 — е-хш) _ |
_1 у13J cos ф + |
у3sin Ф |
|
|
(16.56) |
Часть опорных прямых из однопараметрического се |
||
мейства |
|
|
Уг cos ф + у2 sin ф = |
d (ф, Т) |
(16.57) |
при условии (16.49) проходит, как видно из выражения
(16.54), через |
точку |
J/i = |
X е-ХТ (1 — е*Ѵш) + X Уз, Уз =■ — Уз, (16.58) |
другая часть — через симметричную относительно начала координат точку
|
Уі = X е~*Т (еХѵз — 1) — у |
Уз, |
|
Уз = Уз- |
(16.59) |
||
При условии (16.53) часть прямых (16.57) проходит, |
|||||||
как видно из выражения (16.56), |
через точку |
|
|||||
|
Уі = X (! — е~Хѵз) — X Уз’ |
|
= Уз’ |
(16.60) |
|||
другая |
часть — через симметричную |
|
точку |
|
|||
|
У і = |
X (е_ХѴз — 1) + |
X ^3’ |
У і |
^ |
~ У з ■ |
(16-61) |
При |
Т = |
у 3 точка (16.58) |
совпадает с точкой (16.61), |
||||
а точка |
(16.59) — с точкой (16.60). |
|
прямыми |
|
|||
Область Q (Т) ограничена двумя |
|
||||||
|
|
Уз = |
±.Уз |
|
|
|
(16.62) |
идвумя симметричными одна другой относительно начала координат кривыми, которые являются огибающими се мейства прямых (16.57) при условии (16.51). Уравнения этих огибающих выписывать здесь не будем. Так же как
идля системы (16.2), граница Г (Т) области Q (Т) для си стемы (16.43) имеет два плоских участка и четыре угловые точки. Плоскими участками границы являются отрезки
156 ЗАДАЧИ БЫСТРОДЕЙСТВИЯ [ГЛ. II
прямых (16.62), соединяющие между собой точки (16.58), (16.61) и точки (16.59), (16.60). Угловыми являются точки
(16.58)—(16.61). При |
условии Т = у 3 область |
Q (Т) яв |
|
ляется строго выпуклой и имеет две угловые точки. |
|||
Выясним теперь, что представляет собой область управ |
|||
ляемости Q. Для этого нужно отдельно рассмотреть два |
|||
случая: X < |
0 и X |
0. |
|
При X < |
0 область Q, так же как и для системы (16.2), |
||
состоит из точек, удовлетворяющих условию |
|
||
|
|
I Уг I < Уз, |
(16.63) |
а также из двух лучей, лежащих на границе области (16.63). Выражения (16.58), (16.59) можно рассматривать как параметрические уравнения этих лучей. Параме тром является величина у3 Т <С оо. Точки, принадле жащие этим лучам, можно описать соотношениями
(16.64)
(16.65)
Рассмотрим теперь случай, когда X 0. Из резуль татов, изложенных в § 8 (теорема 8.1), следует, что в этом случае область управляемости Q представляет собой ограниченное на фазовой плоскости Y 2 множество. Поль зуясь выражениями для расстояний d (ф, Т), выписан ными выше, найдем уравнения кривых, ограничивающих область Q.
Расстояния d (ф, Т), определяемые формулами (16.47)
и(16.56), от величины Т не зависят. Расстояния (16.54)
и(16.55) при Т —V оо стремятся к следующим пределам:
(16.66)
sin ф| [Уз + ~ In 2 (1 — Xtg 9 )j +
1] ОГРАНИЧЕННЫЕ ПО ВЕЛИЧИНЕ И ИМПУЛЬСУ СИЛЫ 157
Выражения (16.58), (16.59) при Т ->■ оо превраща ются в следующие:
Уі = |
X ^3’ |
Уз = ~ Уз, |
(16.68) |
Уі = |
— у?/з, |
Уъ = Уз- |
(16.69) |
Область управляемости Q не содержит точки (16.68), (16.69) , поскольку они получаются при Т = оо.
Граница Г области Q является огибающей однопара метрического семейства опорных прямых
Ух cos ф |
уг sin ф = d ( ф ) . |
(16.70) |
Если d ( ф ) определяется формулой (16.66), то опорные прямые (16.70) проходят через точку (16.68) либо (16.69). Если d ( ф ) определяется формулой (16.56), то прямые (16.70) проходят через точку (16.60) либо (16.61). Если d ( ф ) определяется формулой (16.67), то огибающими семействами (16.70) являются кривые (промежуточные выкладки здесь опускаем)
1 |
1 Г |
—у * ОЬішЬ |
(16-71) |
Уі = - |
|
]• |
Точки, лежащие на этих кривых, области Q не принад лежат.
Прямые (16.62) пересекаются с кривыми (16.71) в точ ках (16.60), (16.61), (16.68), (16.69), которые являются угловыми точками границы Г.
Итак, при условии к 0 область управляемости Q ограничена прямыми (16.62) и кривыми (16.71). Граница этой области имеет два плоских участка и четыре угловые точки. Граничные точки, не лежащие на кривых (16.71), принадлежат области управляемости.
В полупространстве у 3 ^> 0 трехмерного пространства Y s границы области управляемости Q при условии к < 0 представляют собой так же, как и для системы (16.2),
стороны двугранного угла (рис. 16.5). При условии к |
0 |
||
областью управляемости является |
часть |
двугранного |
|
угла, ограниченная поверхностями |
(16.71) |
(рис. 16.6). |
Перейдем теперь к вопросу о синтезе оптимального по времени управления в пространстве К3.
158 |
ЗАДАЧИ БЫСТРОДЕЙСТВИЯ |
[ГЛ. II |
Для точек, принадлежащих области Q (Т) при Т ^ у 3, оптимальное управление является чисто релейным (при нимает значения + 1). Линией переключения при этом будет кривая, состоящая из двух проходящих через на чало координат интегральных кривых системы (16.45),
|
Рис. 16.6. |
|
|
полученных при и = |
+ 1 . |
Уравнение этой линии |
имеет |
вид [7,47] |
|
|
|
Уі = — |
+ |
^ [1 — <гХ|ш|] sgnp2. |
(16.72) |
В полупространстве уг )> 0 пространства Y s поверхности (16.71) пересекаются с цилиндрической поверхностью
(16.72) , как |
легко видеть, на |
плоскостях |
|
(16.62) (см. |
|||
рис. 16.6). |
|
|
|
|
|
|
|
При построении оптимального |
управления |
в точках, |
|||||
для которых время быстродействия Т |
у 3, |
получаются |
|||||
похожие |
на |
(16.34)—(16.36) |
выражения. |
Вследствие |
|||
монотонностиі |
функции (16.46) |
оптимальное |
управление |
||||
принимает |
на |
отрезке [О, Т] |
каждое из трех |
значений |
|||
— 1, 0 и 1 не |
более одного раза. |
|
|
|
|
l1 ОГРАНИЧЕННЫЕ ПО ВЕЛИЧИНЕ И ИМПУЛЬСУ СИЛЫ Ш
При X < 0 картина синтеза в пространстве Y 3 опти мального управления для системы (16.45) будет точно такой же, как и для системы (16.2) (см. рис. 16.5). Роль поверхности (16.32) в этой картине играет поверхность
(16.72). |
При X |
0 правило, по которому осуществляется |
|||||
синтез |
оптимального |
управления, |
остается без |
измене |
|||
ний |
по |
сравнению со |
случаем |
X < |
0. Однако |
в случае |
|
X |
0 область |
управляемости |
Q, в которой имеет смысл |
синтезировать управление, ограничена не только плос костями (16.62), как в случае X < 0, но и поверхностями
(16.71) (см. рис. 16.6).
В заключение отметим, что все полученные выше при рассмотрении системы (16.45) выражения при X -> 0 дают соответствующие выражения для системы (16.2). Этим обстоятельством удобно пользоваться при проверке результатов, полученных для системы (16.45).
Рассмотрим теперь систему (16.1) при X = 0, ѵ •< 0. Будем предполагать, что ѵ = —1. Это предположение не ограничивает общности, поскольку уравнения (16.1) пу тем замены переменных х1г х2, t всегда приводятся к та кому виду, что V = —1. Уравнения (16.1) в рассматривае
мом случае приобретают |
вид |
|
= х2, |
± 2 = —Жі + и. |
(16.73) |
Система (16.73) имеет два чисто мнимых собственных значения + і.
Вопрос о построении оптимального по времени управ ления для системы (16.73) при наличии ограничений (1.2) и (1.4) представляет интерес для задачи управления дви жением искусственного спутника относительно центра масс. Уравнения движения спутника вокруг оси, перпен дикулярной к плоскости орбиты [6], после линеаризации приобретают вид (16.73). Условие (1.2) соответствует ограниченности тяги, а условие (1.4) — ограниченности
запаса топлива двигателей ориентации. |
|
при е |
0, |
|
Система (16.73) получается из системы (12.1) |
||||
поэтому матрица еАт получается из матрицы |
(12.3) |
при |
||
е = 0. Таким образом, для системы (16.73) имеем |
|
|
||
COST |
— sin тI] |
(16.74) |
||
sin т |
cos т И' |
160 |
ЗАДАЧИ БЫСТРОДЕЙСТВИЯ |
[ГЛ. II |
Из выражения (12.4) с учетом обозначений (12.6) получаем
x\e~Azb — —cos ф sin т + sin ф cos т = sin ( ф — т). (16.75)
В отличие от функций (16.3) и (16.46), функция (16.75) не удовлетворяет тождеству | г}е-Ат5 | = const ни при каких значениях ф . Поэтому граница Г (Т) области до стижимости Q (Т) не имеет плоских участков, т. е. мно жество Q (Т) для системы (16.73) является строго вы пуклым.
Расстояние d (ц, Т) от начала координат до опорных прямых определяется, в соответствии с выражением (5.17), формулой
d(r1, Т) = d ( ф , Т) = |
§ I sin (ф — т) I dx, (16.76) |
Е( Т , Х о )
где область интегрирования
Е (Т, Хо) = {X е= [0, Я: I sin ( ф - т) I > ХоЬ (16.77)
а величина Хо удовлетворяет уравнению (5.16)
РЕ (Я Хо) = **• |
(16.78) |
Найдем область управляемости Q для системы (16.73). В соответствии с теоремой 8.1, область Q занимает огра ниченную часть фазовой плоскости Х 2. Это связано с тем, что оба собственные значения системы (16.73) имеют ну левые действительные части. Пользуясь уравнением (16.76), выпишем точное уравнение границы Г области Q. Для этого нужно найти расстояния d ( ф ) , получающиеся из расстояний d ( ф , Т) при Г -> оо.
Выберем бесконечно возрастающую последовательность
величин Т следующим образом: Т = |
я/2 |
+ лк -р ф , где |
||||
целое число |
к - * - оо. Рассмотрим сначала |
случай, |
когда |
|||
I Ф I = я/2. |
Если ф = —я/2, |
то множество Е (Т, Хо) |
||||
состоит из двух полуинтервалов длиной |
(-^- — arcsin Хо) |
|||||
и к — 1 интервалов длиной (я—2 arc sin |
Хо)- На рис. 16.7 |
|||||
множество Е (Т, Хо) показано |
жирными |
линиями |
(6 = |
|||
— Ф — т). Уравнение (16.78) |
при |
этом |
записывается |
|||
в виде |
|
|
|
|
|
|
к (я — 2 arc sin х0) — ^з-