Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Формальский А.М. Управляемость и устойчивость систем с ограниченными ресурсами

.pdf
Скачиваний:
8
Добавлен:
24.10.2023
Размер:
11.01 Mб
Скачать

1] ОГРАНИЧЕННЫЕ ПО ВЕЛИЧИНЕ И ИМПУЛЬСУ СИЛЫ 151

оптимальное управление имеет вид

0

при

0 < т < Г — х3,

 

“ СО = {1

при

Т х3 X ^ Т.

(16.34)

 

 

 

Нельзя забывать о том, что для точки касания опорной прямой П(т], Т) с областью Q (Т) оптимальное управление получается путем умножения функции (5.12) на —1.

Для лежащих на границе Г (Т) точек, у которых па­ раметр ф удовлетворяет неравенству (16.13), оптимальное управление имеет вид

и (т) =

 

 

(16.35)

- 1

при

0 < т < tg ф — у {Т — х3),

О

при

tg ф — -і хя) <

т < tg ф + -і- х3),

1

при

tg ф + -і- х3) <

х.

Для граничных точек, у которых параметр ф удовле­ творяет неравенству (16.15), оптимальное управление определяется выражением

н(т) =

— 1

при

0 ^ т < ^ х 3,

О

при

(16.36)

 

х3<1 X ^ Т.

Для граничных точек,

у которых параметр ф удовле­

творяет неравенствам (16.12), (16.14) и (16.16), оптималь­ ное управление получается умножением на —1 выраже­ ний (16.34), (16.35) и (16.36) соответственно.

Управление (16.34)—(16.36) принимает на отрезке [О, Т] каждое из трех значений — 1, 0 и 1 не более одного

раза.

Это

объясняется

монотонностью функции (16.3).

На рис.

16.4 показана одна из возможных при

х3— 1

оптимальных траекторий АВСО. На отрезке AB траекто­

рии и = 1,

на отрезке ВС и = 0, на отрезке СО, являю­

щемся

частью

линии

переключения (16.32), и =

—1.

В работе [4]

для системы (16.2) решается задача

ми-

 

 

 

т

 

 

нимизации

интеграла ^

\u(x)\dx при ограничении

(1.2)

о

Оптимальное управление в этой задаче имеет ту же струк­ туру, что и управление (16.34)—(16.36),

152

ЗАДАЧИ БЫСТРОДЕЙСТВИЯ

[ГЛ. И

 

 

 

 

 

Формулы (16.34)—(16.36) позволяют найти значение

оптимального управления в

начальный

момент времени

и (0) при любых значениях

хІУх2, х3.

Найти

величину

и (0) в виде функции от координат хг, х2, х3 — это и зна­

чит

решить задачу синтеза

оптимального

управления

(для автономной системы).

(16.27), (16.34)

следует, что

Из

выражений (16.21),

и (0)

=

0 при

 

 

 

 

 

•И > 4 - 4 ,

 

*2 = — Хз,

(16.37)

либо

при

4,

 

 

 

 

Хі<С — 4~

= х3.

(16.38)

Соотношения (16.37) и (16.38) совпадают с соотношениями (16.30) и (16.31) соответственно, если в последних поста­ вить знаки строгого неравенства.

Из выражений (16.24), (16.25), (16.33), (16.35), (16.36)

следует, что и (0) = —1 при

Жц> —уЖ2|ж2|,

> 2|< х 3,

(16.39)

либо при

 

 

Х\ —— 4 I х2],

0<Ж2<>3.

(16.40)

Пользуясь симметрией фазового портрета оптимальной системы, из выражений (16.39), (16.40) получаем, что

и (0) = 1 при

^ i< — 4 жз>2|,

> 2|< > з,

(16.41)

либо при

 

 

Х 1 = — —хг \х2\,

— х3< ж 2< 0 .

(16.42)

Рассматривая соотношения (16.37)—(16.42) в полу­ пространстве х3 0 пространства Х 3, можно полностью представить себе картину синтеза оптимального управ­ ления. Эта картина изображена на рис. 16. 5. В нескольких словах картину синтеза можно описать так. Внутри дву­ гранного угла, с одной стороны от цилиндрической по­ верхности (16.32) управление и = —1, с другой стороны

1J ОГРАНИЧЕННЫЕ ПО

ВЕЛИЧИНЕ

И ИМПУЛЬСУ СИЛЫ і5 з

и =

-t 1.

На одной

половине

поверхности (16.32)

и =

—1,

на другой половине и =

-fl. На сторонах дву­

гранного угла и = 0. На рис. 16.5 показана возможная оптимальная траектория АВСО. Отрезок AB траектории расположен внутри двугранного угла, на нем и = 1, отрезок ВС расположен на границе угла, на нем и —0, отрезок СО расположен на пересечении поверхности (16.32) со стороной угла, на нем и = —1. Если отрезок ВС расположен в сечении х3 = 1, то траектория АВСО на рис. 16.4 представляет собой проекцию на плоскость

х3 = 1 траектории АВСО на рис. 16.5.

 

 

Таким образом, задача быстродействия для системы

(16.2) при ограничениях (1.2), (1.4) решена.

к

0.

Рассмотрим теперь систему (16.1) при ѵ = 0,

Уравнения (16.1) при этом преобретают вид

 

 

X1 = хг, х2 = кх2 -f и.

(16.43)

Система (16.43) имеет одно нулевое и одно ненулевое соб­ ственное значение к. Относительно знака величины к

никаких предположений не делаем.

 

Путем невырожденного

преобразования

 

Уі =

О,

У2 = Ьу -f х2

(16.44)

система (16.43) приводится к виду

 

Уі =

+

У2, У2 = и.

(16.45)

Наряду с обозначениями (16.44) введем также обозначе­

ние уз =

х3. При к =

0

система

(16.45) превращается

в систему

(16.2).

 

имеем

 

 

Для системы (16.45)

0

 

 

А =

к

111

 

Ъ=

 

 

 

0

о|| ’

 

1

 

 

е~Ат=

1

е ’ Х Т

 

!р >-Хт—

 

 

 

1

 

 

 

 

 

о

 

 

 

 

це~АхЬ = Y (е_Лт— 1) cos cp -f sin cp.

(16.46)

Вычислим расстояния d (ц, Т) до опорных прямых области достижимости Q (Т) при Т ]> у 3. Соответствую­ щие рассуждения будем проводить не так подробно, как для системы (16.2).

154

ЗАДАЧИ БЫСТРОДЕЙСТВИЙ

trn. и

При ер =

+ я /2

получаем выражение,

аналогичное

выражению

(16.4):

 

 

 

 

d (т|, Т)

= уз

при ф = Н-я/2.

(16.47)

Пусть теперь ф =х= + я /2 .

После некоторых выкладок

получаем, что область интегрирования Е(Т,%0) в форму­

ле (5.17) состоит из

одного

 

полуинтервала

 

 

Е (Т, Хо) =

(Т — уз,

Т]

(16.48)

при условии,

что

 

 

 

 

 

 

 

ЬдФ< 1 ( 1

 

-еМш-г)),

(16.49)

из двух полуинтервалов

 

 

 

 

 

 

[п и

Т

1

щ 2(1 ~ Xtg(p)N

 

 

Уз

1

X

 

1 _|_ е * ( Т-Ѵг) )

(16.50)

 

 

_1 іп 2 (1

Кtg ф)

гр

 

 

 

при условии,

(■ %

1 + е Ч Т - у 3) '

 

 

что

 

 

 

 

 

 

і (1 - еМш-т)) <

tg ф <

і

(2 - е-ьт - <гх«.),

(16.51)

из одного полуинтервала

 

 

 

 

 

 

Е (Т, Хо)

= [0, уз)

 

(16.52)

при условии,

что

 

 

 

 

 

 

 

tg ф >

і (2 — е-ѵг — e_Xl/»)*

(16.53)

При условии (16.49) для расстояний d (rj, Т) из соот­

ношений (5.17), (16.48) получается выражение

 

d (Д, Т) = d (ф, Т) =

 

 

 

 

 

 

1

 

 

1

1

 

(16.54)

JT, е-хт (1 — ехУ») +

J- УзJ cos ф — у3 sin ф .

При условии (16.51) из соотношений (5.17), (16.50)

получаем

 

 

 

 

 

 

 

d (т), Т) = d(ф, Т) =

 

 

 

 

 

 

(sin ф _

± COS ф) (уз -

 

- 4

In

+

+ р(е-хт + 2Хідф — l)cos ф . (16.55)

1] ОГРАНИЧЕННЫЕ ПО ВЕЛИЧИНЕ И

ИМПУЛЬСУ

СИЛЫ 155

При условии (16.53) из соотношений (5.17), (16.52)

получаем

 

 

d(T),2,) = d(4>, Т) = _1 (1 — е-хш) _

_1 у13J cos ф +

у3sin Ф

 

 

(16.56)

Часть опорных прямых из однопараметрического се­

мейства

 

 

Уг cos ф + у2 sin ф =

d (ф, Т)

(16.57)

при условии (16.49) проходит, как видно из выражения

(16.54), через

точку

J/i =

X е-ХТ (1 — е*Ѵш) + X Уз, Уз =■ — Уз, (16.58)

другая часть — через симметричную относительно начала координат точку

 

Уі = X е~*Т (еХѵз — 1) — у

Уз,

 

Уз = Уз-

(16.59)

При условии (16.53) часть прямых (16.57) проходит,

как видно из выражения (16.56),

через точку

 

 

Уі = X (! — е~Хѵз) — X Уз’

 

= Уз’

(16.60)

другая

часть — через симметричную

 

точку

 

 

У і =

X (е_ХѴз — 1) +

X ^3’

У і

^

~ У з ■

(16-61)

При

Т =

у 3 точка (16.58)

совпадает с точкой (16.61),

а точка

(16.59) — с точкой (16.60).

 

прямыми

 

Область Q (Т) ограничена двумя

 

 

 

Уз =

±.Уз

 

 

 

(16.62)

идвумя симметричными одна другой относительно начала координат кривыми, которые являются огибающими се­ мейства прямых (16.57) при условии (16.51). Уравнения этих огибающих выписывать здесь не будем. Так же как

идля системы (16.2), граница Г (Т) области Q (Т) для си­ стемы (16.43) имеет два плоских участка и четыре угловые точки. Плоскими участками границы являются отрезки

156 ЗАДАЧИ БЫСТРОДЕЙСТВИЯ [ГЛ. II

прямых (16.62), соединяющие между собой точки (16.58), (16.61) и точки (16.59), (16.60). Угловыми являются точки

(16.58)—(16.61). При

условии Т = у 3 область

Q (Т) яв­

ляется строго выпуклой и имеет две угловые точки.

Выясним теперь, что представляет собой область управ­

ляемости Q. Для этого нужно отдельно рассмотреть два

случая: X <

0 и X

0.

 

При X <

0 область Q, так же как и для системы (16.2),

состоит из точек, удовлетворяющих условию

 

 

 

I Уг I < Уз,

(16.63)

а также из двух лучей, лежащих на границе области (16.63). Выражения (16.58), (16.59) можно рассматривать как параметрические уравнения этих лучей. Параме­ тром является величина у3 Т <С оо. Точки, принадле­ жащие этим лучам, можно описать соотношениями

(16.64)

(16.65)

Рассмотрим теперь случай, когда X 0. Из резуль­ татов, изложенных в § 8 (теорема 8.1), следует, что в этом случае область управляемости Q представляет собой ограниченное на фазовой плоскости Y 2 множество. Поль­ зуясь выражениями для расстояний d (ф, Т), выписан­ ными выше, найдем уравнения кривых, ограничивающих область Q.

Расстояния d (ф, Т), определяемые формулами (16.47)

и(16.56), от величины Т не зависят. Расстояния (16.54)

и(16.55) при Т —V оо стремятся к следующим пределам:

(16.66)

sin ф| [Уз + ~ In 2 (1 — Xtg 9 )j +

1] ОГРАНИЧЕННЫЕ ПО ВЕЛИЧИНЕ И ИМПУЛЬСУ СИЛЫ 157

Выражения (16.58), (16.59) при Т ->■ оо превраща­ ются в следующие:

Уі =

X ^3’

Уз = ~ Уз,

(16.68)

Уі =

у?/з,

Уъ = Уз-

(16.69)

Область управляемости Q не содержит точки (16.68), (16.69) , поскольку они получаются при Т = оо.

Граница Г области Q является огибающей однопара­ метрического семейства опорных прямых

Ух cos ф

уг sin ф = d ( ф ) .

(16.70)

Если d ( ф ) определяется формулой (16.66), то опорные прямые (16.70) проходят через точку (16.68) либо (16.69). Если d ( ф ) определяется формулой (16.56), то прямые (16.70) проходят через точку (16.60) либо (16.61). Если d ( ф ) определяется формулой (16.67), то огибающими семействами (16.70) являются кривые (промежуточные выкладки здесь опускаем)

1

1 Г

—у * ОЬішЬ

(16-71)

Уі = -

 

]•

Точки, лежащие на этих кривых, области Q не принад­ лежат.

Прямые (16.62) пересекаются с кривыми (16.71) в точ­ ках (16.60), (16.61), (16.68), (16.69), которые являются угловыми точками границы Г.

Итак, при условии к 0 область управляемости Q ограничена прямыми (16.62) и кривыми (16.71). Граница этой области имеет два плоских участка и четыре угловые точки. Граничные точки, не лежащие на кривых (16.71), принадлежат области управляемости.

В полупространстве у 3 ^> 0 трехмерного пространства Y s границы области управляемости Q при условии к < 0 представляют собой так же, как и для системы (16.2),

стороны двугранного угла (рис. 16.5). При условии к

0

областью управляемости является

часть

двугранного

угла, ограниченная поверхностями

(16.71)

(рис. 16.6).

Перейдем теперь к вопросу о синтезе оптимального по времени управления в пространстве К3.

158

ЗАДАЧИ БЫСТРОДЕЙСТВИЯ

[ГЛ. II

Для точек, принадлежащих области Q (Т) при Т ^ у 3, оптимальное управление является чисто релейным (при­ нимает значения + 1). Линией переключения при этом будет кривая, состоящая из двух проходящих через на­ чало координат интегральных кривых системы (16.45),

 

Рис. 16.6.

 

полученных при и =

+ 1 .

Уравнение этой линии

имеет

вид [7,47]

 

 

 

Уі = —

+

^ [1 — <гХ|ш|] sgnp2.

(16.72)

В полупространстве уг )> 0 пространства Y s поверхности (16.71) пересекаются с цилиндрической поверхностью

(16.72) , как

легко видеть, на

плоскостях

 

(16.62) (см.

рис. 16.6).

 

 

 

 

 

 

 

При построении оптимального

управления

в точках,

для которых время быстродействия Т

у 3,

получаются

похожие

на

(16.34)—(16.36)

выражения.

Вследствие

монотонностиі

функции (16.46)

оптимальное

управление

принимает

на

отрезке [О, Т]

каждое из трех

значений

— 1, 0 и 1 не

более одного раза.

 

 

 

 

l1 ОГРАНИЧЕННЫЕ ПО ВЕЛИЧИНЕ И ИМПУЛЬСУ СИЛЫ Ш

При X < 0 картина синтеза в пространстве Y 3 опти­ мального управления для системы (16.45) будет точно такой же, как и для системы (16.2) (см. рис. 16.5). Роль поверхности (16.32) в этой картине играет поверхность

(16.72).

При X

0 правило, по которому осуществляется

синтез

оптимального

управления,

остается без

измене­

ний

по

сравнению со

случаем

X <

0. Однако

в случае

X

0 область

управляемости

Q, в которой имеет смысл

синтезировать управление, ограничена не только плос­ костями (16.62), как в случае X < 0, но и поверхностями

(16.71) (см. рис. 16.6).

В заключение отметим, что все полученные выше при рассмотрении системы (16.45) выражения при X -> 0 дают соответствующие выражения для системы (16.2). Этим обстоятельством удобно пользоваться при проверке результатов, полученных для системы (16.45).

Рассмотрим теперь систему (16.1) при X = 0, ѵ •< 0. Будем предполагать, что ѵ = —1. Это предположение не ограничивает общности, поскольку уравнения (16.1) пу­ тем замены переменных х1г х2, t всегда приводятся к та­ кому виду, что V = —1. Уравнения (16.1) в рассматривае­

мом случае приобретают

вид

 

= х2,

± 2 = —Жі + и.

(16.73)

Система (16.73) имеет два чисто мнимых собственных значения + і.

Вопрос о построении оптимального по времени управ­ ления для системы (16.73) при наличии ограничений (1.2) и (1.4) представляет интерес для задачи управления дви­ жением искусственного спутника относительно центра масс. Уравнения движения спутника вокруг оси, перпен­ дикулярной к плоскости орбиты [6], после линеаризации приобретают вид (16.73). Условие (1.2) соответствует ограниченности тяги, а условие (1.4) — ограниченности

запаса топлива двигателей ориентации.

 

при е

0,

Система (16.73) получается из системы (12.1)

поэтому матрица еАт получается из матрицы

(12.3)

при

е = 0. Таким образом, для системы (16.73) имеем

 

 

COST

— sin тI]

(16.74)

sin т

cos т И'

160

ЗАДАЧИ БЫСТРОДЕЙСТВИЯ

[ГЛ. II

Из выражения (12.4) с учетом обозначений (12.6) получаем

x\e~Azb — —cos ф sin т + sin ф cos т = sin ( ф — т). (16.75)

В отличие от функций (16.3) и (16.46), функция (16.75) не удовлетворяет тождеству | г}е-Ат5 | = const ни при каких значениях ф . Поэтому граница Г (Т) области до­ стижимости Q (Т) не имеет плоских участков, т. е. мно­ жество Q (Т) для системы (16.73) является строго вы­ пуклым.

Расстояние d (ц, Т) от начала координат до опорных прямых определяется, в соответствии с выражением (5.17), формулой

d(r1, Т) = d ( ф , Т) =

§ I sin — т) I dx, (16.76)

Е( Т , Х о )

где область интегрирования

Е (Т, Хо) = {X е= [0, Я: I sin ( ф - т) I > ХоЬ (16.77)

а величина Хо удовлетворяет уравнению (5.16)

РЕ (Я Хо) = **•

(16.78)

Найдем область управляемости Q для системы (16.73). В соответствии с теоремой 8.1, область Q занимает огра­ ниченную часть фазовой плоскости Х 2. Это связано с тем, что оба собственные значения системы (16.73) имеют ну­ левые действительные части. Пользуясь уравнением (16.76), выпишем точное уравнение границы Г области Q. Для этого нужно найти расстояния d ( ф ) , получающиеся из расстояний d ( ф , Т) при Г -> оо.

Выберем бесконечно возрастающую последовательность

величин Т следующим образом: Т =

я/2

+ лк ф , где

целое число

к - * - оо. Рассмотрим сначала

случай,

когда

I Ф I = я/2.

Если ф = —я/2,

то множество Е (Т, Хо)

состоит из двух полуинтервалов длиной

(-^- — arcsin Хо)

и к — 1 интервалов длиной (я—2 arc sin

Хо)- На рис. 16.7

множество Е (Т, Хо) показано

жирными

линиями

(6 =

Ф т). Уравнение (16.78)

при

этом

записывается

в виде

 

 

 

 

 

 

к (я — 2 arc sin х0) — ^з-

Соседние файлы в папке книги из ГПНТБ