![](/user_photo/_userpic.png)
книги из ГПНТБ / Формальский А.М. Управляемость и устойчивость систем с ограниченными ресурсами
.pdf3] |
О СИНТЕЗЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ |
191 |
можное время, состоит в определении оптимального управ ления в виде функции фазовых координат управляемого объекта. Решение этой задачи позволяет строить оптималь ные системы автоматического управления с обратной связью, которые обладают рядом преимуществ по сравне нию с разомкнутыми системами.
Для линейных автономных систем второго порядка при ограничениях (1.2) задача синтеза решена полностью [9, 47, 53]. В работах [15, 43, 45] рассматривается задача син теза для линейных систем третьего порядка, причем в
[43]эта задача нашла полное решение.
Внастоящем разделе рассматриваются некоторые об стоятельства, позволяющие осуществить приближенное решение задачи синтеза [13]. Приводятся два примера, один из которых носит иллюстративный характер. Другой пример связан с системой уравнений четвертого порядка, описывающих движение летательного аппарата. Этот при мер представляет, по-видимому, самостоятельный интерес.
§20. Постановка задачи
Пусть управляемый объект описывается матричным
дифференциальным уравнением |
|
dxldt = / (X, и), |
(2 0 .1 ) |
где X = I Хі I и / (ж, и) = I fi {х, и) |
|| — матрицы порядка |
(п X 1). Будем предполагать, что и — скалярная управ ляющая функция. Через ß обозначим множество кусочно непрерывных функций, удовлетворяющих условию вида
(1.2)
I и (т) |< 1.
Пусть хх — регулируемая координата объекта, т. е. та координата объекта, поведением которой требуется управ лять. Предположим, что желаемый режим работы системы
(20.1) |
определяется |
условием |
хх = |
хх = const. |
Пусть |
||
Хі = |
Xі = const (i = |
2, ... ,n), |
и |
= u' |
= const GE ß |
— та |
|
кие значения, что / (x', u') = |
0. |
Будем предполагать, |
что |
||||
для того чтобы вывести систему |
регулирования (2 0 .1 ) |
на |
желаемый режим хг = хъ ее необходимо привести в со стояние X = х'.
192 |
ЗАДАЧИ БЫСТРОДЕЙСТВИЯ |
[ГЛ. II |
Обозначим через Q область управляемости системы |
||
(20.1), |
т. е. множество состояний х ЕЕ Х п, из |
которых си |
стему (20.1) можно при помощи управления и (т) ЕЕ U при вести в точку X = х'. Если система (20.1) является линей ной, т. е. имеет вид (1.1), и х' = 0, то Q есть именно та об ласть управляемости, о которой шла речь в первой главе.
Обозначим через Т° (х) минимальное время приведения системы (20.1) из состояния х в состояние х'. Пусть суще ствует оптимальное управление как функция фазовых координат и (х) (\и (х) | 1 ), которое из всякого началь
ного состояния X GE Q приводит систему (20.1) в состояние х' за время Т° (х). Будем предполагать, что оптимальное управление является релейным, т. е. принимает значения -4-1 и — 1 (в случае линейности системы (2 0 .1 ) это предпо
ложение выполняется). Тогда задача построения опти мального управления в зависимости от фазовых коорди нат и (х) (задача синтеза) состоит в построении многообра зия S ее Х п размерности п — 1, на котором происходит переключение управления и {х).
При решении проблемы синтеза обычно стремятся, прежде всего, найти уравнение гиперповерхности S в явном виде. Задача нахождения этого уравнения является чрез вычайно трудной. Она решена только для линейных си стем, порядок которых не превосходит трех. Если гиперпо верхность S найдена, то возникает вопрос о практической реализации закона управления с помощью вычислитель ных устройств.
В следующем параграфе приводятся соображения, по зволяющие облегчить решение задачи синтеза для некото рых систем регулирования.
§ 2 1 . О приближенном решении задачи
Рассмотрим систему регулирования (20.1), в которой множество Ѵг практически возможных начальных состоя ний занимает лишь часть области управляемости Q.
Для решения задачи синтеза оптимального управления в такой системе регулирования нет необходимости в пост роении всей поверхности переключения S, достаточно по строить лишь некоторую часть .S-lповерхности S, «обслу живающую» множество Ѵг начальных условий. Иначе го воря, достаточно построить лишь ту часть S x поверхности
31 |
О СИНТЕЗЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ |
193 |
S, на которой происходит переключение управления при |
||
движении |
системы по оптимальным траекториям, |
начи |
нающимся из области Ѵ1. |
|
Если размерность множества Ѵх меньше п, то размер ность многообразия S x может быть меньше п — 1. Множе ство S x может быть многосвязным. Если, например, для всех начальных состояний х (0) ЕЕ Ѵх управление и (ж) имеет п — 1 переключений (подобная ситуация имеет место в линейных системах регулирования (1.1) с действитель ными собственными значениями [47, 53]), то S x может со
стоять из п — 1 частей 5^ (/ = 1, ..., п — 1). Построение многообразия S x решает задачу быстрейшего приведения системы (20.1) из состояний х 6Е Ѵ} в состояние х = х'.
Пусть под влиянием не учтенных в уравнении (20.1) внешних возмущений, действующих в процессе приведения или после приведения в точку х — х', система может ока заться в любой точке некоторой окрестности Ѵ2 точки а'.
Если Ѵ2 |
Ѵх, |
то построение многообразия S x не решает, |
|
вообще |
говоря, |
задачу стабилизации |
состояния х — х', |
т. е. задачу приведения системы (20.1) |
в состояние х = х' |
||
из точек X ЕЕ Ѵ2. Для решения задачи, |
оптимальной по бы |
стродействию стабилизации состояния х = х', достаточно построить часть S 2 поверхности S, «обслуживающую»
множество состояний х ее Ѵ2. Таким образом, построение многообразий S x я S 2решает задачу синтеза управления,
обеспечивающего быстрейшее приведение и стабилизацию рассматриваемой системы.
Заметим, что при построении всей поверхности пере ключения S проблема оптимального управления не разде ляется на задачу «приведения» и задачу стабилизации. Построение всей поверхности S решает обе задачи одно временно.
При точном построении многообразий Sxи S2 точно ре шается проблема синтеза оптимального управления для начальных состояний х (0) Е ^ . Однако точное построе ние многообразий Sx и S2представляет собой, так же как и построение поверхности S, сложную задачу. Поэтому естественно возникает вопрос о приближенном построении этих многообразий. Рассмотрим этот вопрос.
Допустим, что для каждого состояния ж (0) Е F, мож но найти оптимальное управление и (т) ЕЕ О в виде функ ции времени. Это допущение является довольно сильным,
7 А. М. Формальский
194 ЗАДАЧИ БЫСТРОДЕЙСТВИЯ [ГЛ. II
поскольку определение такого управления представляет собой самостоятельную трудную задачу. Решая систему (20.1) с оптимальным управлением и (т) и «останавливая ре шение» в момент переключений управления, можно найти точки X GE S x. Поступая таким образом, можно найти сколь угодно большое число точек і Е ^ и затем аппроксимиро вать многообразие S x с помощью некоторой гиперповерх ности üj. Многообразие S 2 можно аппроксимировать так же с помощью некоторой гиперповерхности П2.
Предположим, |
что многообразие |
состоит из т частей |
iSj (/' = 1, ... ,т) |
и при стягивании |
области Ѵх в точку |
многообразия S{ (/ |
= 1, ... , т) также стягиваются в точки. |
|
Тогда в случае достаточной малости |
области Ѵх каждое |
многообразие S[ можно аппроксимировать с помощью од
ной гиперплоскости ПІ. Такая аппроксимация является очень удобной с точки зрения простоты реализации закона управления. Для осуществления этой аппроксимации мож но взять п точек из области Ѵхи, определив соответствую
щие им п точек, принадлежащих многообразию S{ (j = = 1, ... , т), провести через них аппроксимирующую плос
кость п(- При переключении управления на поверхности Пх (обо
значим соответствующее управление через и* (х)) система (20.1) из всех состояний х е= Ѵхза время Г° (я) приводится в некоторую окрестность W состояния х — х'. Эта окрест ность может быть сделана сколь угодно малой при надле жащей аппроксимации многообразия S x. Величина ок рестности W как раз и должна служить критерием качества аппроксимации и близости закона управления и* (х) к оптимальному и (х). После приведения системы в окрест ность W управление нужно переключать на закон стаби лизации, поэтому окрестность W должна принадлежать области Ѵ2.
Если множество S2 односвязно и, как это имеет место, например, в линейных системах, стягивается в точку х = = х' при стягивании в эту точку множества Ѵ2, то в случае малости области Ѵ2 поверхность П2, аппроксимирующую многообразие S2, можно выбирать в виде гиперплоскости, проходящей через точку х = х'. В этом случае режим ста билизации может быть скользящим режимом [10, 16]. Таким образом, построение поверхностей Пх и П2 ре-
3] |
О СИНТЕЗЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ |
195 |
шает задачу вывода системы (20.1) за время Т° (я) в малую окрестность состояния х = х' и задачу стабилизации этого состояния.
Заметим, что в тех системах регулирования, в которых область Ѵ2достаточно мала, построение оптимального за кона стабилизации не имеет смысла [53а]. В таких системах можно ограничиться линейным или каким-либо другим
простым законом, обеспечивающим асимптотическую ус тойчивость состояния X = х'.
Проиллюстрируем сказанноегвыше на примере системы второго порядка (16.2). Пусть желаемое значение регули
руемой переменной этой системы хг = 0. Для обеспечения
условия |
х1 = |
0 необходимо |
привести систему (16.2) |
в |
|
состояние |
X = |
х' = (0, 0). Область управляемости |
этой |
||
системы Q = |
Х 2. |
|
и (х), |
||
Фазовый портрет системы (16.2) с управлением |
|||||
осуществляющим быстрейшее приведение в начало |
коор |
||||
динат и з |
всех |
состояни й х е |
Х 8, хорош о известен |
[9, |
46, |
7*
196 |
ЗАДАЧИ БЫСТРОДЕЙСТВИЯ |
[ГЛ. И |
47, 506, 53] (рис. 21.1). Линия ЛОВ, уравнение которой имеет вид (16.32), представляет собой линию переключе ния S. Оптимальный закон управления и (х) определяется выражением (16.33). Оптимальными траекториями явля ются параболы, принадлежащие семействам (19.9) и (19.10).
Предположим, что множество Ѵх возможных началь ных состояний системы (16.2) заключено в круге
|
|
(х1 - |
а)2 + хі < б2, |
(21.1) |
|
где а |
б |
0. Через |
диаметрально противоположные |
||
точки С (а — б, 0) и D |
{а + б, 0) круга (21.1) |
проходят |
|||
следующие |
параболы |
из |
семейства (19.10): |
|
|
|
|
хх= |
----^-xl-\-a — б, |
(21.2) |
|
|
|
Х\ = |
----2~ х%-f- а, -f- 5. |
(21.3) |
|
Для простоты рассуждений будем предполагать, |
что пара |
бола (21.3) имеет с кругом (21.1) только одну общую точку
D. Это, как легко показать, имеет место при |
8 ^ 1 . |
Траектории (21.2) и (21.3) пересекаются с |
линией S |
в точках Е и F соответственно. Все оптимальные траекто |
рии, начинающиеся в области Ѵъ пересекаются с линией переключения S в точках криволинейного отрезка EF, который обозначим через Sx. Для быстрейшего приведения системы (16.2) из области Ѵхв начало координат достаточ
но реализовать отрезок |
линии S, «обслуживающий» об |
ласть (21.1). Заметим, |
что отрезок S x обслуживает более |
широкую область, заключенную между частями КСЕ и
MDF парабол (21.2), (21.3).
Оптимальная траектория системы (16.2), начинающая ся в центре круга (21.1), пересекает линию S в точке G с
координатами (а/2, — )fa). Уравнение прямой Пх, касаю
щейся параболы АО в точке G, |
имеет вид |
|
Х\ + У ахг = |
---- Y a - |
(21.4) |
Предположим, что переключение управления происходит при попадании системы (16.2) не на отрезок S х, а на прямую Пх (21.4) (аппроксимация линии переключения с помощью прямой использовалась, например, в [51]). Соответствую щее управление обозначим через и* (х).
3] |
О СИНТЕЗЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ |
197 |
Оценим качество управления и* (х). Для этого найдем координаты точек, в которые попадает система (16.2) с управлением и* (х) за время Т° (х (0)) из начальных со стояний X (0) е= Ѵх. Рассмотрим прежде всего начальные состояния, принадлежащие диаметру CD круга (21.1).
Иначе говоря, пусть х (0) = (хг (0), 0) и а - 6 < *! (0) < ^ а + 6. Легко видеть [9, 506], что время быстродействия
|
Т0(Хі(0), |
0) = 2 / Д Ж |
(21.5) |
|||
Оптимальная |
траектория, |
начинающаяся из |
точки |
|||
(xj (0), 0), |
описывается уравнением |
|
||||
|
|
Хі =■-----х\ + |
Xj (0). |
(21.6) |
||
Траектория (21.6) |
пересекается |
с прямой (21.4) в точке |
||||
|
Хі = |
-----а “Ь 1^2я [а -р Хі (0)|, |
|
|||
|
х2 |
У а — | / 2 [а + |
Хі(0)] |
|
||
в момент |
времени |
|
|
|
|
(21.7) |
|
|
|
|
|
||
|
т = У 2 1а. |
Хі (0)] |
— Уа. |
(21.8) |
||
После переключения система (16.2) движется по |
пара |
|||||
боле |
|
|
|
|
|
|
Хі = -у- х\ — За — Хі (0) + 2 У 2а [а + хг (0)]. |
(21.9) |
Из соотношений (21.5)—(21.9) получаем, что система (16.2)
с управлением и* |
(х) из начального состояния (хх (0), 0) |
||
за время Т° (xt (0), |
0) попадает в точку N с координатами |
||
Хі (Т°) = |
За + Ъхі (0) — 2 У2а [а + хх (0)] Д- |
||
|
+ 4 У ахі (0) |
— 4 У 2хі (0) [а -f хг (0)], (21.10) |
|
х2 (Г°) = |
2 { /^ ( 0 ) |
Т У а |
- У 2 [ а + хДО)]}. |
При изменении величины хх(0) от значения а — S до а точка N перемещается по криволинейному отрезку RO от точки R к точке О (рис. 21.1). При изменении величины х{ (0) от а до значения а .+ б точка N перемещается по криволинейному отрезку РО от точки О к точке Р. Выра
198 |
ЗАДАЧИ БЫСТРОДЕЙСТВИЯ |
[ГЛ II |
жения (21.10) можно рассматривать как параметрические уравнения кривых RO и РО (параметр х1 (0)).
Легко видеть, что все траектории системы (16.2) с управ лением й* (X), начинающиеся в точках х (0) GE Ѵъ окан чиваются к моменту Т° (х (0)) в точках отрезков ВО и РО.
Разлагая правые части выражений (21.10) в ряд по
|
|
|
„ |
х\ (0) — а |
получаем |
|
||||
степеням переменной |
— —-----, |
|
||||||||
|
а |
( х\ (0) -- а |
а |
/ |
хі (0) — а \з |
|||||
(т°) = - ! Г \ |
а |
J |
|
|
|
|
а |
) |
||
*,(Г°) = - |
У |
а / |
X, (0) — а |
\2 3 У |
а |
I хі (0) — а \3 |
||||
8 |
|
а |
I |
+ |
32 |
[ |
а |
) |
||
|
|
(21.11)
где многоточием обозначены члены, имеющие более высо-
„ |
„ |
х\ (0) — а |
кии порядок малости по переменной |
----- ------ . |
|
Подставляя в ряды (21.11) |
вместо величины хх (0) зна |
чения а + б, можно получить координаты точек Р и R. Из выражений (21.11) видно, что отрезки RO и РО находятся в окрестности W точки х = х' = 0, радиус которой имеет при б —> 0 порядок величины б2, т. е. на порядок меньше радиуса области Ѵх.
Таким образом, аппроксимация линии переключения S с помощью прямой линии может принести хорошие резуль таты, если область Ѵх возможных начальных состояний системы (16.2) достаточно мала.
Заметим, что радиус окрестности W можно сделать еще меньше, если аппроксимировать отрезок Sxне касательной (21.4), а некоторой секущей; однако порядок радиуса при этом не изменится.
Если область Ѵ2 представляет собой достаточно малую окрестность начала координат, то часть S2 линии S, обслу живающую область Ѵ2, можно аппроксимировать с по мощью прямой П2
хх + ах2 = 0,
где а = const. При наличии закона стабилизации
и = — sgn (хх + ах2),
где а 0, система (16.2) асимптотически стремится в нача ло координат [16]. При этом законе стабилизация осущест вляется в скользящем режиме.
Si |
6 СИНТЕЗЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ |
199 |
§ 22. |
Пример из динамики полета |
|
Рассмотрим в качестве примера задачу синтеза' опти мального управления движением летательного аппарата в вертикальной плоскости.
Система дифференциальных уравнений четвертого по рядка, рассматриваемая в настоящем параграфе, описы вает движение крылатого летательного аппарата в верти кальной плоскости в предположениях о постоянстве скорости V центра тяжести аппарата, безынерционное™
рулевого привода, |
а также при некоторых других допуще |
|
ниях, |
позволяющих линеаризовать уравнения. Эта система |
|
имеет |
вид [8, 44] |
|
|
*і = |
— х3, |
|
х2 — |
(22.1) |
|
|
|
|
х3 — а33х3 -{- лзіхі -f- Ъ3и -f- с3, |
|
|
Х \ = |
Ö 43T 3 - (й- , ц Х \ “ Ь |
Здесь хх — безразмерная вариация высоты центра масс аппарата над землей, ж2, х3, хк — безразмерные значения соответственно угла тангажа, угла атаки, угловой скоро
сти тангажа, т — безразмерное |
время, |
и — приведенный |
|
угол отклонения рулей высоты, |
| и | ^ |
1 (рис. |
22.1). |
Первое и второе уравнения в системе (22.1) |
есть кине |
||
матические соотношения, третье — уравнение |
проекций |
сил на нормаль к траектории аппарата, четвертое — урав нение моментов сил относительно центра тяжести. По стоянные коэффициенты а33, й34, й43, а44, Ь3, 64, с3 определя ются аэродинамической и весовой компоновкой аппарата и скоростью движения центра тяжести.
200 |
ЗАДАЧИ БЫСТРОДЕЙСТВИЯ |
[ГЛ. it |
Регулируемой в системе (22.1) является координата хх, т. е. вариация высоты аппарата над землей. Заметим, что переменная ххне входит в правые части системы (22.1), по этому начало отсчета ее может быть любым. Пусть желае мым значением регулируемой координаты является значе
ние хх — 0, т. е. |
желаемым является движение |
аппарата |
||||
на некоторой постоянной высоте. |
|
|
||||
Из уравнений (22.1) определяются единственные, так |
||||||
называемые «балансировочные», значения |
|
|||||
х2 = х2 |
Ь4ез |
То |
- Х 3 = |
Х 2, .Г4 |
О, |
|
Ь з в із — |
||||||
|
Ъхсізз ’ |
|
|
(22. 2) |
||
|
|
и — u' = |
« 4 3 C 3 |
|||
|
|
|
||||
|
|
Ъхазз — |
ЬзЯіз |
|
||
|
|
|
|
переменных х2, х3, т4, и, при которых имеет |
место тождест |
|||
во хх = 0. |
Другими словами, при и = |
и’ |
выражения |
|
хх = |
const, х2 = х2, х3 = х3, |
т4 = |
т4 |
(22.3) |
определяют решение системы (22.1). Решение (22.3) си стемы (22.1) соответствует движению аппарата на постоян ной высоте.
Рассмотрим в качестве области Ѵх возможных началь ных состояний системы (22.1) множество, определяемое соотношениями
а хх ^ Ь, |
х2 = х2, х3 = х3 = х2, т4 = т4 = 0. |
(22.4) |
||
Каждое начальное состояние из |
множества (22.4) соответ |
|||
ствует движению аппарата на постоянной высоте. |
|
осу |
||
Будем рассматривать задачу синтеза управления, |
||||
ществляющего быстрейшее приведение системы (22.1) |
из |
|||
всех начальных состояний х (0) |
Ѵх в состояние |
х = |
х'. |
|
Иначе говоря, |
будем рассматривать задачу синтеза |
управ |
ления, осуществляющего быстрейшее выведение аппарата на заданную высоту полета при условии, что значения на чальных высот полета принадлежат некоторому диапазону
Іа, Ь].
Поставленная задача решалась с помощью аналоговой вычислительной машины (АВМ) МН-14 и цифровой вычис
лительной |
машины (ЦВМ) «Наири» при а = |
— 1, b = |
= —0,5 |
и при следующих гипотетических |
значениях |