
vostrikov
.pdf

452 |
Глава 13. ОПТИМАЛЬНЫЕ СИСТЕМЫ |
Сумма двух экспонент может только один раз изменить знак, что соответствует однократному переключению управляющего воздействия (рис. 13.9, а), либо не изменит знака совсем. В последнем случае не будет переключений управляющего воздействия (рис. 13.9, б).
13.5. МЕТОД ПОВЕРХНОСТИ ПЕРЕКЛЮЧЕНИЯ
13.5.1. ОСНОВНЫЕ ПОНЯТИЯ
Этот метод применяется для формирования оптимального управления в виде обратной связи в случае, когда управление носит разрывный (релейный) характер.
Рассматривается общая задача синтеза оптимальной системы для объекта (13.1)
|
f (x,u), |
x |
R |
n |
, |
u R |
m |
, m n |
x |
|
|
и переход из произвольных начальных состояний x(0) в заданные конечные x(T ) в соответствии с некоторым критерием оптимальности
|
|
|
|
T |
|
|
|
|
|
J min f0 x, u |
d . |
(13.42) |
|||
|
|
u |
u 0 |
|
|
||
|
|
|
|
|
|||
Оптимальный закон управления в этом случае имеет вид |
|
||||||
|
|
|
|
sgnS x |
|
|
|
|
|
u0 U |
, |
(13.43) |
|||
|
|
Rm – вектор максимальных значений управления, S |
Rm – |
||||
где U |
вектор функций, определяющих в пространстве состояний некоторую поверхность, которая называется поверхностью переключения [42]
S x 0 . |
(13.44) |
Для определения этой поверхности предварительно конечная точка «приводится» к началу координат с помощью замены переменных
x x x(T ) . (13.45)


454 Глава 13. ОПТИМАЛЬНЫЕ СИСТЕМЫ
Таким образом, метод поверхности переключения позволяет получить оптимальный закон управления в виде обратной связи. Однако при этом приходится рассматривать две совокупности начальных условий: для переменных состояния x(0) и сопряженных координат (0) , что
существенно затрудняет определение управляющего воздействия.
13.5.2.МЕТОД ОБРАТНОГО ВРЕМЕНИ
Сцелью упрощения задачи определения поверхности переключе-
ния |
предлагается поменять местами начальную x(0) и конечную |
x(T ) |
0 точки, что в пространстве состояний соответствует движению |
в обратную сторону. Для динамической системы это означает замену времени t на –t. При этом вместо двух совокупностей начальных усло-
вий |
x(0); (0) нужно рассматривать только одну – (0) , так как |
x(0) |
0 . |
Постановка задачи синтеза оптимальной системы в обратном времени формулируется следующим образом. Для объекта
x f (x,u)
с ограниченным ресурсом управления необходимо определить оптимальное управление в виде обратной связи, которое обеспечивает переход из начальной точки x(0) 0 в конечную x(T ) в соответствии с
критерием оптимальности (13.4). При этом заранее известно, что оптимальное управление имеет релейный характер.
Отметим, что в этом случае необходимо перебирать только одну совокупность начальных условий (0) . Причем каждому конкретному значению i (0) соответствует оптимальная траектория перехода из заданной начальной точки x(0) 0 в некоторую конечную xi (T ) .
В соответствии с методом поверхности переключений в пространстве состояний на траекториях перехода выделяются точки, где происходит смена знака управления и объединяются в поверхность
S(x) xn F(x1) .

13.5. Метод поверхности переключения |
455 |
В обычном времени следует изменить направление движения на противоположное. В результате находится оптимальное управление в виде (13.43)
u0 U sgn S x
или в форме (13.48).
ПРИМЕР 13.5
Рассмотрим процедуру определения оптимального управления методом обратного времени для объекта
y |
1 |
u |
|
p2 |
|||
|
|
с ограничением на управление u A . Необходимо перейти из начальной
точки x 0 в конечную x T 0 с критерием оптимальности
t
J min d .
u |
u 0 |
|
Запишем уравнения объекта в переменных состояния
x1 x2 , x2 u,
где x1 y, x2 y .
Поскольку рассматривается задача оптимального быстродействия, оптимальное управление носит релейный характер
u0 A sgn 2 .
Для определения u0 в виде функции переменных состояния используем метод поверхностей переключения. Предварительно запишем уравнения объекта в обратном времени
x1 x2 , x2 u.

456 |
Глава 13. ОПТИМАЛЬНЫЕ СИСТЕМЫ |
|
Будем решать следующую задачу перехода: x(0) 0 x (T) . Для получе- |
ния фазовых траекторий в пространстве состояний воспользуемся методом непосредственного интегрирования и рассмотрим последовательно два значения оптимального управления.
1. Случай, когда u0 |
A . Уравнения замкнутой системы имеют вид |
||||||
|
|
x1 |
|
x2 , |
|||
|
|
x2 |
|
|
A. |
||
Интегрируя последовательно второе, а затем первое уравнения, получим |
|||||||
|
x2 (t) |
x2 |
0 |
|
At, |
||
|
x (t) |
x |
0 |
|
1 |
At2 |
|
|
|
|
|||||
|
1 |
1 |
|
|
2 |
|
|
|
|
|
|
|
|
||
или при нулевых начальных условиях |
|
|
|
|
|
||
|
x2 (t) |
|
|
At, |
|||
|
x (t) |
|
1 |
At2. |
|||
|
|
|
|||||
|
1 |
|
2 |
|
|
|
|
|
|
|
|
|
|
||
Теперь исключим время |
t |
x2 A , и запишем уравнение фазовой тра- |
ектории, выходящей из начала координат при положительном управлении,
|
|
|
|
|
|
|
|
|
|
x2 |
|
|
2 Ax1 . |
||||
2. Случай, когда u0 |
A . При этом уравнения замкнутой системы |
|||||||
следующие: |
|
|
|
|
|
|
|
|
|
|
x1 |
|
|
x2 , |
|||
|
|
x2 |
|
|
A. |
|
|
|
После интегрирования имеем |
|
|
|
|
|
|
|
|
|
x2 (t) |
x2 (0) |
At, |
|||||
|
x (t) |
x (0) |
1 |
At2 |
||||
|
|
|||||||
|
1 |
|
1 |
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
или |
|
|
|
|
|
|
|
|
|
x2 (t) |
|
|
At, |
||||
|
x (t) |
|
|
1 |
At2. |
|||
|
|
|
|
|||||
|
1 |
|
2 |
|
|
|
||
|
|
|
|
|
|

13.5. Метод поверхности переключения |
|
|
|
457 |
|
Исключая время, t x2 A , получаем |
|
|
|||
|
1 |
|
x2 |
2 |
|
x1 |
A |
. |
|||
2 |
A |
||||
|
|
|
В этом случае уравнение фазовой траектории, выходящей из начала координат при отрицательном управлении, принимает вид
x2 2A x1 .
Для каждой фазовой траектории (рис. 13.11) определим направление движения и оставим ту половину параболы, которая соответствует движению из начала координат. Затем объединим эти две полутраектории в одну и получим уравнение линии переключения
x2 |
2 A |
x1 |
sgn x1 . |
|
xn |
u = –А
x1
u = +А
Рис. 13.11. Определение линии переключений к примеру 13.5
Оптимальный закон управления следующий:
u0 A sgn x |
|
|
|
|
2A |
x |
|
sgn x . |
|
2 |
|
1 |
1 |
Теперь изменим направление движений на противоположное, т. е. вернемся к обычному времени (рис. 13.12).

458 |
|
|
|
Глава 13. ОПТИМАЛЬНЫЕ СИСТЕМЫ |
|
u = –А |
|
x2 |
|
|
|
|||
|
|
|
|
|
|
|
X3(0) |
X1(0) |
|
|
|
|
|
|
|
|
|
|
X2(0) |
|
|
|
|
|
|
|
|
|
|
x1
X4(0)
u = +А
Рис. 13.12. Оптимальные траектории движения из различных начальных условий
Оптимальные траектории движения системы представляют собой участки парабол (рис. 13.12). Если начальная точка не принадлежит линии переключений, то в системе может быть только одно переключение управления (точки X1(0), X2(0) и X4(0)). Переключений не будет совсем, если начальная точка находится на линии переключений (начальные условия
X3(0)).
13.6. СУБОПТИМАЛЬНЫЕ СИСТЕМЫ
Субоптимальными будем называть системы, которые близки по свойствам к оптимальным с заданной точностью. Точность приближения к оптимальной системе определяется соотношением
J J 0 |
100 % , |
(13.49) |
|
J 0 |
|||
|
|
где J – критерий, соответствующий субоптимальной системе.
Такую систему получают в результате либо аппроксимации оптимального закона управления, либо искусственного ограничения рабочей области пространства состояний.
Рассмотрим релейный оптимальный закон управления u0 U sgn S (x) .

13.6. Субоптимальные системы |
459 |
Поверхность переключения сложной конфигурации можно аппроксимировать, например, следующим образом:
S(x) c1x1 cn xn , |
(13.50) |
представить в виде совокупности функций
S(x) f1(x) fn (x) |
(13.51) |
или аппроксимировать каким-либо другим способом. При этом будут получаться субоптимальные системы, с различной степенью точности близкие к оптимальным.
Обсудим особенности субоптимальных систем на примере.
ПРИМЕР 13.6
Рассмотрим оптимальную по быстродействию систему (см. пример 13.5) и аппроксимируем линию переключения прямой (рис. 13.13).
Уравнение реальной линии переключения имеет вид
Sp (x) x2 Kx1 . x2
|
X1(0) |
|
|
|
|
|||
|
|
2 |
|
3 |
|
|
||
|
X1(0) |
|
X2(0(0) |
|
XX3(0) |
|
||
|
|
|
|
|
|
|
x |
|
Идеальнаядеалинияь ая л ния |
|
|
|
|
|
|||
|
|
|
|
|
||||
|
|
|
|
|
||||
|
|
|
|
|
|
x1 |
||
|
|
|
|
1 |
переключениячения
Реальная линия
Реальная линия
переклю чения
переключения
Рис. 13.13. Фазовый портрет субоптимальной системы к примеру 13.6
Процессы в субоптимальной системе будут существенно зависеть от начальных условий. Так, при движении из X 1(0) изображающая точка сис-
темы попадает на реальную линию переключений Sp (x) , а затем движется вдоль нее в скользящем режиме.

460 |
Глава 13. ОПТИМАЛЬНЫЕ СИСТЕМЫ |
Из начальных условий X 2(0) изображающая точка системы будет попадать в точку пересечения идеальной и реальной линий переключения и к началу координат будет двигаться по соответствующему участку идеальной линии переключений, т. е. по оптимальной траектории.
При движении из X 3(0) изображающая точка системы будет доходить до Sp (x) , переключаться на траекторию, соответствующую другому знаку
управления, вновь попадать на реальную линию переключений и двигаться вдоль нее в скользящем режиме.
Таким образом, в субоптимальной системе могут быть строго оптимальные процессы, только если из начальных условий изображающая точка системы по фазовой траектории попадает в точку пересечения идеальной и реальной линий переключения.
ЗАКЛЮЧЕНИЕ
С появлением рассмотренных методов оптимизации переходных процессов в теории автоматического управления возник ряд инженерных методов проектирования. Особенно распространенными стали релейные системы оптимизации по быстродействию. В начале главы рассмотрен случай системы первого порядка, когда алгоритм оптимального управления практически не зависит от параметров объекта и возмущения. К сожалению, этот случай крайне редкий; в подавляющем большинстве система автоматики должна подавлять действие возмущений, и вид оптимальных процессов, а следовательно, и алгоритм управления зависят от возмущений. При этом характер изменения самих возмущений во времени неизвестен. Это обстоятельство резко снизило интерес инженеров к математическим методам оптимального управления.
Есть, однако, несколько конкретных технических ситуаций, когда возможности математической теории оптимального управления могут использоваться в полной мере. Показательным примером может служить задача автоматического управления лифтами и подъемниками. При этом параметры объекта (масса груза) меняются от процесса к процессу, а ограниченным является только значение старшей производной от положения (выходной величины). Старшей производной является ускорение кабины лифта или какая-либо его производная. В пассажирских подъемниках они должны быть ограничены условиями комфорта пассажиров, а в грузовых – условиями прочности конструкции (ограничен должен быть рывок).