
ТУ - лекции Шмырова / Лекции по ТУ / 24
.pdfЛекция 24. Оптимальное демпфирование переходных процессов. Примеры.
Теорема об управлении оптимальном по быстродействию.
Рассмотрим управляемую систему.
dxs |
= fs(x1; : : : ; xn; u1; : : : ; ur; t): |
(1) |
|
dt |
|||
|
|
Пусть задана начальная точка x0 и момент t0. Тогда каждому управлению u 2 G (G некоторое множество, например, кусочно-непрерывных вектор-функций) отве- чает движение
x = x(t; u; x0; t0); |
(2) |
проходящее через точку x0 ïðè t = t0. Пусть S некоторая поверхность в пространстве переменных t; x1; : : : ; xn, задаваемая уравнением
S(t; x1; : : : ; xn) = 0; |
(3) |
Задача управления пусть состоит в выборе u 2 G так, чтобы в некоторый момент
t1 интегральная кривая (2) системы (1) достигла поверхности S (3) при этом управлении (u1; : : : ; ur) и фазовые координаты (x1; : : : ; xn) удовлетворяли ограничениям
Vj(x1; : : : ; xn; u1; : : : ; ur; t) · 0; j = 1; 2; : : : ; k |
(4) |
(Vj могут быть, в частности, функционалами). Но хотя мы имеем некоторый про-
цесс (уравнения движения) и условия его протекания (ограничения, начальное и конечное состояния), задача выбора управляющих параметров процесса может не иметь однозначного решения. Рассмотрим еще функцию V (t; x1; : : : ; xn), которая
определяет в каком-либо смысле расстояние от переходного процесса (движущейся точки (2)) до желаемого его конечного состояния (поверхности S). Пусть роль
системы управления сводится к тому, чтобы это расстояние уменьшать. Тогда естественным становится понятие об оптимальном управлении по отношению к демпфированию функции V .
Определение 1. Управление u0 = fu01; : : : ; u0rg называется оптимальным по отношению к демпфированию функции V , если эта функция V убывает вдоль траектории
x(t; u0) = x0(t), соответствующей этому управлению, наибольшим образом. Вычислим значение функции V на движении (2) и найдем полную производную
ïî t от полученной функции. Будем иметь
dV |
= |
@V |
+ |
n |
@V |
fs = W (t; x; u): |
(5) |
|
|
|
|
||||
dt |
|
@t |
|
Xs |
|
||
|
|
=1 |
@xs |
|
|||
|
|
|
|
|
|
|
Оптимальное управление по отношению к демпфированию функции V необходимо доставляет наименьшее возможное отрицательное значение функции W (t; x; u)
102
среди всех допустимых управлений (управлений, которые переводят точку x0 íà ïî- верхность S и при этом удовлетворяют ограничениям (4))
Пример 1. Рассмотрим линейную систему
|
|
n |
r |
|
dxs |
|
Xi |
X |
(6) |
|
= |
|
asixi + bsjuj; s = 1; : : : ; n: |
|
dt |
=1 |
j=1 |
|
|
|
|
|
Будем считать элементы матрицы A = fasig постоянными вещественными числами,
à B = fbsjg либо вещественными постоянными, либо функциями времени. Предположим, что при положение равновесия x = 0 асимп-
тотически устойчиво по Ляпунову. Тогда существует положительно определенная квадратичная форма V , удовлетворяющая уравнению
(grad V; Ax) = ¡x2; |
(7) |
и притом единственная.
Будем считать, что функция V определяет расстояние интегральной кривой си-
стемы (6) до точки x = fx1; : : : ; xng = 0. Построим управление u, оптимальное к демпфированию функции V , т. е. управление (u1; : : : ; ur) необходимо выбрать так, чтобы функция V убывала наибольшим образом вдоль траектории системы (6).
Предположим, что (u1; : : : ; ur) удовлетворяет условию
jujj · 1; j = 1; 2; : : : ; r: |
(8) |
В этом случае функция |
|
W = ¡x2 + (grad V; Bu) |
(9) |
принимает наименьшее возможное значение при |
|
uj0 = ¡sign(Bj¤; grad V ); j = 1; 2; : : : ; r: |
(10) |
Подставляя (10) в (6), получим оптимальную автоматическую систему управле- |
|||||||
ния по отношению к демпфированию функции V (t; x): |
|
|
|
||||
dx |
n |
r |
n |
@V |
! |
(11) |
|
|
dts |
= i=1 asixi ¡ j=1 bsj sign |
Ãl=1 |
@xl blj |
|||
|
|
X |
X |
X |
|
|
Правые части системы оказываются разрывными, и поверхности их разрыва определяются уравнениями
n |
@V |
bsj = |
n |
csjxs = 0; j = 1; 2; : : : ; r: |
(12) |
|
|
|
|||
=1 |
@xs |
=1 |
|
|
|
Xs |
|
|
Xs |
|
|
В системе (11) возникает, вообще говоря, непродолжимость движений через поверх-
ности разрыва (12). В физических системах за счет инерционности происходят малые вибрации около поверхности разрыва.
103

Пример 2. Рассмотрим движение точки в фазовом пространстве с постоянной по величине и управляемой по направлению скоростью
|
dxs |
n |
|
|
|
|
|
|
= us; us2 |
= 1; s = 1; 2; : : : ; n: |
|||||
dt |
|||||||
|
=1 |
|
|
|
|
||
Положим |
|
Xs |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
V (x) = v |
xs2: |
||||
|
|
|
us=1 |
|
|
||
|
|
|
uX |
|
|
||
|
|
|
t |
|
|
(13)
(14)
Управление, оптимальное по отношению к демпфированию функции V , определяется путем нахождения наименьшего возможного значения функции
W = |
n |
@V |
us: |
(15) |
|||
Xs |
|
|
|||||
|
@xs |
|
|
||||
|
=1 |
|
|
||||
|
|
|
|
|
|
||
Отсюда |
|
|
|
|
|
|
|
us0 = ¡ |
|
|
xs |
: |
(16) |
||
|
|
|
|||||
|
|
n |
|||||
|
|
|
|
P |
|
|
|
|
|
ri=1 xi2 |
|
|
Покажем, что при управлении (16) движущаяся точка из любой заданной точки
x = fx01; : : : ; x0ng попадает в начало координат. Система (13) при управлении (16) имеет вид
dxs |
|
|
xs |
|
(17) |
||||||
|
|
|
= ¡ |
|
|
|
: |
||||
|
dt |
|
|
n |
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
P |
|
|
|
|
|
|
|
|
|
ri=1 xi2 |
|
|
||
Умножая s-е уравнение системы (17) на xs и суммируя по s, получим |
|
||||||||||
|
|
1 d |
|
|
|
|
|
||||
|
|
|
|
|
r2 = ¡r; |
|
(18) |
||||
ãäå |
|
2 |
dt |
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
Xi |
|
|
|||
|
|
r2 = |
|
|
xi2: |
|
|
||||
|
|
|
|
|
|
|
=1 |
|
|
|
Интегрируя уравнения (18), найдем r = ¡t¹ + r0. Следовательно, движущаяся точка попадает в начало координат в момент
|
n |
|
|
|
uX |
(0)2 |
|
|
t |
|
|
t¹ = r0 |
= v |
xi |
: |
|
ui=1 |
|
|
Легко показать, что t¹ является наименьшим возможным временем, за которое движущаяся точка может из точки попасть в начало координат.
104
Таким образом, в данном случае управление u0, оптимальное по отношению к
демпфированию функции V , является одновременно оптимальным по быстродействию.
Определение 2. Управление напзывается оптимальным по
быстродействию, если среди управлений, переводящих начальную точку x¹ на поверхность (в частности, начало координат), оно доставляет времени перехода
T = t1 ¡ t0 |
= tZ0 |
d¿ |
|
t1 |
|
наименьшее возможное значение.
Теорема 1. Пусть: ) управление u = fu01; : : : ; u¹0rg является оптимальным по отношению к демпфированию функции V (t; x); 2) функция V (t; x) вещественна, непре-
рывна и положительна при всех t; xs; s =; : : : ; n, за исключением V (t; x) = 0 ïðè
S(t; x1; : : : ; xn) = 0 (на поверхности); 3) функция V (t; x) непрерывно дифференциру-
ема вдоль движения системы (1) при любом управлении u 2 G, причем dvdt = ¡1 при управлении u0 - оптимальном в смысле демпфирования функции V (t; x).
Тогда управление u0 и соответствующее ему движение x0(t) = x(t; x0; u0; t0) будут оптимальными по быстродействию.
Доказательство. Покажем сначала, что интегральная кривая системы (1) при управлении u = u0 достигает поверхности S. Иначе говоря, управление u0 переводит
систему из состояния x0 на поверхность S за время t1. По условию теоремы вдоль движения x0(t) имеет место равенство dVdt = ¡1. Интегрируя его по t, найдем
V (x(t); t) = V (x0; t0) + t0 ¡ t:
Так как функция V (t; x) не принимает отрицательных значений и только на по-
верхности S обращается в ноль, то существует такой момент t1 = t0 + V (x0; t0), ÷òî
x0(t1) = x(t1; x0; u0; t0) 2 S.
Пусть время T = t1 ¡ t0 = V (x0; t0) будет не оптимальным по быстродействию. Тогда существует управление u~ 2 G, переводящее точку x0 на поверхность S за время
T ¤ = t¤1 ¡ t0, причем T ¤ < T .
Так как управление u0 - оптимальное по отношению к демпфированию функции V (t; x), то для любого другого управления u~ и соответствующего ему движения
x~(t) = x(t; x0; t0; u~) будет dVdt = ¡1 + ®(t), ãäå ®(t) ¸ 0 - функция, заданная при |
|||||
t |
2 |
[t |
; t¤ |
]. |
|
|
0 |
1 |
|
|
|
|
|
Интегрируя это равенство, найдем |
|
||
|
|
|
|
t¤ |
|
|
|
|
|
¡V (x0; t0) = ¡(t1¤ ¡ t0) + Z1 |
®(t)dt; |
t0
откуда
Zt¤1
T ¤ ¡ T = ®(t)dt; ¸ 0;
t0
105
что противоречит предположению.
¥
106