
книги из ГПНТБ / Зубов В.И. Математические методы исследования систем автоматического регулирования
.pdfрешение системы (9.1) было асимптотически устойчиво и любое решение удовлетворяло оценке вида
|
r (t, |
Ухо, |
• • •. Упо, to) < aif e~Plo (t~u), |
(9.19) |
где a x, px > |
0 при |
t > |
t0, необходимо и достаточно, |
чтобы суще |
ствовали две квадратичные формы V и W, удовлетворяющие усло |
||||
виям (9.17) |
и (9.18). |
|
|
Действительно, как показал А. М. Ляпунов, любое решение системы (9.1) при ограниченных коэффициентах удовлетворяет
неравенству |
|
Г (t, Ую, ■■; УПО, к) > а 2Г0е_Рг U~U) (t ^ t0), |
(9.20) |
где a 2, р 2 > 0.
Из неравенств (9.19) и (9.20) следует, что выполнено нера венство вида (9.16), а тогда из следствия 1 вытекает очевидность существования двух квадратичных форм V и W, удовлетворяющих
(9.17) и (9.18).
Обратное утверждение содержится в следствии 1.
10. |
Оптимальное демпфирование |
переходных |
|
|
процессов |
Рассмотрим управляемую систему |
|
|
dx |
(Xi, ■■; Хп, иъ . . ., un t). |
(10.1) |
- d t = f s |
Предположим, что заданы начальная точка х° и момент t0. Тогда каждому управлению u£ G (G —- некоторое множество, на пример кусочно-непрерывных вектор-функций) отвечает движение
|
Гх = х (/, и, |
х°, |
t0), |
(10.2) |
|
проходящее через точку х° при |
t = |
t0. |
|
||
Пусть S — некоторая поверхность в пространстве переменных |
|||||
t, х 1У . . ., |
хп, задаваемая уравнением |
|
|
||
|
S ( t , x 1, . . . , x „ ) |
= |
0. |
(10.3) |
|
Задача |
управления состоит в таком |
выборе u £ G |
так, чтобы |
в некоторый момент tx интегральная кривая (10.2) системы (10.1) достигала поверхности 5 (10.3), при этом управления ult . . ., иг
и фазовые координаты х х, . . |
., хп удовлетворяют ограничениям1 |
Vj(xy, . . . , хп, « х, . . ., |
ur, t ) ^ 0 ( / = 1 , 2 , . . . , k). (10.4) |
Хотя имеем некоторый процесс уравнения движения и условия его протекания (ограничения, начальное и конечное состояние), задача выбора управляющих параметров процесса может не иметь
1 В неравенстве (10.4) V/ могут быть, в частности, функционалами.
ПО
однозначного решения. |
Рассмотрим еще функцию |
V |
(t, x lt . . . |
. . хп), которая определяет в каком-либо смысле |
расстояние |
||
от переходного процесса |
[движущейся точки (10.2)] |
до его желае |
мого конечного состояния (поверхность 5). И пусть роль системы управления сводится к тому, чтобы это расстояние уменьшать. Тогда естественным становится понятие об оптимальном управ лении по отношению к демпфированию функции V.
Определение 15
Управление и = («ь . . ., иг) называется оптимальным по отношению к демпфированию функции V, если эта функция V убывает вдоль траектории х (t, u°) = х° (t), соответствующей этому управлению, наибольшим образом.
Вычислим значение функции V на движении (10.2) и найдем полную производную по t от полученной функции. Будем иметь
dV |
__ дУ |
< - 2 |
дУ |
(10.5) |
dt |
dt |
dxs fs = W (t, x, U). |
||
|
|
s=l |
|
Оптимальное управление по отношению к демпфированию функ г ции V необходимо доставляет наименьшее возможное значение функции W (t, х, и) среди всех допустимых управлений [управ лений, которые переводят точку х° на поверхность 5 и при этом удовлетворяют ограничениям (10.4) ].
П р и м е р 1. Рассмотрим линейную систему
4 4 |
= У a*iXi + |
S b*iui (s = 1....... ") • |
(10-6) |
dt |
i= о |
/= 1 |
|
Будем считать элементы матрицы А = {aS(-} постоянными вещественными чис лами, а В = {bSj } — либо вещественными постоянными, либо функциями вре
мени.
Предположим, что при u = {ult . . ., иг) = 0 положение равновесия х = 0
асимптотически устойчиво по Ляпунову. Тогда существует положительно-оп ределенная квадратичная форма V, удовлетворяющая уравнению
(grad V, Л х) = — х 2, |
(Ю.7) |
и притом единственная.
Будем считать, что функция V определяет расстояние интегральной кривой
системы (10.6) до точки х = |
\х1, . |
. ., |
хп} = 0. Построим управление и, опти |
||||
мальное к демпфированию функции V, |
т. е. управление иъ . . ., иг |
необходимо |
|||||
выбрать так, чтобы функция убывала |
наибольшим |
образом |
вдоль траектории |
||||
системы (10.6). |
|
|
|
|
|
|
|
Предположим, что «х...........иг удовлетворяют условию |
|
|
|||||
\Uj \ |
1 (/ = |
1, |
2, . . ., |
г). |
|
|
(10.8) |
В этом случае |
|
(grad V, Ви) |
|
|
(10.9) |
||
W = —х2 + |
|
|
|||||
принимает наименьшее возможное значение при |
|
|
|
||||
«° = — sign (в !, |
grad V) |
(/ = |
1, . • |
г). |
(10.10) |
||
|
|
|
|
|
|
|
И1 |
Подставляя (10.10) в систему (10.6), получим оптимальную автоматическую систему управления по отношению к демпфированию функции V (t, х):
dxs |
п |
г |
П дУ |
( 1 0 |
. 11) |
dt |
— ^ |
asix t — ^ bSj sign |
дх$ bsi |
||
г=1 |
/= i |
|
|
Правые части системы оказываются разрывными, и поверхности их разрыва определяются уравнениями
S |
дхдУ5 bsj = |
S csjXs = 0 (/ = 1 , 2 ..........г). |
( 10. 12) |
s = l |
|
s~ l |
|
В системе (10.11) возникает, вообще говоря, непродолжимость движений через поверхности разрыва (10.12). В фактических системах за счет инерцион ности происходят малые вибрации около поверхности разрыва.
П р и м е р 2. Рассмотрим движение точки в фазовом пространстве с постоян ной по величине и управляемой по направлению скоростью
dxs |
= «s(s= |
1, . . ., n); |
|
dt |
n |
|
(10.13) |
|
|
||
|
*=1 |
|
|
Положим |
|
|
|
P(X): / |
A 4 ' |
(10.14) |
Управление, оптимальное по отношению к демпфированию функции V,
определяется путем нахождения наименьшего возможного значения функции
(10.15)
s= 1 0XS
Отсюда
* ______ |
(10.16) |
Покажем, что при управлении (10.16) движущаяся точка из любой задан
ной точки х = {xj, |
. . .,х °} попадает в начало координат. |
Система (10.13) |
при управлении (10.16) имеет вид |
dxs |
______ xs |
dt |
Г п |
V S * ?
" 1=1
Умножая s-e уравнение системы (10.15) на xs и суммируя по S, получим
J L _d_
г,
2 dt
|
n |
где г2 = |
х\ . |
113
Интегрируя уравнение (10.16), |
найдем г — —/ + |
г. Следовательно, движу |
щаяся точка попадает в начало координат в момент |
|
|
i = r = |
л / 2 *!°)а- |
(10.17) |
"1=1
Легко показать, что t является наименьшим возможным временем, за ко
торое движущаяся точка может из точки х попасть в начало координат.
Таким образом, в данном случае управление U0, оптимальное по отношению
к демпфированию функции V, |
является одновременно оптимальным по быстро |
действию. |
|
|
Определение 16 |
Управление u = jи л, |
. . ., иг) называется оптимальным по |
быстродействию, если среди управлений, переводящих начальную
точку х на поверхность 5 (в частности, начало координат), оно доставляет времени перехода
t,
Т = tv— t0= j dr
наименьшее возможное значение.
Теорема 28
Управление и0 и соответствующее ему движение х° (t) = х (t, t0, х°, u°) будут оптимальными по быстродействию при выполнении следующих условий:
1) |
управление и0 = {«?, . . ., и°г\ является оптимальным |
по |
|||
отношению |
к |
демпфированию функции V (t, х); |
|
||
2) |
функция |
V (t, х) вещественна, непрерывна и положительна |
|||
при всех i, |
xs |
(s = |
1, . . ., п), за исключением V (t, х) = 0 |
при |
|
5 (t, |
х и . . |
., |
хп) = |
0 (на поверхности); |
|
3) |
функция |
V (t, х) непрерывно дифференцируема вдоль дви |
|||
жений системы (10.1) |
при любом управлении u£ G, причем |
= |
= ■— 1при управлении и0, оптимальном в смысле демпфирования функции V (t, х).
Доказательство. Покажем сначала, что интегральная кривая системы (10.1) при управлении и = и0 достигает поверхности S. Иначе говоря, управление и0 переводит систему из состояния х° на поверхность S за время tv
\з По условию теоремы, вдоль движения х° (t) имеет место ра венство
Интегрируя его по t, |
найдем V (х (t), t) = V (х°, £„) + U — t- |
Так как функция V (х, |
t) не принимает отрицательных значений и |
§ р . И. Зубов |
И З |
только на поверхности 5 обращается в нуль, то существует такой
момент tx — t0 + |
V (х°, ^0), что |
|
|
|
|||||
|
|
|
|
x°(*i) = |
x(fb x°,t0, u°)6 5. |
|
|
||
|
Пусть время Т = t x ~ |
t 0 = V (х°, /0) будет не оптимальным по |
|||||||
быстродействию. Тогда существует управление и 6 |
G, переводящее |
||||||||
точку х° на поверхность S за |
время Т — ti — to, причем Т |
«< |
|||||||
< т. |
|
|
|
|
|
|
|
|
|
|
Так как управление и0 оптимально по отношению к демпфиро |
||||||||
ванию функции V |
(х, t), |
то для любого другого управления и |
|||||||
и соответствующего ему движения х |
(t) = х (t, |
х, t0, и) будет |
|||||||
~ |
= |
— 1 |
-f а (t), |
где a |
(t) |
> 0 — |
функция, |
заданная |
при |
t e |
и |
о, |
* i * b |
|
|
найдем |
|
|
|
|
Интегрируя это равенство, |
* |
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
h |
|
|
|
|
|
- V { x \ t 0) = |
- { t \ - t o ) A - J a(t)dt, |
|
|
|||
|
|
|
|
|
|
|
to |
|
|
откуда
*
h
T * ~ T = J a ( t ) d t ^ 0,
to
что противоречит предположению. Теорема доказана.
З а м е ч а н и е . При управлении (10.16) вдоль соответствующего ему дви жения (пример 2) будет иметь место равенство
Как вытекает из теоремы, данное управление оптимально по быстродействию.
Будем считать, что исходная система линейно зависит от управ ления и имеет вид
dxs |
= f, (Xi, ■.., xn, 0 + S b si (Xi, ■. Xn, t) ut. |
(10.18) |
dt |
||
|
1=1 |
|
Предположим, что функция V (x, t), о которой идет речь в пре дыдущей теореме, существует. Пусть также управления и2, . .., иг, входящие в систему (10.18), подчинены ограничениям
\щ \ < 1 (I = I, 2, . . г). |
(10.19) |
Полную производную функции V (х, t) в силу системы (10.18) можно представить в форме
dv__ d K , |
_L |
V |
dV |
U |
( 10.20) |
||
dt |
. d t ^ Z j |
dxs ' s > |
Z j |
U‘ dxs |
0si' |
||
|
|||||||
|
s = l |
|
(= 1 |
|
|
|
114
Правая часть (10.20) достигает своего наименьшего значения при
|
П |
и}0) = —sign |
( 10.21) |
|
S = 1 |
Так как наименьшее значение правой части (10.20) равно — 1 в слу чае оптимальности по быстродействию, то, подставляя (10.21) в (10.20), будем иметь уравнения в частных производных
|
дУ |
1. |
( 10.22) |
|
dt |
дх* |
|||
|
|
|||
S= 1 |
f=l |
|
|
Формула (10.21) решает проблему синтеза (управление пред ставляет собой функцию от координат и времени, оптимальную по быстродействию). В общем случае, когда и 4 G, где G имеет более сложную природу, задача построения оптимального по быстро действию управления сводится к отысканию наименьшего воз можного значения линейной формы (10.20) в классе функций u£ G. Уравнение (10.22) можно рассматривать как уравнение для опреде ления функции V (t, х), которая, во-первых, непрерывна и поло
жительна при всех xs и t, |
за исключением V (t, х) = |
0 при S (t, |
x lt . . ., хп) = 0 (граничное условие), и, во-вторых, |
непрерывно |
|
дифференцируема по своим аргументам. |
|
|
Отметим при этом, что |
частные производные функции V {t, х) |
|
являются, вообще говоря, |
разрывными и поэтому решение урав |
нения (10.22) еще более затруднено.
Всвязи с этим поставим следующие задачи:
1)рассмотреть вопросы существования и единственности функ ции V (t, х) в задачах управления;
2)провести исследования уравнения (10.22) в частных про
изводных; 3) исследовать систему дифференциальных уравнений на по
верхностях разрыва, т. е.
П
3V |
, |
Л |
(г= 1, 2, ..., г). |
дх, |
bsi ~ |
° |
|
Заметим, что вместо функции V (t, х) можно взять некоторый функционал, определенный на движениях и управлениях, вхо дящих в систему (10.1). Рассмотрим самый простейший функционал такого типа. Пусть функция V (i, х) обладает теми же свойствами, что и ранее, а функция / 0 (х>и> 0 — теми же свойствами, что и правые части системы (10.1). Управление u (t) и соответствующее ему движение (10.2) при фиксированном времени t определяют значение функционала
< |
|
|
L = V(x (t, u), t) + J f |
0(x, u, t)dx. |
(10.23) |
to
8' |
115 |
Зададимся целью отыскать такое управление, чтобы вдоль соответствующего ему движения скорость убывания функцио нала (10.23) являлась наибольшей в точке (х°, t0). Найдем полную производную функционала (10.23) при t = t0:
dL |
=h (x°,u, g+ 2 |^s(x0, Mo) |
dt t—to |
dV (10.24) dt
S = 1
Пусть наименьшее возможное значение правая часть (10.24) принимает при umin (х°, t0). Положим u 0(x, t) = umm (х, t). Будем считать, что система (10.1) определяет движение
х° (0 = х(/, х°, *„)•
Положим
U0 (0 = U0 (х° (t), t)
ипусть u° (t) является допустимым управлением. Это управление
исоответствующее ему движение х° (t) будем называть оптималь ными по отношению к демпфированию функционала L.
Оказывается, что в каждой точке оптимальной кривой функ ционал L имеет наибольшую скорость убывания. Действительно,
пусть t > tQ— некоторый момент времени и х — соответствующая ему точка интегральной кривой х° (t). Возьмем произвольное управление u {t)£G при t^> i и оценим скорость изменения функ ционала L в точке (х , t) при этом управлении:
dL |
dV_ |
+ 2 |
M ) 4 - /0(x,u,?)s* |
dt t=t |
dt |
S— 1 |
|
|
|
|
|
|
|
u°’ |
+ /«(x>u ° *)• |
|
|
$=1 |
|
Это неравенство показывает, что скорость убывания функцио нала L в каждой точке оптимальной кривой является наибольшей.
Рассмотрим теперь связь систем управления, оптимальных в смысле демпфирования и в смысле интегрального функционала.
Обозначим через хх то фазовое состояние на поверхности S, |
ко |
торое достигается объектом управления (10.1) в момент tx > |
t о |
при некотором фиксированном и 6 G, т. е. S (xt, ... , *<0, П) = |
0. |
Предположим, что управление |
u (t) и соответствующее ему дви |
|||
жение (10.2) с концами |
х° и х1, |
заданные при t 6 |
П0, ПЬ харак |
|
теризуются значением |
некоторого |
функционала |
|
|
J (и, х°) = Р (tlt х1) + |
оJ /о (X, и, t) dt. |
(10.25) |
to
116
Определение 17
Управление и* и соответствующее ему движение х* (t) назы ваются оптимальными по отношению к функционалу J, если не равенство
J(u*, x * ) ^ J { u,x) |
(10.26) |
имеет место при любом выборе допустимого управления u^G .
|
|
|
Теорема 29 |
|
|
|
||
Управление и0 |
= |
{и?, . . ., |
иг) |
оптимально |
по |
отношению |
||
к демпфированию |
функционала |
L (10.23), где V (t, х) = Р ( |
i х1) |
|||||
на многообразии |
|
5 |
доставляет |
функционалу |
J |
(10.25) |
наи |
меньшее возможное значение среди всех управлений, переводящих точку х° в некоторую точку х1^ S, если это управление и0 (£) и соответствующее ему движение х° (t) удовлетворяют уравнению
s=l
Доказательство. Так как и0 является оптимальным управле нием в смысле демпфирования функционала L (10.23) и удовле творяет уравнению (10.27), то можно записать
ж + / . (*. < о = W { ж + 1.) = 0 |
|
|||
или |
|
|
|
|
W (t,x, u°) = miW(t, X, |
и) = — % , |
(10.29) |
||
|
и |
|
п |
|
где |
п |
|
|
|
|
|
|
|
|
W(t, |
X, “) = £ - ! £ - / , + /„• |
(10-30) |
||
|
s—i |
|
|
|
Вычислим значение |
функционала |
J |
(10.25) при |
управлении |
u° (t) и соответствующем ему движении. |
Для этого интегрируем |
равенство (10.27) в пределах от t0до того момента времени й, когда интегральная кривая попадает на поверхность S при управлении
и° (t):
V (х° (t°i), tT) — V (х°, t0) + J /о (х, и, т) ch = 0,
to
117
откуда
г1
J (u °) = р(х°{$), tf) + J/o(x, u, x)dx = V{x°, to)- (Ю.31)
to
Предположим, что управление u (t) допустимое и доставляет функционалу J меньшее значение, чем управление u° (t), т. е.
7 (и) < / (и0). Тогда в силу (10.28) или (10.29) для этого управ ления будем иметь
^ - + Ы Х,~^ t ) ^ a ( t ) , |
(10.32) |
где a(t) — неотри ц ательн а я |
ф ун к ц и я . |
tQдо t 1 — |
|
Интегрируя последнее неравенство в пределах от |
|||
момента времени, когда х (tv х°, |
t0, и) 6 S, получим |
|
|
t i |
|
11 |
(dx,т) |
Р (х1, /~) — V (х°, /0) 4- J f0(х, |
u , x ) d x ^ j а |
||
to |
|
to |
|
откуда |
|
|
|
/ (u) — J (u°) |
0, |
|
что противоречит выбору управления u (t). Это противоречие и доказывает утверждение теоремы.
Следствие. Рассмотрим систему (10.18) при ограничениях на управления (10.19). Пусть / 0 (х, u, t) = f 0 (х, t). В этом случае управление, оптимальное по отношению к демпфированию функ ционала L (10.23), определяется формулой (10.21) и уравнение (10.27) примет вид
ду_ |
п |
|
+ fo (х, 0 = 0. (10.33) |
||
dt |
||
s=l |
/=1 S= 1 |
Отсюда следует найти функцию V (t, х), удовлетворяющую усло вию V (t, х) = Р (t, х) на поверхности S.
Обратимся теперь к методу множителей Лагранжа, а затем перейдем к выводу принципа максимума Л. С. Понтрягина [37]. Этот принцип является необходимым условием оптимальности.
Пусть задана управляемая система:
|
x = f(x , и); |
(10.34) |
||
х — (хъ |
хп)\ |
и = (иь . . . , иг). |
||
|
118
Будем считать, что правые части системы (10.34) заданы при u£ U <= Еп Еп, вещественны и непрерывны по отношению к со вокупности всех переменных, а также непрерывно дифференци руемы по компонентам вектора х.
Определение 18
Вещественная кусочно-непрерывная векторная функция u (t) называется допустимым управлением, если выполняются следую щие условия:
1 ) |
u(t)eu, te it0, |
til; |
|
2) |
u |
(t) имеет левосторонние и правосторонние пределы в точ |
|
ках разрыва; |
на концах промежутка U0, t xl и при |
||
3) |
u |
(t) непрерывна |
нимает в точках разрыва значение, равное пределам слева. Пусть задано начальное состояние х° и конечное состояние х1
управляемой системы.
Определение 19
Допустимое управление |
u° (t), |
переводящее систему |
из |
на |
чального состояния в конечное за промежуток времени |
[t0, |
^ ], |
||
называется оптимальным по отношению к функционалу |
|
|
||
|
о |
|
|
|
j = |
i fo(x, |
u)dt, |
(10.35) |
|
|
и |
|
|
|
если среди всех таких допустимых управлений оно придает (10.35) наименьшее возможное значение. При этом начальный момент t0 и конечный момент t±могут быть как фиксированными, так и нет. Во всяком случае, начальный момент можно считать фиксирован ным, так как замена независимой переменной t на t + с, где с — вещественная постоянная, не меняет вида управляемой системы и множества допустимых управлений.
Будем предполагать, что функция / 0 обладает теми же свой ствами, что и компоненты вектора f в системе (10.34).
Предположим, что существует функция V (t, х), |
заданная при |
U0> t± ], х ^ Е п, вещественная, непрерывная, |
непрерывно |
дифференцируемая относительно компонент вектора х и такая, что V (tl7 х1) = 0. Положим
t |
|
Z = V (t,x ) + \ f Q(t,x ,u ) d t . |
(10.36) |
to |
|
Обозначим через W полную производную функции z вдоль
интегральной кривой системы (10.34): |
|
|
~ = |
(grad V, f(t, х, u)) + / 0, |
(10.37) |
119