Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Зубов В.И. Математические методы исследования систем автоматического регулирования

.pdf
Скачиваний:
32
Добавлен:
25.10.2023
Размер:
12.11 Mб
Скачать

решение системы (9.1) было асимптотически устойчиво и любое решение удовлетворяло оценке вида

 

r (t,

Ухо,

• • •. Упо, to) < aif e~Plo (t~u),

(9.19)

где a x, px >

0 при

t >

t0, необходимо и достаточно,

чтобы суще­

ствовали две квадратичные формы V и W, удовлетворяющие усло­

виям (9.17)

и (9.18).

 

 

Действительно, как показал А. М. Ляпунов, любое решение системы (9.1) при ограниченных коэффициентах удовлетворяет

неравенству

 

Г (t, Ую, ■■; УПО, к) > а 2Г0е_Рг U~U) (t ^ t0),

(9.20)

где a 2, р 2 > 0.

Из неравенств (9.19) и (9.20) следует, что выполнено нера­ венство вида (9.16), а тогда из следствия 1 вытекает очевидность существования двух квадратичных форм V и W, удовлетворяющих

(9.17) и (9.18).

Обратное утверждение содержится в следствии 1.

10.

Оптимальное демпфирование

переходных

 

 

процессов

Рассмотрим управляемую систему

 

dx

(Xi, ■■; Хп, иъ . . ., un t).

(10.1)

- d t = f s

Предположим, что заданы начальная точка х° и момент t0. Тогда каждому управлению u£ G (G —- некоторое множество, на­ пример кусочно-непрерывных вектор-функций) отвечает движение

 

Гх = х (/, и,

х°,

t0),

(10.2)

проходящее через точку х° при

t =

t0.

 

Пусть S — некоторая поверхность в пространстве переменных

t, х 1У . . .,

хп, задаваемая уравнением

 

 

 

S ( t , x 1, . . . , x „ )

=

0.

(10.3)

Задача

управления состоит в таком

выборе u £ G

так, чтобы

в некоторый момент tx интегральная кривая (10.2) системы (10.1) достигала поверхности 5 (10.3), при этом управления ult . . ., иг

и фазовые координаты х х, . .

., хп удовлетворяют ограничениям1

Vj(xy, . . . , хп, « х, . . .,

ur, t ) ^ 0 ( / = 1 , 2 , . . . , k). (10.4)

Хотя имеем некоторый процесс уравнения движения и условия его протекания (ограничения, начальное и конечное состояние), задача выбора управляющих параметров процесса может не иметь

1 В неравенстве (10.4) V/ могут быть, в частности, функционалами.

ПО

однозначного решения.

Рассмотрим еще функцию

V

(t, x lt . . .

. . хп), которая определяет в каком-либо смысле

расстояние

от переходного процесса

[движущейся точки (10.2)]

до его желае­

мого конечного состояния (поверхность 5). И пусть роль системы управления сводится к тому, чтобы это расстояние уменьшать. Тогда естественным становится понятие об оптимальном управ­ лении по отношению к демпфированию функции V.

Определение 15

Управление и = («ь . . ., иг) называется оптимальным по отношению к демпфированию функции V, если эта функция V убывает вдоль траектории х (t, u°) = х° (t), соответствующей этому управлению, наибольшим образом.

Вычислим значение функции V на движении (10.2) и найдем полную производную по t от полученной функции. Будем иметь

dV

__ дУ

< - 2

дУ

(10.5)

dt

dt

dxs fs = W (t, x, U).

 

 

s=l

 

Оптимальное управление по отношению к демпфированию функ­ г ции V необходимо доставляет наименьшее возможное значение функции W (t, х, и) среди всех допустимых управлений [управ­ лений, которые переводят точку х° на поверхность 5 и при этом удовлетворяют ограничениям (10.4) ].

П р и м е р 1. Рассмотрим линейную систему

4 4

= У a*iXi +

S b*iui (s = 1....... ") •

(10-6)

dt

i= о

/= 1

 

Будем считать элементы матрицы А = {aS(-} постоянными вещественными чис­ лами, а В = {bSj } — либо вещественными постоянными, либо функциями вре­

мени.

Предположим, что при u = {ult . . ., иг) = 0 положение равновесия х = 0

асимптотически устойчиво по Ляпунову. Тогда существует положительно-оп­ ределенная квадратичная форма V, удовлетворяющая уравнению

(grad V, Л х) = — х 2,

(Ю.7)

и притом единственная.

Будем считать, что функция V определяет расстояние интегральной кривой

системы (10.6) до точки х =

\х1, .

. .,

хп} = 0. Построим управление и, опти­

мальное к демпфированию функции V,

т. е. управление иъ . . ., иг

необходимо

выбрать так, чтобы функция убывала

наибольшим

образом

вдоль траектории

системы (10.6).

 

 

 

 

 

 

 

Предположим, что «х...........иг удовлетворяют условию

 

 

\Uj \

1 (/ =

1,

2, . . .,

г).

 

 

(10.8)

В этом случае

 

(grad V, Ви)

 

 

(10.9)

W = —х2 +

 

 

принимает наименьшее возможное значение при

 

 

 

«° = — sign (в !,

grad V)

(/ =

1, . •

г).

(10.10)

 

 

 

 

 

 

 

И1

Подставляя (10.10) в систему (10.6), получим оптимальную автоматическую систему управления по отношению к демпфированию функции V (t, х):

dxs

п

г

П дУ

( 1 0

. 11)

dt

— ^

asix t — ^ bSj sign

дх$ bsi

г=1

/= i

 

 

Правые части системы оказываются разрывными, и поверхности их разрыва определяются уравнениями

S

дхдУ5 bsj =

S csjXs = 0 (/ = 1 , 2 ..........г).

( 10. 12)

s = l

 

s~ l

 

В системе (10.11) возникает, вообще говоря, непродолжимость движений через поверхности разрыва (10.12). В фактических системах за счет инерцион­ ности происходят малые вибрации около поверхности разрыва.

П р и м е р 2. Рассмотрим движение точки в фазовом пространстве с постоян­ ной по величине и управляемой по направлению скоростью

dxs

= «s(s=

1, . . ., n);

 

dt

n

 

(10.13)

 

 

 

*=1

 

 

Положим

 

 

 

P(X): /

A 4 '

(10.14)

Управление, оптимальное по отношению к демпфированию функции V,

определяется путем нахождения наименьшего возможного значения функции

(10.15)

s= 1 0XS

Отсюда

* ______

(10.16)

Покажем, что при управлении (10.16) движущаяся точка из любой задан­

ной точки х = {xj,

. . .,х °} попадает в начало координат.

Система (10.13)

при управлении (10.16) имеет вид

dxs

______ xs

dt

Г п

V S * ?

" 1=1

Умножая s-e уравнение системы (10.15) на xs и суммируя по S, получим

J L _d_

г,

2 dt

 

n

где г2 =

х\ .

113

Интегрируя уравнение (10.16),

найдем г — —/ +

г. Следовательно, движу­

щаяся точка попадает в начало координат в момент

 

i = r =

л / 2 *!°)а-

(10.17)

"1=1

Легко показать, что t является наименьшим возможным временем, за ко­

торое движущаяся точка может из точки х попасть в начало координат.

Таким образом, в данном случае управление U0, оптимальное по отношению

к демпфированию функции V,

является одновременно оптимальным по быстро­

действию.

 

 

Определение 16

Управление u = jи л,

. . ., иг) называется оптимальным по

быстродействию, если среди управлений, переводящих начальную

точку х на поверхность 5 (в частности, начало координат), оно доставляет времени перехода

t,

Т = tvt0= j dr

наименьшее возможное значение.

Теорема 28

Управление и0 и соответствующее ему движение х° (t) = х (t, t0, х°, u°) будут оптимальными по быстродействию при выполнении следующих условий:

1)

управление и0 = {«?, . . ., и°г\ является оптимальным

по

отношению

к

демпфированию функции V (t, х);

 

2)

функция

V (t, х) вещественна, непрерывна и положительна

при всех i,

xs

(s =

1, . . ., п), за исключением V (t, х) = 0

при

5 (t,

х и . .

.,

хп) =

0 (на поверхности);

 

3)

функция

V (t, х) непрерывно дифференцируема вдоль дви­

жений системы (10.1)

при любом управлении u£ G, причем

=

= ■— 1при управлении и0, оптимальном в смысле демпфирования функции V (t, х).

Доказательство. Покажем сначала, что интегральная кривая системы (10.1) при управлении и = и0 достигает поверхности S. Иначе говоря, управление и0 переводит систему из состояния х° на поверхность S за время tv

По условию теоремы, вдоль движения х° (t) имеет место ра­ венство

Интегрируя его по t,

найдем V (t), t) = V (х°, £„) + U t-

Так как функция V (х,

t) не принимает отрицательных значений и

§ р . И. Зубов

И З

только на поверхности 5 обращается в нуль, то существует такой

момент tx — t0 +

V (х°, ^0), что

 

 

 

 

 

 

 

x°(*i) =

x(fb x°,t0, u°)6 5.

 

 

 

Пусть время Т = t x ~

t 0 = V (х°, /0) будет не оптимальным по

быстродействию. Тогда существует управление и 6

G, переводящее

точку х° на поверхность S за

время Т — ti to, причем Т

«<

< т.

 

 

 

 

 

 

 

 

 

Так как управление и0 оптимально по отношению к демпфиро­

ванию функции V

(х, t),

то для любого другого управления и

и соответствующего ему движения х

(t) = х (t,

х, t0, и) будет

~

=

— 1

-f а (t),

где a

(t)

> 0 —

функция,

заданная

при

t e

и

о,

* i * b

 

 

найдем

 

 

 

 

Интегрируя это равенство,

*

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

h

 

 

 

 

 

- V { x \ t 0) =

- { t \ - t o ) A - J a(t)dt,

 

 

 

 

 

 

 

 

 

to

 

 

откуда

*

h

T * ~ T = J a ( t ) d t ^ 0,

to

что противоречит предположению. Теорема доказана.

З а м е ч а н и е . При управлении (10.16) вдоль соответствующего ему дви­ жения (пример 2) будет иметь место равенство

Как вытекает из теоремы, данное управление оптимально по быстродействию.

Будем считать, что исходная система линейно зависит от управ­ ления и имеет вид

dxs

= f, (Xi, ■.., xn, 0 + S b si (Xi, ■. Xn, t) ut.

(10.18)

dt

 

1=1

 

Предположим, что функция V (x, t), о которой идет речь в пре­ дыдущей теореме, существует. Пусть также управления и2, . .., иг, входящие в систему (10.18), подчинены ограничениям

\щ \ < 1 (I = I, 2, . . г).

(10.19)

Полную производную функции V (х, t) в силу системы (10.18) можно представить в форме

dv__ d K ,

_L

V

dV

U

( 10.20)

dt

. d t ^ Z j

dxs ' s >

Z j

U‘ dxs

0si'

 

 

s = l

 

(= 1

 

 

 

114

Правая часть (10.20) достигает своего наименьшего значения при

 

П

и}0) = —sign

( 10.21)

 

S = 1

Так как наименьшее значение правой части (10.20) равно — 1 в слу­ чае оптимальности по быстродействию, то, подставляя (10.21) в (10.20), будем иметь уравнения в частных производных

 

дУ

1.

( 10.22)

dt

дх*

 

 

S= 1

f=l

 

 

Формула (10.21) решает проблему синтеза (управление пред­ ставляет собой функцию от координат и времени, оптимальную по быстродействию). В общем случае, когда и 4 G, где G имеет более сложную природу, задача построения оптимального по быстро­ действию управления сводится к отысканию наименьшего воз­ можного значения линейной формы (10.20) в классе функций u£ G. Уравнение (10.22) можно рассматривать как уравнение для опреде­ ления функции V (t, х), которая, во-первых, непрерывна и поло­

жительна при всех xs и t,

за исключением V (t, х) =

0 при S (t,

x lt . . ., хп) = 0 (граничное условие), и, во-вторых,

непрерывно

дифференцируема по своим аргументам.

 

Отметим при этом, что

частные производные функции V {t, х)

являются, вообще говоря,

разрывными и поэтому решение урав­

нения (10.22) еще более затруднено.

Всвязи с этим поставим следующие задачи:

1)рассмотреть вопросы существования и единственности функ­ ции V (t, х) в задачах управления;

2)провести исследования уравнения (10.22) в частных про­

изводных; 3) исследовать систему дифференциальных уравнений на по­

верхностях разрыва, т. е.

П

3V

,

Л

(г= 1, 2, ..., г).

дх,

bsi ~

°

 

Заметим, что вместо функции V (t, х) можно взять некоторый функционал, определенный на движениях и управлениях, вхо­ дящих в систему (10.1). Рассмотрим самый простейший функционал такого типа. Пусть функция V (i, х) обладает теми же свойствами, что и ранее, а функция / 0 (х>и> 0 — теми же свойствами, что и правые части системы (10.1). Управление u (t) и соответствующее ему движение (10.2) при фиксированном времени t определяют значение функционала

<

 

 

L = V(x (t, u), t) + J f

0(x, u, t)dx.

(10.23)

to

8'

115

Зададимся целью отыскать такое управление, чтобы вдоль соответствующего ему движения скорость убывания функцио­ нала (10.23) являлась наибольшей в точке (х°, t0). Найдем полную производную функционала (10.23) при t = t0:

dL

=h (x°,u, g+ 2 |^s(x0, Mo)

dt tto

dV (10.24) dt

S = 1

Пусть наименьшее возможное значение правая часть (10.24) принимает при umin (х°, t0). Положим u 0(x, t) = umm (х, t). Будем считать, что система (10.1) определяет движение

х° (0 = х(/, х°, *„)•

Положим

U0 (0 = U0 (х° (t), t)

ипусть u° (t) является допустимым управлением. Это управление

исоответствующее ему движение х° (t) будем называть оптималь­ ными по отношению к демпфированию функционала L.

Оказывается, что в каждой точке оптимальной кривой функ­ ционал L имеет наибольшую скорость убывания. Действительно,

пусть t > tQ— некоторый момент времени и х — соответствующая ему точка интегральной кривой х° (t). Возьмем произвольное управление u {t)£G при t^> i и оценим скорость изменения функ­ ционала L в точке (х , t) при этом управлении:

dL

dV_

+ 2

M ) 4 - /0(x,u,?)s*

dt t=t

dt

S— 1

 

 

 

 

 

 

u°’

+ /«(x>u ° *)•

 

 

$=1

 

Это неравенство показывает, что скорость убывания функцио­ нала L в каждой точке оптимальной кривой является наибольшей.

Рассмотрим теперь связь систем управления, оптимальных в смысле демпфирования и в смысле интегрального функционала.

Обозначим через хх то фазовое состояние на поверхности S,

ко­

торое достигается объектом управления (10.1) в момент tx >

t о

при некотором фиксированном и 6 G, т. е. S (xt, ... , *<0, П) =

0.

Предположим, что управление

u (t) и соответствующее ему дви­

жение (10.2) с концами

х° и х1,

заданные при t 6

П0, ПЬ харак­

теризуются значением

некоторого

функционала

 

J (и, х°) = Р (tlt х1) +

оJ /о (X, и, t) dt.

(10.25)

to

116

Определение 17

Управление и* и соответствующее ему движение х* (t) назы­ ваются оптимальными по отношению к функционалу J, если не­ равенство

J(u*, x * ) ^ J { u,x)

(10.26)

имеет место при любом выборе допустимого управления u^G .

 

 

 

Теорема 29

 

 

 

Управление и0

=

{и?, . . .,

иг)

оптимально

по

отношению

к демпфированию

функционала

L (10.23), где V (t, х) = Р (

i х1)

на многообразии

 

5

доставляет

функционалу

J

(10.25)

наи­

меньшее возможное значение среди всех управлений, переводящих точку х° в некоторую точку х1^ S, если это управление и0 (£) и соответствующее ему движение х° (t) удовлетворяют уравнению

s=l

Доказательство. Так как и0 является оптимальным управле­ нием в смысле демпфирования функционала L (10.23) и удовле­ творяет уравнению (10.27), то можно записать

ж + / . (*. < о = W { ж + 1.) = 0

 

или

 

 

 

 

W (t,x, u°) = miW(t, X,

и) = — % ,

(10.29)

 

и

 

п

 

где

п

 

 

 

 

 

 

 

W(t,

X, “) = £ - ! £ - / , + /„•

(10-30)

 

s—i

 

 

 

Вычислим значение

функционала

J

(10.25) при

управлении

(t) и соответствующем ему движении.

Для этого интегрируем

равенство (10.27) в пределах от t0до того момента времени й, когда интегральная кривая попадает на поверхность S при управлении

и° (t):

V (х° (t°i), tT) V (х°, t0) + J /о (х, и, т) ch = 0,

to

117

откуда

г1

J (u °) = р(х°{$), tf) + J/o(x, u, x)dx = V{x°, to)- (Ю.31)

to

Предположим, что управление u (t) допустимое и доставляет функционалу J меньшее значение, чем управление u° (t), т. е.

7 (и) < / (и0). Тогда в силу (10.28) или (10.29) для этого управ­ ления будем иметь

^ - + Ы Х,~^ t ) ^ a ( t ) ,

(10.32)

где a(t) неотри ц ательн а я

ф ун к ц и я .

tQдо t 1

Интегрируя последнее неравенство в пределах от

момента времени, когда х (tv х°,

t0, и) 6 S, получим

 

t i

 

11

(dx,т)

Р (х1, /~) — V (х°, /0) 4- J f0(х,

u , x ) d x ^ j а

to

 

to

 

откуда

 

 

 

/ (u) — J (u°)

0,

 

что противоречит выбору управления u (t). Это противоречие и доказывает утверждение теоремы.

Следствие. Рассмотрим систему (10.18) при ограничениях на управления (10.19). Пусть / 0 (х, u, t) = f 0 (х, t). В этом случае управление, оптимальное по отношению к демпфированию функ­ ционала L (10.23), определяется формулой (10.21) и уравнение (10.27) примет вид

ду_

п

+ fo (х, 0 = 0. (10.33)

dt

s=l

/=1 S= 1

Отсюда следует найти функцию V (t, х), удовлетворяющую усло­ вию V (t, х) = Р (t, х) на поверхности S.

Обратимся теперь к методу множителей Лагранжа, а затем перейдем к выводу принципа максимума Л. С. Понтрягина [37]. Этот принцип является необходимым условием оптимальности.

Пусть задана управляемая система:

 

x = f(x , и);

(10.34)

х — (хъ

хп)\

и = (иь . . . , иг).

 

118

Будем считать, что правые части системы (10.34) заданы при u£ U <= Еп Еп, вещественны и непрерывны по отношению к со­ вокупности всех переменных, а также непрерывно дифференци­ руемы по компонентам вектора х.

Определение 18

Вещественная кусочно-непрерывная векторная функция u (t) называется допустимым управлением, если выполняются следую­ щие условия:

1 )

u(t)eu, te it0,

til;

2)

u

(t) имеет левосторонние и правосторонние пределы в точ­

ках разрыва;

на концах промежутка U0, t xl и при­

3)

u

(t) непрерывна

нимает в точках разрыва значение, равное пределам слева. Пусть задано начальное состояние х° и конечное состояние х1

управляемой системы.

Определение 19

Допустимое управление

(t),

переводящее систему

из

на­

чального состояния в конечное за промежуток времени

[t0,

^ ],

называется оптимальным по отношению к функционалу

 

 

 

о

 

 

 

j =

i fo(x,

u)dt,

(10.35)

 

и

 

 

 

если среди всех таких допустимых управлений оно придает (10.35) наименьшее возможное значение. При этом начальный момент t0 и конечный момент могут быть как фиксированными, так и нет. Во всяком случае, начальный момент можно считать фиксирован­ ным, так как замена независимой переменной t на t + с, где с — вещественная постоянная, не меняет вида управляемой системы и множества допустимых управлений.

Будем предполагать, что функция / 0 обладает теми же свой­ ствами, что и компоненты вектора f в системе (10.34).

Предположим, что существует функция V (t, х),

заданная при

U0> ], х ^ Е п, вещественная, непрерывная,

непрерывно

дифференцируемая относительно компонент вектора х и такая, что V (tl7 х1) = 0. Положим

t

 

Z = V (t,x ) + \ f Q(t,x ,u ) d t .

(10.36)

to

 

Обозначим через W полную производную функции z вдоль

интегральной кривой системы (10.34):

 

~ =

(grad V, f(t, х, u)) + / 0,

(10.37)

119

Соседние файлы в папке книги из ГПНТБ