Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Зубов В.И. Математические методы исследования систем автоматического регулирования

.pdf
Скачиваний:
32
Добавлен:
25.10.2023
Размер:
12.11 Mб
Скачать

а через u° (t, х) — те значения вектора и, при которых функция W (t, х, и) принимает наименьшие возможные значения:

W(t, х,

(t,

х)) =

in firm х, u).

(10.38)

 

 

u(-U

 

Предположим далее,

что

 

 

 

W (t, х,

u° (t,

x)) = 0.

(10.39)

Будем считать, что система (10.34) при управлении

и = u° (t, х)

(10.40)

переходит из заданного начального состояния х° в заданное ко­ нечное состояние х1. Обозначим через х° (i) соответствующее этому управлению решение системы (10.34), удовлетворяющее

х °(0 |/= /. = х°,

и через u° (t) — значение управления u° (х, t) на движении х° (t). Допустим, что u° (х, t) — непрерывно дифференцируемая вектор-функция относительно компонент вектора х, которая как точка множества U является внутренней. Тогда из условий (10.38),

(10.39) имеем

dW(t, X, u° (I, х))

dW

ST\ dW_ duk_ _

0

(10.41)

dxj

dx;

' 2mi duf{ Ox:

 

 

 

*=l

 

 

Здесь при дифференцировании слева по Х/ остальные компоненты вектора х считаются параметрами, не зависящими от х

Из (10.41) имеем

иначе

а

дУ

dW

dV

dfs

Йо.

= 0.

(10.42)

dt

dxj

dxs dxj / . + 2

dx.

dx:

dx.

 

 

Соотношение (10.42) может быть переписано в форме

d_

W

dfs

а/p _ n

(10.43)

dt

dxs

dxj

dxj

 

В формулах (10.42) и (10.43) считается, что функция V (t, х) дважды непрерывно дифференцируема по своим аргументам.

Положим

а ^ - = М * ) ПР И х = х ° ( 0 -

120

ч

Тогда (10.43) можно записать в виде

П

(10.44)

Пусть х 0 = /о и Я-о = 0, а также

я = Ъ Ч Л *’ х. и)-

(10.45)

j=0

 

В этом случае будем иметь

д н .

Xi ~~ д)ч

(10.46)

Система (10.46) представляет собой каноническую систему диф­ ференциальных уравнений. Из предыдущих рассуждений выте­ кает, что ей удовлетворяют функции:

 

 

 

 

 

x = x°(ty,

 

 

 

 

 

 

 

 

и = u° (t)

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

dv

 

 

п

 

 

 

 

h =

а^7

ПРИ х = х (0;

 

 

 

 

Я „=1;

 

х0( 0=

tJ /о (х,

и, т)dx.

(10.47)

Рассмотрим теперь функцию Н (t, х° (t), u°, X (t)). Эта функция

при u = u° (t)

достигает

своего

наименьшего

возможного зна-

чения

dV (t , х«(0)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Действительно,

 

 

 

 

 

 

 

 

 

W ( t , х°(0, ц ) =

аУ (д/Х°(0) + ^ (< , х°(0 .

МО, и).

Так как имеет

место

(10.39),

то

будет

 

 

 

 

 

M W

=

W { t ,

х°(0, и®(х°(<),

0);

 

 

 

u£t/

 

 

 

 

 

 

 

 

следовательно,

 

 

 

 

 

 

 

 

 

 

inf Я 0 ,

х° (/), Я(0,и) =

dV(t,

х » ( 0 )

 

ufU

 

 

 

 

 

dt

 

Таким образом,

доказана следующая теорема.

 

121

Теорема 30

Если выполняются следующие условия:

1) существует дважды непрерывно дифференцируемая функ­

ция

V

(t, х), заданная при

U0> h h

х б £ л и V (tlt

х1) =

0;

2) существует такая непрерывно дифференцируемая функция

и0 (t,

х), что u° (t, х) — внутренняя точка

U и

 

 

 

 

 

 

 

inv W (t, х, u) = W(t, x\(t),

u°(t,

x° (0) =

0;

 

 

 

 

 

u

 

 

 

 

 

 

 

 

 

 

3)

 

система

(10.34) при управлении

u =

(t,

x)

переходит

из начального состояния х°

в конечное состояние х1,

 

 

 

то существует оптимальное управление

u° (t)

и

оптимальное

движение х° (t), а также такие функции

 

(t); j

0,

1,

. .

п,

что они удовлетворяют канонической

системе дифференциальных

уравнений (10.46), причем функция Н

(t, х (£), и,

%(t))

принимает

при

и

(t) наименьшее

возможное

значение

dV (t, хО (<))

 

 

dt

 

т. е.

 

 

 

 

 

 

 

 

 

 

 

 

H(t,

х°(t), X(t),

u°) = mlH(t, x°(0,

К

U).

 

(10.48)

 

 

 

 

 

 

 

u^U

 

 

 

 

 

 

 

 

З а м е ч а н и е .

Рассмотрим функционал

 

 

 

 

 

 

 

 

 

 

 

 

Л

 

u)dt

 

 

 

 

 

 

 

 

/ = Р (

х 1 ) + X

,

 

 

 

(10.49)

to

и предположим, что конечное состояние х1 располагается на гладком многообра­ зии

gy (x0 = 0

( / = 1 ____ _

k).

 

(10.50)

Если в предыдущей теореме условие

V (tlt

х1) =

0 заменить

условиями

V (0, х1) = Р (х1) и g j

(х1) =

0 (/' =

1, . . .,

k),

(10.51)

То утверждение теоремы останется в силе. Однако теперь для определения функ­

ций Я/ (t) (/

= 1...........п)

и функций x°j (f) (j

=

1............. п) имеется, вообще го­

воря, всего

лишь п +

k краевых условий,

т.

е. задано начальное состояние,

в котором оказывается система (10.34) при

t =

t0, и задано k условий для ко­

нечного состояния (10.50).

 

 

Покажем, что недостающие краевые условия можно определить из усло­ вия (10.51), которое заключается в том, что функция V при t = t х должна обра­

щаться в заданную функцию Р (х2) на многообразии (10.50). Пусть х1 — неко­

торая точка, удовлетворяющая (10.50) и условию V (tlf х1) = Р (х1). Так как уравнения (10.50) определяют гладкое многообразие размерности пk, то, по

определению,

векторы gradg/

(j =

1,

. . ., k) должны быть линейно-независи­

мыми.

 

 

 

ап)

 

Обозначим через а =

( а ь .

. . ,

какой-либо вектор, ортогональный одно­

временно всем векторам grad gj

(j =

1, . . ., k). Рассмотрим далее такую вектор­

ную функцию

х = х (в),

что gj (х (е)) = 0 (/ = 1, . . ., k):

dx

х(0) = х1 и de в = 0 = а .

Тогда будем иметь V (tu х (е)) = Р (х (е)).

122

Дифференцируя последнее равенство по е и полагая е = О, найдем

(grad У (/у, х1),

а )

=

(grad Р (х1), а ) ;

(grad gj (х1), а )

=

0

(/ = 1................

к).

Так как вектор а может принимать произвольные значения в пространстве,

ортогональном векторам grad gy, то последние равенства одновременно могут выполняться лишь в том и только в том случае, когда вектор grad У (tt , х1) —

—grad Я(х1) будет содержаться в пространстве, натянутом на векторы grad gy(/ =

1, . . ., к).

Следовательно, существуют такие

постоянные /х.......... 4 ,

что

 

 

k

 

grad У =

grad Р + £ Zygradg/.

(10.52)

Так как

 

/=1

 

<ЗУ

 

 

 

 

 

М 0

= ~дх[

ПрИ Х = Х°

 

то из (10.52) будем иметь

K(h)

дР (х1) dxs

 

« - ■

->■

(10.53)

/=1

 

 

 

 

Условия (10.53) называются условиями трансверсальности. Они вносят добавочные неизвестные переменные 1г, . . ., Д. Таким образом, искомых ве­ личин становится теперь 2п + к, а именно:

х° (0, *,s (0,

(s = 1,

1, • .

fe).

Для определения этих величин имеется также 2n + k краевых условий:

заданы начальное состояние и условия (10.50) и (10.53). П р и м е р . Пусть задана система уравнений:

х = Р (/) х + Q (0 u + F (/);

(10.54)

U

J = | [А* (0 х +

В* (t) u] dt +

с*хх;

(10.55)

*0

 

 

 

А * х + 6 / = 0

0 = 1, . .

к ) .

(10.56)

Требуется найти оптимальное по отношению к функционалу (10.55) управ­ ление и0 (/), переводящее систему (10.54) из заданного состояния х = х° при t = t0 на многообразие (10.56), при условии, что управления стеснены ограни­

чениями

I и/1 ^ 1 0' = 1...........

г)•

(10.57)

Далее будем предполагать, что элементы матриц Р, Q, компоненты векто­

ров F, А, В являются вещественными кусочно-непрерывными функциями, за­

данными при t £ [Д, Д]; компоненты векторов с и А/, а также величины Ь/

будем считать вещественными числами. Естественно предполагать, что векторы А/ линейно-независимы между собой.

Положим

У (t, X) = J* (t) х + ф (0;

 

t

 

 

 

(10.58)

Z =

У + J

[А* х +

В* (t)

u] dt;

 

 

to

 

 

 

 

W ■ {i* +

к*P +

A) x + Ф +

X*F +

( Г Q + B*) u.

(10.59)

123

Функция (10.59) достигает наименьшего возможного значения при условии

(10.57) в точке

и, (t) = - s ig n [X*Q + В* ]/ (/ = 1____ _ г).

(10.60)

Здесь индекс при скобке / означает /'-компоненту вектора, указанного в скобке.

Выберем теперь функцию ф и вектор X так,

чтобы функция (10.59)

обраща­

лась в нуль при условии (10.60).

Тогда получим

 

X* +

Х*Р + А* =

0;

(10.61)

 

г

 

 

ф + X*F -

£ I (X*Q + В*)/1 = 0.

(10.62)

/=1

Из замечания к последней теореме вытекает, что компоненты вектора X

должны удовлетворять условию трансверсальности. В данном случае оно имеет

вид

k

 

М 'х) = С + 2

//А /.

(10.63)

 

/=1

 

 

Условие

(10.63) позволяет определить с помощью (10.61) вектор X.

При этом

он будет

линейно зависеть от величин /х...........

/&.

 

Равенства (10.60) дадут тогда управления, зависящие также от постоянных /х..........Ik, и эти управления будут доставлять функционалу (10.55) наименьшее

возможное значение. Если подставим управление (10.60) в систему (10.54) и проинтегрируем ее с начальным условием х = х° при t = tQ, то получим иско­

мое оптимальное движение х° (/). Это движение будет зависеть по-прежнему от постоянных /х, . . ., Ik-

Подставив найденное движение в (10.56), найдем k уравнений для опреде­

ления постоянных /х,

. . ., Ik- Получаемые таким образом уравнения для вели­

чин /х,

. . ., Ik могут быть разрешены с любой наперед заданной степенью точ­

ности.

 

 

 

 

Теорема 30 и замечание к ней носят достаточный характер.

Введем в рассмотрение вектор

 

 

 

t

У == (х0, хъ

. . ., хп),

 

 

 

 

 

где

х0= J /о(х,

u)dt.

 

 

 

to

 

 

 

Этот вектор будет удовлетворять системе уравнений

 

 

=

У, и),

(Ю.64)

где

F{у, и) = [/0 (х, и), fx(x, и),

. . ., S„(x,

и)].

Предположим,

что существует допустимое управление и —

— и0 (t), переводящее систему (10.34) из начального состояния х° в конечное состояние х1 за промежуток времени U0, £х]. Тогда это управление будет переводить систему (10.64) из начального состояния у0 в конечное состояние у1 за это же время.

Рассмотрим уравнение в частных производных

П

■ х И -2 М У , u (*»-g- = 0.

(10.65)

s= 0

 

124

Построим решение этого уравнения:

 

 

 

V (к

У) =

(Ь1, У — У1) при t =

tlt

 

 

где X1 — некоторый вещественный постоянный вектор.

 

 

Обозначим через

 

 

У = У (*, 11)

 

 

(10.66)

 

 

 

 

 

общее решение системы (10.64) с условием у

(tly л)

=

У1 + л>

где ц — произвольный

радиус-вектор, соединяющий

точки у 1

и у и имеющий достаточно малую длину.

(t), получающееся

Решение, соответствующее управлению u

из (10.66) при г] =

0,

будем обозначать далее через у (t),

так что

У (t0) = У°. а У (*i)

=

У1-

 

 

 

 

Разрешим равенство (10.66) относительно компонент вектора т).

Тогда получим

 

 

 

 

 

 

 

 

 

Л = &(*. У)-

 

 

(Ю.67)

Компоненты векторной функции (10.67) представляют собой первые интегралы системы (10.64), причем они дают полную си­ стему этих интегралов.

Из предыдущего вытекает, что

 

К к ,

Л +

УХ) = Л-

 

Рассмотрим функцию

 

Кк у)-у1).

(Ю.68)

v = (v,

у (к,

Так как функция (10.68) является функцией первых интегралов системы (10.64), то она обязательно удовлетворяет системе в ча­ стных производных (10.65).

Положим в (10.68) t =

tlt у =

г ) + у 1 . Тогда имеем V (tu

Л+ У1)

= (^х>л)>откуда получаем

 

 

V(k,

у) = (Ь\

У — У1).

Последнее равенство выполняется для всех точек у , расположенных в сфере с центром у 1 достаточно малого радиуса.

Таким образом, формула (10.68) дает искомое решение урав­

нения (10.65)

в некоторой достаточно малой трубке с осью у

=

= у (t). Именно функция (10.68) задана при U 0 ,

t x] и f l y

— У (Oil

6,

где 6 — достаточно малая положительная постоян­

ная.

 

 

и (t) доопределить с сохранением непре­

Если управление и =

рывности

на

несколько

более широкий промежуток

[to, t[ ],

то

формула (10.68) будет определять искомую функцию также на этом более широком промежутке.

Положим

 

 

=

при у = у

(10.69)

Тогда к (t) = А,1 при t = 11, где к = (к0, . . ., кп).

125

Продифференцируем формально соотношение (10.69) ПО t :

dkj

_ д

dV

+ ^ М у (0, u (0) dy s д у .

dt

~ dt

dyj

„_Л

 

 

 

Подставим функцию (10.68) в (10.65), продифференцируем полу­ ченное тождество по ys, переставим затем порядок дифференциро­ вания и положим у = у (0- Тогда получим

д

ду

 

 

 

П

£ м у ( 0 .

“ (

0 ) ^

дt

dyj +

 

 

«=П

 

 

s=0

так как

= Xs при у

=

у ( t) .

Сравнивая последнее и предпоследнее равенства, находим

 

dkj

£

3,,<yV)

« т ± к и = 0..........(10.70)

 

dt

s=0

 

1

 

 

 

 

 

Положим

V/(y, u(0).

/=0

Легко заметить, что системы (10.64) и (10.70) могут быть за­ писаны в форме Гамильтона

dys _ _сШ_. ' dt ~ dks

dls

дН

(10.71)

dt ~

dys

 

(s=0.......п).

 

 

Покажем теперь, что компоненты векторов у

(t), к (t) и управ­

ления u (t) действительно связаны между собой системой Гамиль­ тона (10.71). Предыдущий вывод этого утверждения остается спра­ ведливым лишь для того случая, когда функция V имеет вторые непрерывные частные производные по всем своим аргументам.

Обозначим через /у- единичный орт декартовой системы коор­

динат в пространстве переменных у .

Подставим функцию (10.68)

в уравнение (10.65) и положим у

у

(т), где у

(т) есть решение

системы (10.64) с начальным условием у(т) =

у (т) +

/ у- у у при

t = т.

 

 

 

 

 

 

 

Проинтегрируем полученное тождество в пределах от t до tx

вдоль интегральной кривой у =

у (т).

Тогда получим

 

0

 

 

 

 

 

 

 

1

дУ (т, у (т )) +

У(т), U

(т))

дУ (т, у (т ))

dx = 0.

(10.72)

dt

s=0

 

 

dys

 

 

126

К левой части (10.72) добавим и вычтем выражение

 

 

tx

П

 

 

 

 

 

 

 

 

 

 

 

 

1

s—0

Ks (т) fs (У М,

U (т)) dr.

 

 

 

 

 

t

 

 

 

 

 

 

 

 

 

 

В результате будем

иметь

 

 

 

 

 

 

 

 

 

‘[ { w

+ Y f

\ J L

- K'

s

 

11

n

 

 

 

d r + \ ^ X sfsdr = 0.

(10.73)

J

dIt

^

i

d y s

t 1

 

s=0

 

 

 

 

 

t

 

s=0

 

 

 

Положим

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Vi =

V — '£i Xj (ijj (t) — ijj (t)).

 

 

 

Тогда (10.73)

примет вид

 

 

 

 

 

 

 

 

 

 

 

\ 4 i vi dx+1

К

5(^(т) - ^ ( ть

 

 

 

 

 

 

 

t

L

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

11

n

J

2

^

*

d T = =

 

 

К (т) ys (t) d T +

s—0

 

 

 

 

 

 

 

f

 

 

 

 

 

Отсюда далее имеем

 

 

 

иJ

 

 

 

 

 

у (т))+

 

— [V (t,

У (0) — (Ь,

hy,)\ +

[(Л,

У (т) — У (т)) — (X,

 

 

 

 

 

 

 

t

 

 

 

 

 

 

 

+ (Ч F (у, u))] dr = 0.

Продифференцируем по ys и положим ys — 0. Тогда получим

11 Г / . Л«. Ч

/

АС>\ 1

L\ ' оуи

■ \

' oyi j j dr — 0.

ti k m d

+ №

Продифференцировав последнее равенство по t, будем иметь

^■ + ^

дуdfs,-4 = 0. ^

s=0

 

поскольку

 

=

при r = t .

Таким образом, соотношение (10.70) выведено без дополнительных предположений для правых частей системы (10.64).

127

Покажем теперь, что если управление u (t) является оптимальным, то существует такой постоянный вектор №■, что будет вы­ полнено основное неравенство принципа максимума

 

Н (у (0, u(0,

l(t))

при любом u£

U, где Я- (t) — вектор, удовлетворяющий начальному

условию Я, =

Я,1 при t =

tv

предпошлем подробное

Доказательству этого

утверждения

рассмотрение необходимого условия оптимальности Вейерштрасса, для чего предположим, что выполнены следующие условия:

а) функции

fs

(х, u) (s

= 0,

1, . . .,

п)

заданы

при

Еп,‘

и 6 U с= Ег, вещественны, непрерывны

и непрерывно-дифференци­

руемы по компонентам векторов

 

х =

(хг,

. . .,

хп)\

и =

( и ъ . . .

• • •, «г);

 

ti

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

б) матрица

А — j ВВ*

dt

неособая,

где

В =

Y~1Q\

Y

фундаментальная

матрица

для

линейной

системы

^

= Рх

с начальным условием Y (t0) =

Е; при этом

 

 

 

 

 

Р =

di

Q =

ll|^ ll(x =

x0W);

и = u° (0);

 

 

дк

 

 

в) оптимальное управление (t) располагается внутри мно­ жества U при f^0, tx\, т. е. если u (t) — некоторая кусочно-не­ прерывная функция, заданная при 16 U0, tx\, то управление

u (t, е) = (t) + ей (0 будет при любом достаточно малом е принимать значения из множества U.

Теорема 31

Если u° (t) — оптимальное управление и х° (/) — соответствую­ щее ему оптимальное движение, то при выполнении условий а, б, в справедливы следующие утверждения:

1) существует функция V (t, у), удовлетворяющая уравнению

(10.65) при u = (t) и граничному условию

 

V{h, у) = (Я1, у - у 1);

(10.75)

2) функция W (t,

у,

П

fs (t, у, и)

имеет при

u) = - ^ +

 

 

s=0

 

 

У = У° (0. u = (t)

наименьшее возможное значение

0 = W(t, у» (0,

и °(/))< Г (*,

у°(0, u)(u6 Д),

(10.76)

128

f. e.

 

 

6W = 0

 

 

 

 

(10.77)

 

 

 

duj

 

при u = u°(0.

У =

У°(0

и H{t, у°(0, U0 (/))< # (/,

y, u) (u^(/),

 

 

 

 

(10.78)

где H = 21

V / V, y,

u (/)).

 

/=0

 

 

 

 

При этом функции Л (0, у (0> u (0 связаны между собой си­

стемой Гамильтона

(10.71).

 

Доказательство.

Выше было показано, что функция Г, упомя­

нутая в первом утверждении теоремы, существует. Остается пока­ зать, что постоянный вектор Л,1 можно выбрать так, чтобы было выполнено также и второе утверждение этой теоремы.

Покажем, что такой вектор Я/1

существует.

Построим семейство

управлений u (t, е) так, чтобы было

 

 

 

и (t, 0) = и°(0 и

ди (t ,

8)

=

и (0,

 

дг

8 = 0

где и (0 — некоторая кусочно-непрерывная функция, заданная на промежутке П0, ^ ], ортогональная на нем к столбцам матрицы В*:

и

 

j Bu(t) dt = 0.

(10.79)

Основным требованием к семейству управлений и (/, е) будет, однако, являться требование, заключающееся в том, чтобы движе­ ние х ( t , е), соответствующее одному из управлений этого семей­ ства, переходило из начальной точки х° в конечную х1 за время П0, ^ ]. Существование такого семейства управлений будет уста­ новлено ниже.

Будем далее через у (t, е) обозначать решение системы (10.64), существующее выбранному управлению. Тогда получим

t1

 

 

\ W (t, у (t, г), и (t, е)) dt =

V (flf у (tu г)) -

V (t0, у0) =

^0

иJ t/о (х it, е),

 

= ( Ч У(*ь 8) — У1) —

u (t, г)) —

 

to

 

— fo (х° (0. u°(t))]dt.

(10-80)

Левая часть (10.80) обращается в 0 при е = 0. Так как можно выбрать Х0 5s 0, то при е = 0 имеем минимум. Следовательно,

9

в . ft. З у б о в

1 2 9

Соседние файлы в папке книги из ГПНТБ