Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Формальский А.М. Управляемость и устойчивость систем с ограниченными ресурсами

.pdf
Скачиваний:
11
Добавлен:
24.10.2023
Размер:
11.01 Mб
Скачать

2]

БЫСТРЕЙШЕЕ ПОПАДАНИЕ НА ПЛОСКОСТЬ

171

 

Теорема 18.1. Если из начального состояния

х (0)

систему (1 .1 ) можно с помощью управления и (т) €5 привести на плоскость 11 , то существует оптимальное по времени управление, переводящее систему (1 .1 ) из со­

стояния X (0) на плоскость П.

Если из состояния X (0) систему (1.1) можно привести на плоскость П, то, как следует из определения (18.1), существует такое значение Т, при котором хотя бы одна точка плоскости П принадлежит области S (Г), Обозна­ чим через Т° нижнюю грань таких значений Т. Из леммы 1 следует, что хотя бы одна точка плоскости П принадлежит области S (Т°). При Т < Т° ни одна точка плоскости П не принадлежит области S (Т). Из сказанного вытекает утверждение теоремы.

Из формулы Коши (1.5) получаем следующее выраже­

ние для скалярного произведения х\х (t):

 

t

 

х\х (t) = цеЛІх (0) + ^ цеА (‘-’ОВи (т) dt.

(18.2)

о

 

Пусть Т° — минимальное время попадания

системы

(1 .1 ) из некоторого начального состояния х (0)

на плос­

кость И; соответствующее оптимальное управление и траекторию обозначим через и°(т) и а;°(т). Рассмотрим следующую вспомогательную задачу: найти управление и (т) £Е й , которое максимизирует скалярное произведе­ ние г]х (t) при t = Т°, т. е. максимизирует величину

'F (/'")•

Имеет место следующая лемма.

Лемма 2. Управление и0 (т) максимизирует скалярное произведение г\х (Тп).

Докажем эту лемму от противного.

Предположим, что существует управление и (х) ge Q,

при котором х\х (Т°) ^> рх0 (Г0). Поскольку рж° (Т°)

= d,

постольку

 

w ( T ° ) > d .

(18.3)

Управление и (т) является кусочно-непрерывной функ­ цией, поэтому, как видно из выражения (18.2), вели­ чина х\х (t) является непрерывной функцией времени t. Рассматриваемое начальное состояние х (0), по условию, удовлетворяет неравенству (17.2). Из неравенств (17.2)

172 ЗАДАЧИ БЫСТРОДЕЙСТВИЯ [ГЛ. IX

и (18.3) следует существование момента времени t ' , удов­ летворяющего соотношениям

О < ? < Т°, цх (О = d.

(18.4)

Соотношения (18.4) означают, что попадание на плос­ кость П из начального состояния х (0) возможно за время, меньшее, нежели Т°. Это противоречит условию. Лемма доказана.

Из выражения (18.2) имеем

г

Т »

 

цх (Т°) = г\еАТ°х (0) + 2

\ x\eAi-T°^ b sui {x)dr.

(18.5)

S = 1

О

 

Из соотношения (18.5) следует, что управление и0 (т) е= й, максимизирующее величину цх (Г0), имеет вид

и°я(т) = Ms sgn (цеА(Т°~т>bs) {s = 1, ... , г). (18.6)

Функция т]еА(Т0_т) bs является аналитической, по­ этому она либо тождественно равна нулю, либо обраща­ ется в нуль конечное число раз на всяком отрезке. Если

цеА(та-^Ь$фО,

(18.7)

то управление (18.6) определяется однозначно. Для того чтобы имело место условие (18.7), достаточно, чтобы вы­ полнялось равенство ps = п (см. § 3). Если р = п, то можно утверждать, что существует хотя бы одно значение индекса s, при котором имеет место условие (18.7).

Если т]аА(Т0-'с) bs = 0 при всех s = 1, . . ., г, то

•цх (t ) — r\eAt X (0),

т. е. величина цх (t) не зависит от управления а (т). При этом задача быстрейшего попадания на плоскость (17.1) не имеет смысла.

В дальнейшем будем предполагать, что при всех s = l , . . . , г имеет место условие (18.7) (это предполо­ жение не ограничивает общности задачи).

Из леммы 2 и выражения (18.6)

следует, что оптималь­

ное по времени управление при

s = 1 , . . ., г

является

релейным.

 

 

 

Уравнение для определения моментов переключения

оптимального управления имеет вид

 

г\eMbg = 0

(s = 1 , . . ., г),

(18.8)

2]

БЫСТРЕЙШЕЕ ПОПАДАНИЕ НА ПЛОСКОСТЬ

173

где величина Ѳ = Т° — т представляет собой время, ос­ тавшееся до момента достижения точкой х (т) заданной плоскости П. Расположим положительные корни урав­ нения (18.8) в порядке возрастания и обозначим их так;

Ѳв1 < Ѳва < . . . < Qsh < . . . (s = 1,

г). (18.9)

При этом будем считать, что в последовательности (18.9) учтены только те нули уравнения (18.8), в которых про­ исходит смена знака функции т\eMbs. Если, например, все собственные значения матрицы А действительны, то в последовательности (18.9) не более, чем п — 1 кор­ ней [53].

Выберем среди чисел Ѳц , Ѳ21, . . ., ѲГ1 наименьшее и

обозначим

его через Ѳ1. Для тех начальных

состояний

X (0), для

которых время быстродействия Т°

Ѳ1, опти­

мальное управление и0 (т) не имеет ни одного переклю­ чения

и° (т) = и\ = Ms sgn {-x\eM bs)

(s = 1, ..., г), (18.10)

где 0 <[ Ѳ<[ Ѳ1. Для тех значений индекса s, при которых

T]6 S Ф 0 , вместо выражения (18.10) имеем

 

и°(т) = ui = Mssgn(r]5s).

(18.11)

Для тех начальных состояний, для которых время бы­ стродействия Т° Ѳ1, оптимальное управление имеет по крайней мере одно переключение. При этом последнее переключение управления при движении по оптимальной траектории происходит за время Ѳ1 до попадания на за­ данную плоскость П. Если Ѳ1 = ѲЙ1І = ѲЙ2І = . . . = 0ft;1,

то последними переключаются управляющие параметры

ukl, U)І2, . . .,

uhl

одновременно.

На последнем

участке

траектории,

т.

е. при Т° — Ѳ1 <С т <С

управление

и0 (т) = и1 —

1, . . ., и\), где

постоянные

и]

опреде­

ляются формулами (18.10) или (18.11).

Х п поверх­

Построим теперь в фазовом пространстве

ность, на которой происходит последнее переключение

оптимального

управления.

на

плоскости (17.1)

Выберем

начальные

состояния

и решим уравнение (1.1)

при и =

и1.

Время t при этом

будем считать изменяющимся «назад» от 0 до —Ѳ1. Тогда

174

 

ЗАДАЧИ

БЫСТРОДЕЙСТВИЯ

ІГЛ. И

из

формулы Коши (1.5)

имеем

 

 

 

 

 

 

 

—о1

 

 

 

х (—Ѳ1) = е-Аъ'хф) -\~

§

е-л (вЧ-О ВиЫх,

(18.12)

 

 

 

 

 

о

 

 

где

г[х (0) =

d. Умножим

выражение (18.12) слева на

матрицу ем \

а затем на

ц:

 

 

 

 

 

 

 

—о1

 

 

 

цеА^х{—Ѳ1) =

 

d +

^ У]е~А^ВиЫх.

(18.13)

 

 

 

 

 

о

 

 

Если существует матрица А*1,

то

 

 

 

^ е-АЧх =

1 _Ат

А'Чх =

(Еп — ел*') А~х.

 

 

— J

 

(18.14)

оо

Следовательно, если существует матрица А~х, то выраже­ ние (18.13), учитывая соотношение (18.14), можно запи­ сать в виде

целв'х (- Ѳ 1) = d -f- г) (Еп еАй') А~гВих. (18.15)

Выражение (18.13), а также (18.15), представляет со­ бой относительно переменных ху (—Ѳ1), . . ., хп (—Ѳ1) уравнение гиперплоскости, которую обозначим через Пх. Плоскость Пх является «изохронной» плоскостью: систе­ ма (1 .1 ) при и = и1 из каждой точки этой плоскости по­

падает на заданную плоскость П за время Ѳ1.

Таким образом, для всех начальных условий, для ко­ торых время быстродействия Т° Ѳ1, множество точек X (ЕЕ Х п, в которых следует производить последнее пере­ ключение оптимального управления, принадлежит «изо­ хронной» гиперплоскости Пг.

Этот результат является следствием общего утвержде­ ния, заключающегося в следующем. Все фазовые траекто­ рии системы (1 .1 ) при и = const, начинающиеся с какой-

либо гиперплоскости, оканчиваются в заданный момент времени также на некоторой гиперплоскости.

Перейдем к рассмотрению вопроса о

предпоследнем

переключении.

Выберем из

чисел Ѳ81 (s Ф kv . . .,

k {),

ѲЙ12, . . ., 0Äj2

наименьшее и

обозначим

его через

Ѳ2.

2] БЫСТРЕЙШЕЕ ПОПАДАНИЕ НА ПЛОСКОСТЬ 175

Для тех начальных состояний, для которых время быстро­ действия Т° ]> Ѳ2, оптимальное управление имеет, по крайней мере, два переключения. При этом предпослед­ нее переключение оптимального управления происходит за время Ѳ2 до попадания на заданную гиперплоскость П и за время Ѳ2 — Ѳ1 до попадания на гиперплоскость

На

предпоследнем участке

траектории, т.

е.

при

Т° — Ѳ2

т <

Т° — Ѳ1,

управление

и0 (т) =

и2 =

=

(и\, . . .,

ul),

где постоянные

иі определяются

форму­

лами

 

Mssgn {цеА%)

(s = 1, ... , г),

 

 

 

uf =

 

 

в которых Ѳ1

Ѳ <^Ѳ2.

пространстве

Х п поверхность,

 

Построим в

фазовом

на которой

происходит предпоследнее переключение оп­

тимального

управления.

 

 

 

(18.13)

 

Выберем начальные состояния на плоскости ^

и решим уравнение (1.1) при и = и1. Время t при этом будем считать изменяющимся «назад», от 0 до величины

Ѳ1 — Ѳ2. Из формулы Коши (1.5)

имеем

 

 

 

 

о1-ѳ*

 

 

X1 — Ѳ2) =

еА(0І-ѳг)X(0) +

S

ВиЧг,

(18.16)

 

 

 

о

 

 

где X (0) 6 = Пг.

Умножим

выражение (18.16) слева на

матрицу целв*

 

 

 

 

 

г\еА ъг х 1 — Ѳ2) = г]еА ч1х (0) -{-

§ т}еА (ѳ‘-т) ВиЫт.

 

 

 

 

о

 

Учитывая формулу (18.13),

получаем

 

г\еАвгх (Ѳ1 — Ѳ2) =■■

ѳі—ѳ*

 

 

—Ѳ‘

 

 

= d ^

r\e~AxBuLdт -f-

^

цел ( ѳ ‘ - т ) Bu2dx.

(18.17)

о

 

 

о

 

 

Если существует матрица И-1, то выражение (18.17) можно представить в виде

цеАв'х 1 — Ѳ2) = d Д- ц (Еп — елѳ1) А~гВих-f

+ т) (Еп — еА2-ѳ’)) А~хВиг. (18.18)

176

ЗАДАЧИ БЫСТРОДЕЙСТВИЯ

Lrjl. II

 

Выражение (18.17), а также (18.18) представляет со­

бой относительно переменных х1 1 — Ѳ2),

. . ., хп 1—Ѳ2)

уравнение гиперплоскости, которую обозначим через П2. Таким образом, для всех начальных состояний, для которых время быстродействия Т° )> Ѳ2, множество точек X t= Х п, в которых следует производить предпоследнее переключение оптимального управления, принадлежит

«изохронной» плоскости П2.

Из сказанного выше вытекает следующая теорема.

Теорема 18.2. Оптимальное управление в задаче быстрей­ шего приведения системы (1 .1 ) на гиперплоскость П явля­

ется релейным, точки переключения этого управления лежат на гиперплоскостях flj, П2, . . . фазового простран­ ства Х п.

Не все точки гиперплоскости Пх могут быть, вообще говоря, точками переключения оптимального управления. Переключение может происходить в тех и только тех точках X ЕЕ Пц которые удовлетворяют следующему ус­ ловию: траектории системы (1 .1 ) при и = и1, начинаю­

щиеся из состояний

X, располагаются

в

области (17.2)

в течение всего времени

 

 

 

 

0 < І < Ѳ 1.

 

 

(18.19)

Это условие записывается следующим образом:

 

і

 

 

 

г]еА‘х +

^ це^-^Би1 dx

d.

(18.20)

 

о

 

 

 

Обозначим множество точек х е е

П і5

в

которых может

произойти переключение оптимального управления, че­

рез D v

 

 

 

Из сказанного следует, что

 

 

 

t

 

Dx — \х ЕЕПі:

x\eAtx

^ це^-^Ви1 dx <^d при t GE [0, Ѳ1)! .

1

 

о

J

Если для

всякого

начального

состояния я (0) Е Hj

найдется такое t из полуинтервала (18.19), что неравенство (18.20) для него не выполняется, то множество D x пусто.

Если множество Dx пусто, то приведение системы

(1.1)

из

области (17.2) на плоскость (17.1) невозможно

либо

не

требует переключения управляющих параметров.

 

2]

 

БЫСТРЕЙШЕЕ ПОПАДАНИЕ НА ПЛОСКОСТЬ

177

Множество D 1является выпуклым, т. е. если xv х2G Ö i,

то %х1 +

(1 — "к)х2 GEDі, где 0 < А, <

1. Докажем

это

свойство

выпуклости.

 

 

 

 

 

 

Условия

х2 е

D t

означают,

что,

во-первых,

х2 е

П1,

во-вторых, при

0

t <4 Ѳ1

 

 

 

 

 

 

t

 

 

 

 

 

 

 

 

y\eAtXi + 5 ‘Це^'^Ви1 dx <^ d,

(18.21)

 

 

 

 

о

 

 

 

 

 

 

 

 

 

t

 

 

 

 

 

 

 

 

цеЛІх2+

^ r[eMl~i:'>Bu1 dx

d.

(18.22)

 

 

 

 

о

 

 

 

 

 

Если xv x2 £E IIj, то, очевидно, Xxt +

(1 — K)x2

Пг.

Умножим

неравенства (18.21)

и (18.22) на неотрица­

тельные числа А, и 1 — К соответственно и

сложим

их;

тогда

получим

 

 

 

 

 

 

 

 

 

 

 

і

 

 

 

 

 

x\eAt (кх1 (1 — А,)х2) -f- § ц е ^ ^ В и 1 dx <^d

 

 

 

 

 

 

о

 

 

 

 

при

0

t <

Ѳ1. Таким образом,

%х1 +

(1 — l)x2 g= Z^,

если

0 ^

А, ^ 1.

 

 

 

 

 

 

Проанализируем соотношения (18.19), (18.20).

d,

При 7 = 0 неравенство (18.20)

принимает вид r\x

т. е. совпадает с неравенством (17.2).

 

 

 

Вычислим производную функции, стоящей в левой

части неравенства (18.20):

 

 

 

 

 

_£ Гцем І^х +

I

 

 

 

 

 

 

^ e~MBul dx^j =

 

 

 

 

 

d t

 

 

о

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

і

 

 

 

 

 

 

 

=

т\eAtA lx +

§ ег^Ви1dt J+ r\Bu1 =

 

 

 

 

 

'

о

 

'

 

 

 

 

 

 

 

t

 

 

 

 

 

 

 

= цеАі ^Ax

^ Ае~Ах dx

е~Аіj Ви1^

 

 

j Ах +

~ — dx +

 

5 u xj = r\eAt (Ax + Bul).

 

 

 

о

 

 

 

 

 

 

(18.23)

178

ЗАДАЧИ БЫСТРОДЕЙСТВИЯ

[ГЛ. II

Неравенство (18.20) при t = Ѳ1 превращается в равен­ ство, поэтому производная (18.23) при t = Ѳ1 неотри­

цательна

цело' (Ах Д - Би1) 0.

(18.24)

Неравенство (18.24) означает, что траектории, удовлетво­

ряющие условию

(18.20), при

t — Ѳ1

попадают на плос­

кость П в области, где при и =

и1имеет место неравенство

 

 

г \ ~ > 0 .

 

 

 

(18.25)

Если ни в одной точке плоскости

П условие (18.25) не вы­

полняется, то попадание на эту

плоскость

из

области

(17.2) невозможно.

ё Пц

удовлетворяющих

неравен­

Множество точек і

ствам (17.2) и (18.24),

обозначим через D v Тогда D l ее D v

поскольку неравенства (17.2),

(18.24)

являются

следст­

вием неравенств

(18.20).

 

 

 

 

 

Точка х е П,

является граничной точкой множества

D x, если в любой принадлежащей плоскости

^

окрест­

ности этой точки содержатся как точки переключения, так и точки, не являющиеся таковыми. Совокупность граничных точек множества D x обозначим через Г.

Те точки і е

Г,

которые лежат на границе множества

D u обращают

соотношение (17.2)

либо соотношение

(18.24) в равенство.

Для тех точек і е

Г, которые лежат

внутри множества D u имеет место строгое неравенство (17.2) и строгое неравенство

целе1( А х В и г)^> 0.

(18.26)

Траектории, начинающиеся из точек х ЕЕ Пх,

удовлетво­

ряющих условию (18.26), попадают на плоскость П в об­

ласти, где при и = и1 имеет место строгое

неравенство

ц - | > 0 .

(18.27)

Выпишем уравнения для точек х ее Г, лежащих внутри области Di. Имеет место следующая теорема.

Теорема 18.3. Если точка х ее Г удовлетворяет усло­ виям (17.2), (18.26), то для нее существует t ЕЕ (0, Ѳ1),

2]

БЫСТРЕЙШЕЕ ПОПАДАНИЕ НА ПЛОСКОСТЬ

179

при котором

имеют место равенства

 

 

 

t

 

 

 

r\eAtx + 5 це^-^Ви1 dr = d,

(18.28)

 

 

о

 

 

 

цем (Ах + Ви1) = 0.

(18.29)

 

Докажем

эту теорему.

 

Если точка х удовлетворяет условию (18.26), то все траектории, начинающиеся из некоторой окрестности этой точки, попадают на ту часть плоскости П, где имеет место неравенство (18.27). Каждой траектории,

начинающейся из окрестности бх, соответствует свое зна­ чение г| dz gl . Существует, очевидно, такое значение

а0 , что для всех траекторий, начинающихся из доста­

точно малой окрестности бх,

d x

>

а■

(18.30)

Ч-Ж

Ql ^

 

 

Разложим функцию r\x (t) в ряд по степеням t — Ѳ1:

V (<) _ ч* (в>) + л § A t -

в‘) +

ч

„ (< - ѳ*)* +

Из равенства х\х (Ѳ1) = d и неравенства (18.30) следует

существование такой величины

Д )> 0, что выходящие

из

окрестности

бх траектории х (t) при значениях

і Е

1 — А, О1)

лежат в области (17.2).

 

Предположим,

что точка х Е

Г ни при каких значе-

ниях

t ЕЕ [0, Ѳ1 — А] не

удовлетворяет условию (18.28).

Тогда

в силу непрерывной зависимости решения системы

(1 .1 )

от начальных условий существует такая окрестность

б2 GE Пх точки X,

что выходящие из этой окрестности

траектории х (t)

при і е

Ю, Ѳ1

— А] лежат в области

(17.2). Следовательно, все траектории, выходящие из

окрестности 6 = бх П 62 точки х, лежат при t

[0, Ѳ1),

в области (17.2). Этого, однако, не может быть, поскольку точка X является граничной для множества D 1. Значит, существует такое значение t ЕЕ (0, Ѳ1), при котором имеет место равенство (18.28). При этом значении t траектория X (t), очевидно, касается плоскости П, т. е. равна нулю производная (18.23). Это и означает, что имеет место ра­ венство (18.29). Теорема доказана.

180

ЗАДАЧИ

БЫСТРОДЕЙСТВИЯ

(ГЛ. II

Равенство

(18.28) при t =

0 и

равенство

(18.29) при

t = Ѳ1 принимают такой вид:

 

 

 

 

•цем1

ч\х =

d,

 

(18.31)

 

(^4ж +

5 h1)

= 0.

(18.32)

Уравнения (18.31), (18.32) описывают границу множест­

ва D v

Уравнения (18.28), (18.29), (18.31), (18.32) описывают

границу множества D v

Уравнения

(18.28),

(18.29)

опи­

 

 

сывают ту часть границы,

 

 

которая лежит внутри мно­

 

 

жества D r

Эти уравнения

/11

 

являются параметрически­

 

 

А'/'Л ми; параметр

t

принадле­

гі___

жит интервалу (0, Ѳ1). Если

 

^=====zp!y c '

решения уравнений(18.28),

 

(18.29) не попадают в

об­

/

^

ласть

 

ни

при

ка­

ком

значении

параметра

 

 

 

 

*е(о, Ѳ1), то Di =

Dy

 

 

 

Докажем

следующую

 

 

теорему.

 

18.4.

Если

 

Рис. 18.1.

Теорема

 

 

(1 .1 )

 

система вт

 

 

 

 

 

порядка, то

D x =

D y

 

В системах второго порядка гиперплоскости П и ГД

представляют собой прямые линии (рис

18.1).

 

 

Предположим, что D x Ф D\. Тогда на прямой Пх есть

точка Г, лежащая внутри множества D x и являющаяся граничной точкой множества D x. Эта точка удовлетворяет условиям (17.2), (18.26), поскольку она лежит внутри

множества D x. В соответствии с теоремой 18.3, траекто­ рия системы (1.1) при и = и1, начинающаяся из точки Г, должна, коснувшись прямой П в некоторый момент t, попасть на прямую П в области, где ц dx/dt )> 0. На рис. 18.1 показана точка касания С, в этой точке

т) -JP = 0. В точке А имеет место неравенство ц dx/dt Д> 0.

Это неравенство имеет место, очевидно, во всех точках интервала СА.

Соседние файлы в папке книги из ГПНТБ