![](/user_photo/_userpic.png)
книги из ГПНТБ / Формальский А.М. Управляемость и устойчивость систем с ограниченными ресурсами
.pdf1] ОГРАНИЧЕННЫЕ ПО ВЕЛИЧИНЕ И ИМПУЛЬСУ СИЛЫ 161
Отсюда получаем (при больших значениях к)
arcsin |
= |
Я |
2Ä • |
~2 |
|||
Из выражения (16.76) |
при |
Т = |
л/2 + я/с + ф имеем |
|
ТЕ |
|
|
d (ф) Т) = 2к |
^ sin 6 dö —2к sin-~*: . |
||
arcsin Хо |
|
|
Расстояние d (ф, Т) монотонно возрастает с ростом Т,
поэтому |
при |
ф = —я/2 |
получаем |
|
|
||||
|
d (ф) = |
lim d (ф, Т) = |
lim 2к sin -Ц- - хъ. (16.79) |
||||||
|
|
|
Т—оо |
|
|
к—>оо |
^ |
|
|
Если |
ф = |
я/2, |
то |
уравнение (16.78) |
приобретает вид |
||||
Тогда |
|
(к + |
1 ) (я — 2 arcsin х0) = |
хъ- |
|||||
|
|
|
|
|
|
%з |
|
||
|
|
|
|
|
|
Л |
|
||
|
|
|
arcsin Хо = у |
— 2(к + 1) ' |
|
||||
Из выражений |
(16.76) получаем |
|
|
||||||
|
|
|
|
|
71 |
|
|
|
|
d (ф, T) = 2 (k -\-l) |
тг* |
sin 6 dö = |
|
Хз |
|||||
^ |
2 (к + 1) sin Щррц ■ |
arcsin Хо
6 А. М. Формальский
162 ЗАДАЧИ БЫСТРОДЕЙСТВИЯ [ГЛ, II
Отсюда видно, что равенство (16.79) имеет место также
при ф = я/2 . |
| ф | Ф л/2. При к |
оо имеем %0-*• 1 |
Пусть теперь |
||
и, следовательно, |
arcsin %0- + л / 2. Поэтому для всякого |
фиксированного значения ф при достаточно больших значениях к будет иметь место неравенство |ф| •< arcsin %0. При этих значениях к множество Е (Т, %0) состоит из од
ного полуинтервала |
длиной |
л/2 — arcsin %0 и из к ин |
|||
тервалов длиной я — 2 arcsin %0- |
Уравнение (16.78) при |
||||
этом приобретает вид |
|
|
|
||
|
(2к + |
1 ) ( д — arcsin x0j = |
х3. |
||
Тогда |
|
|
|
|
|
|
|
Я |
Хз |
|
|
|
arcsmxo = T -23k+T- |
|
|||
Из выражения |
(16.76) |
при |
Т = |
л/2 + я& + ф и |
|
I ф I Ф л/2 |
имеем |
|
|
|
|
|
|
Л |
|
|
|
|
|
~г |
|
|
|
d((p, Т) = |
{2к + 1) |
^ sinöc/б = (2/с + 1) sing^Tj • |
|||
|
|
arcsin Хо |
|
|
|
Отсюда заключаем, что d (ф) |
= х3 при всех значениях ф. |
||||
Граница Г является огибающей однопараметрического |
|||||
семейства опорных прямых |
|
|
|
||
|
xt cos ф -Г х2 sin ф = х3. |
(16.80) |
Огибающей семейства (16.80) является окружность радиу са х3. Точки этой окружности не принадлежат области управляемости Q.
Таким образом, область управляемости Q представ ляет собой внутренность круга радиуса х3, т. е. описыва ется неравенством
xt f х\ < x l |
(16.81) |
Тот факт, что граница Г не может быть ни чем иным, кроме окружности, следует также из того, что фазовые траектории системы (16.73) при и (т) = 0 представляют собой окружности. Действительно, если систему (16.73) можно привести в начало координат из какой-либо точки г б і г ПРИ заданном ограничении х3, то такое приведе-
1] ОГРАНИЧЕННЫЕ ПО ВЕЛИЧИНЕ И ИМПУЛЬСУ СИЛЫ 163
ние можно осуществить при всех начальных состояниях, принадлежащих окружности с центром в начале коорди
нат, |
проходящей через точку х. |
В |
полупространстве х3 0 пространства Х 3 область |
(16.81) представляет собой внутренность конуса (рис. 16.8). Перейдем теперь к вопросу о синтезе в пространстве
Х3 оптимального по времени управления. |
|
|
||||||||||
|
Из формулы (5.12) получаем, что оптимальное уп |
|||||||||||
равление и (т, Хо) имеет вид |
х<=Е(Т, |
|
|
|||||||||
“ (*, Хо) = |
sgn[sin(cp — т)] |
при |
Хо), |
|
||||||||
|
О |
|
|
|
при іе ( ? ( Г , |
Хо), |
} |
|||||
|
|
|
|
|
|
|
|
|||||
где множество Е (Т, %0) |
определяется выражением (16.77), |
|||||||||||
а множество) |
G (Т, Хо) — выражением |
|
|
|||||||||
|
(НТ, |
Хо) = { т е [О, |
Л: |
I sin (ф - т ) | < |
Хо}- [(16-83) |
|||||||
|
В работе [36в] для 'системы |
(16.73) рассматривается |
||||||||||
задача минимизации интеграла |
|
|
|
|||||||||
т |
|
|
|
|
|
|
|
|
|
|
|
|
§ I и (т) I dx |
при |
|
ограничении |
|
|
|
||||||
о |
|
|
|
|
|
|
|
|
|
|
|
|
(1.2). |
Оптимальное управление |
|
|
|
||||||||
в |
этой |
задаче |
имеет |
ту |
же |
|
|
|
||||
структуру, |
|
что и |
управление |
|
|
|
||||||
(16.82) . |
|
|
|
|
|
|
Х 2 |
|
|
|
||
|
Найдем |
|
на |
плоскости |
|
|
|
|||||
множество |
D 0 |
начальных |
со |
|
|
|
||||||
стояний |
ж, |
в |
которых |
опти |
|
|
|
|||||
мальное управление равно ну |
|
|
|
|||||||||
лю в начальный момент време |
|
|
|
|||||||||
ни |
и (0, Хо) |
— 6 . |
Из |
выра |
|
|
|
|||||
жений |
(16.82), |
(16.83) |
сле |
|
|
|
||||||
дует, |
что и (0 , Хо) |
= Опри |
тех |
|
|
|
||||||
и только |
тех |
начальных усло |
|
|
|
|||||||
виях, |
для |
которых I sin |
ф I О |
|
|
|
||||||
О |
Хо- |
При |
X > |
1 имеем |
р,Е |
|
|
|
||||
(Т, |
х) |
= 0 |
для |
любого |
Т, |
по |
Рис. |
16.8. |
|
|||
этому при всех значениях Г ве |
|
|||||||||||
|
|
|
||||||||||
личина |
Хо<1- Отсюда следует, |
|
|
|
||||||||
что |
и (0 , Хо) Ф 6 при начальных условиях, |
для которых |
||||||||||
I Ф I |
= я/2. |
Будем рассматривать те начальные условия, |
||||||||||
для которых |
I ф I <С я/2; тогда неравенство | sin ф[ ^ |
Хо |
6*
164 |
ЗАДАЧИ |
БЫСТРОДЕЙСТВИЯ |
[ГЛ. II |
эквивалентно неравенству |
|
||
|
I <р I < |
arcsin Хо- |
(16.84) |
Следовательно, при начальных условиях, принадлежащих множеству D 0, имеет место неравенство (16.84).
Введем обозначение
к = Г-----— 1 , |
(16.85) |
|
Ln — 2 arcsin хоJ |
' |
' |
которое означает, что к — целая часть выражения, стоя щего в квадратных скобках.
Если Т — время быстродействия, то, очевидно, су ществует примыкающий к точке х = Т интервал времени (Т — е, Т), на котором и (т, % о) ф 0. Для выполнения
этого условия необходимо наличие одного из двух соот ношений:
Ф — Т — —як -г arcsin %0,
либо (рис. 16.9)
—я (к -f 1 ) + arcsin Хо < Ф— Г<С —л/с — arcsin х0-
В последнем случае уравнение (16.78) приобретает вид
(см. рис. 16.9)
Т — ф — (2к + 1) arcsin х0 = хя. |
(16.86) |
1] ОГРАНИЧЕННЫЕ ПО ВЕЛИЧИНЕ И ИМПУЛЬСУ СИЛЫ 165
Для определения множества D 0 нужно подставить функцию (16.82) в выражение (1.6). Из (16.74), пользуясь симметрией фазового портрета оптимальной системы, по лучаем, что множество точек х е= D 0 определяется соот ношениями
т |
|
|
гсі = г+г ^ ІА(г, Хо)sin х dr, |
|
|
О |
(16.87) |
|
т |
||
|
||
Хг —+ 5 и Хо) cos X dr. |
|
|
о |
|
Величины Т и %0, входящие в соотношения (16.87), удовле творяют неравенству (16.84) и уравнению (16.86). Мно жество D0 двухпараметрическое: в качестве одного пара метра выберем угол ср, в качестве другого — величину Хо* При подстановке в выражения (16.87) соотношений
arcsinxo = + ф |
(16.88) |
получаются, очевидно, уравнения границ множества D 0. Если в формуле (16.88) взять верхний знак, то для вели чины Т из уравнения (16.86) получается выражение
Т = ж3 + 2 (к + 1)ф. |
(16.89) |
Если взять нижний знак, то получим |
|
Т — х3 — 2Аф. |
(16.90) |
Используя выражения (16.82), (16.89), |
вычислим ин |
тегралы (16.87) при условии arcsin Хо = Ф:
Т Ф
®1 = + |
5 и (т, Хо) sin т dx = |
+ |
5 |
М(Ф — ö>Х о) sin (б — ф) dh = |
|
|
О |
|
Ф — т |
|
|
|
|
— п к — Ф |
|
|
|
= + Г ( - 1)*+1 |
5 |
sin (б — ф) dö — |
|||
|
|
—Я8—(2fr+l) Ф |
|
|
|
|
— Ф |
|
|
|
|
— к |
§ sin (б — ф ) dè1 |
= |
+ |
{(к + 1 ) cos 2 ф + к + |
|
|
—Л+ф |
|
|
|
|
+ (—l)k+1cos [х3 2 (к -f-1) ф]}, (16.91)
166 |
ЗАДАЧИ |
БЫСТРОДЕЙСТВИЯ |
[ГЛ. II |
||
Т |
|
|
Ф |
|
|
х2 = + § и (X, Хо) C0Stdr = + |
5 и (ф — ö’ b ) cos (б — ф)^0== |
||||
О |
|
Ф— т |
|
|
|
= + Г(—l )fe+1 |
—7tfr—ф |
|
|
||
5 |
cos (б — ф)йб — |
|
|||
L |
|
—x 3- ( 2 f r + l ) Ф |
|
|
|
—Ф |
|
|
|
|
|
— к § |
cos (б — cp)dèI = + |
{(к + 1 ) sin 2cp + |
|
||
—л+Ф |
+ ( - l ) &flsin [г, + |
2 (к + 1 ) ф]}. |
(16.92) |
||
|
|||||
При условии arcsin Хо = |
—ф вычисление интегралов |
(16.87) с использованием формул (16.82), (16.90) дает следующие выражения:
хх = |
+ |
[fccos 2ф + к + 1 |
-f- (—l ^ c o s (х3 — 2/іф)], |
(16.93) |
|||||
х2 = |
+ |
[/свт2ф + (—l)fc+1 sin(a;3— 2/сф)]. |
|
(16.94) |
|||||
Выражение (16.85) после подстановки равенств (16.88) |
|||||||||
становится следующим: |
|
|
|
|
|||||
|
|
|
|
* = [ г = ? П н ] - |
|
<№ 95> |
|||
Равенства (16.91), (16.92) и (16.93), (16.94) при"фикси |
|||||||||
рованном значении |
х3 |
0 |
представляют собой, |
вместе |
|||||
с выражением (16.95), |
параметрические |
уравнения |
кри |
||||||
вых, |
ограничивающих |
множество D 0 на плоскости |
Х 2. |
||||||
В уравнениях |
(16.91), |
(16.92) параметр |
ф принадлежит |
||||||
полуинтервалу |
[0. |
я/2). В |
уравнениях |
(16.93), |
(16.94) |
параметр ф Е [0, —я/2). Эти же уравнения(16.91)—(16.94) описывают в полупространстве х3 0 пространства Х 3 поверхности переключения.
Проведем анализ уравнений (16.91)—(16.95).
Части кривых (16.91), (16.92) и (16.93),(16.94), соответ
ствующие тем диапазонам значений параметра ф, |
в которых |
||
величина к остается постоянной, являются гладкими. |
Из |
||
уравнений (16.91),' (16.92) |
получаем, что при |
ф -а- я /2 |
|
Х\ V 0 , х2 —|—х3. |
|
|
|
Из уравнений (16.93), |
(16.94)] получаем, |
что |
при |
Ф -> —л/2 |
|
|
|
XJ-+0, х2 - * + х 3.
1] |
ОГРАНИЧЕННЫЕ ПО ВЕЛИЧИНЕ И ИМПУЛЬСУ СИЛЫ |
167 |
|||||
Следовательно, один из концов кривых лежит на гра |
|||||||
нице области управляемости Q в точке х1 = 0, х2 = |
+ ж а. |
||||||
При ф = 0 |
из обеих пар уравнений получается одна |
||||||
и та же пара уравнепий |
|
|
|
|
|||
хх = + [2к + 1 |
+ (—lf^ c o s^ ], |
х2 = + [(—1 ) Ä+1 sinzg]. |
|||||
Здесь |
|
|
|
|
(16.96) |
||
|
|
|
|
|
|
||
Если |
в уравнениях |
(16.96) положить |
х3 = лк + |
а, |
где |
||
О ^ |
а < л, то |
получится |
|
|
|
|
|
|
Ху. — + |
(2к |
1 — cos а), |
х2 = |
+ sin а. |
(16.97) |
|
При наличии только ограничения |
| и | ^ 1 (ограни |
чение (1.4) отсутствует) оптимальное по времени управ ление принимает значения + 1 . Линия переключения S оптимального управления в такой задаче быстродействия для системы (16.73) построена в работе [47]. Уравнения (16.96) или (16.97), если рассматривать в них х3 как пара метр, представляют собой как раз уравнения этой линии
переключения S. |
|
0 все четыре кри |
|
Таким образом, при х3 = const |
|||
вые (16.91)—(16.94) начинаются |
при ф = 0 с линии S |
||
и при I ф I |
я/2 оканчиваются на границе области управ |
||
ляемости Q, на оси Ху = 0. |
= |
Зя/2 область управ |
|
На рис. |
16.10 для значения х3 |
ляемости Q разделена кривыми (16.91)—(16.94) на обла сти, в которых оптимальное управление в начальный момент времени равно —1 , 0 (область заштрихована) и 1 .
Рассматривая соотношения (16.91)—(16.94), (16.97) в полупространстве х3 0 , можно полностью понять кар
тину синтеза оптимального управления в пространстве Х 3. Эта картина изображена на рис. 16.8. На этом рисунке внутренность конуса (16.81) разделена цилиндрической поверхностью (16.97) и поверхностями (16.91)—(16.94) на области, в которых оптимальное управление прини мает значение — 1, 0 и 1. На рис. 16.10 показано сечение
конуса Q плоскостью |
х3 = |
Зя/2. |
Обозначим через |
Ѳ = |
Ѳ(a71? х2) минимальное время |
приведения из точки (ху, х2) в начало координат системы
168 |
ЗАДАЧИ БЫСТРОДЕЙСТВИЯ |
[ГЛ. II |
||
(16.73) |
при ограничении | и | |
1. В |
области простран |
|
ства Х 3, обусловленной неравенством |
Ѳ(х1г х2) ^ |
х3 (см. |
неравенства (13.5)), и только в ней оптимальное управле-
|
|
оо |
ниѳ при ограничениях | и | |
1 , ^ | и (X) | dx ^ х3является, |
|
очевидно, |
чисто релейным |
о |
(принимает только значения |
||
— 1 и 1 ) |
и не зависит от величины х3. |
Если начальное состояние (xlt х2, х3),будучи в конусе (16.81), находится в области 0 (хг, х2) х3, то для него
оптимальное управление на конечном числе отрезков времени обращается в нуль. При этом в конце интервала приведения существует отрезок времени, на котором оп тимальное управление отлично от нуля. Оптимальная траектория на этом и только на этом отрезке времени
располагается в области Ѳ(%, х2) ^ |
х3, точнее |
говоря, |
||
на |
поверхности Ѳ(zlt х2) = х3. |
|
|
|
|
При решении задачи синтеза оптимального управле |
|||
ния для системы (16.1) в случаях, когда ѵ = |
0 , получается, |
|||
что |
оптимальное управление равно |
нулю |
только |
на не |
23 |
БЫСТРЕЙШЕЕ ПОПАДАНИЕ НА ПЛОСКОСТЬ |
169 |
которых |
поверхностях трехмерного пространства |
Х 3, |
т. е. на множестве точек і ё і 3 нулевой меры. В случае, когда X = О, V < 0 , множество точек і Е І 3і в которых
оптимальное управление равно нулю, является множе ством полной меры.
2.ЗАДАЧА БЫСТРЕЙШЕГО ПОПАДАНИЯ НА ПЛОСКОСТЬ
Внастоящем разделе рассматривается система (1.1) при ограничениях (1.2) на управление. Задача быстрей шего попадания этой системы на заданную в фазовом про странстве гиперплоскость является одной из немногих задач оптимальности, в которых удается аналитически построить поверхности переключения оптимального упра вления.
Куказанной задаче сводится вопрос о быстрейшем
приведении (но не удержании) одной из фазовых коорди нат системы к заданному значению.
Задача быстрейшего попадания на плоскость может представить интерес для некоторых итерационных вычис лительных процессов, например, для процесса Итона [9, 11, 33, 61], поскольку ее можно использовать в каче стве промежуточной в этих процессах.
Здесь излагаются результаты, полученные в статье
[55ж].
§17. Постановка задачи
Будем рассматривать управляемую систему, которая
описывается матричным уравнением (1 .1 ) (уравнением |
|
(2 .2) в случае одной управляющей силы). |
язв'**»* |
В качестве допустимых управлений примем кусочно |
|
непрерывные функции времени us (т) (s = |
1 , . . ., г), удо |
влетворяющие неравенству (1.2). Множество таких век
тор-функций обозначим через Q. |
Х п задана гиперплос |
|
Пусть |
в фазовом пространстве |
|
кость П |
г]х = d, |
(17.1) |
|
||
где ц = I |
I —матрица (1 X п). |
Если ц — единичный |
вектор, то d — расстояние от начала координат до ги перплоскости П.
170 |
ЗАДАЧИ БЫСТРОДЕЙСТВИЯ |
[ГЛ. IJ |
Поставим задачу быстрейшего приведения системы (1.1) на плоскость (17.1). Управление и (т), приводящее систему (1.1) из начального состояния ж (0) на плоскость (17.1) за минимально возможное время, будем называть опти мальным, а соответствующую траекторию — оптимальной траекторией.
Будем считать в дальнейшем, что начальные состоя ния принадлежат области
T[x<C.d. (17.2)
Для тех начальных состояний, которые не удовлетворяют условию (17.2), вместо вектора р можно выбрать вектор
— р и записать уравнение плоскости (17.1) в виде
—г\х = —d. Тогда условие типа (17.2) будет выполнено. Поэтому предположение (17.2) не ограничивает общности постановки задачи.
§ 18. Решение задачи
Приведем схему доказательства теоремы существова ния оптимального управления в поставленной задаче.
Рассмотрим при фиксированных начальных условиях X (0) область достижимости S (Т):
S (Т) = {х {Т): и {t ) G ß ) . |
(18.1) |
В выражении (18.1) вектор х (Т) определяется формулой Коши (1.5) для решения уравнения (1.1). Область дости жимости S (Т), так же как и область (У (Т), обладает свойствами (§ 2) выпуклости (1°) и замкнутости (4°). Свойствами «роста» (2°) и симметрии (3°) область S (Т) обладает при х (0) = 0 .
Для множества S (Т) справедливы утверждения, «по хожие» на утверждения, высказанные в леммах 1 и 2
§ 15.
Утверждение, высказанное в лемме 2 § 15, в настоя
щем |
случае |
звучит |
так. |
Лемма 1. |
Если |
ни одна точка плоскости П не при |
|
надлежит области S (Т°), то существует такое значение |
|||
ТЮ |
Т°, что ни одна точка плоскости П не принадлежит |
||
области S (ГР)). |
|
Доказательство этой леммы приводить не будем. С по мощью леммы 1 докажем теорему существования.