Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Формальский А.М. Управляемость и устойчивость систем с ограниченными ресурсами

.pdf
Скачиваний:
8
Добавлен:
24.10.2023
Размер:
11.01 Mб
Скачать

1] ОГРАНИЧЕННЫЕ ПО ВЕЛИЧИНЕ И ИМПУЛЬСУ СИЛЫ 161

Отсюда получаем (при больших значениях к)

arcsin

=

Я

2Ä •

~2

Из выражения (16.76)

при

Т =

л/2 + я/с + ф имеем

 

ТЕ

 

 

d (ф) Т) = 2к

^ sin 6 —2к sin-~*: .

arcsin Хо

 

 

Расстояние d (ф, Т) монотонно возрастает с ростом Т,

поэтому

при

ф = —я/2

получаем

 

 

 

d (ф) =

lim d (ф, Т) =

lim 2к sin -Ц- - хъ. (16.79)

 

 

 

Т—оо

 

 

к—>оо

^

 

Если

ф =

я/2,

то

уравнение (16.78)

приобретает вид

Тогда

 

+

1 ) (я — 2 arcsin х0) =

хъ-

 

 

 

 

 

 

 

 

 

 

 

 

 

Л

 

 

 

 

arcsin Хо = у

2(к + 1) '

 

Из выражений

(16.76) получаем

 

 

 

 

 

 

 

71

 

 

 

 

d (ф, T) = 2 (k -\-l)

тг*

sin 6 dö =

 

Хз

^

2 (к + 1) sin Щррц ■

arcsin Хо

6 А. М. Формальский

162 ЗАДАЧИ БЫСТРОДЕЙСТВИЯ [ГЛ, II

Отсюда видно, что равенство (16.79) имеет место также

при ф = я/2 .

| ф | Ф л/2. При к

оо имеем %0-*• 1

Пусть теперь

и, следовательно,

arcsin %0- + л / 2. Поэтому для всякого

фиксированного значения ф при достаточно больших значениях к будет иметь место неравенство |ф| •< arcsin %0. При этих значениях к множество Е (Т, %0) состоит из од­

ного полуинтервала

длиной

л/2 — arcsin %0 и из к ин­

тервалов длиной я — 2 arcsin %0-

Уравнение (16.78) при

этом приобретает вид

 

 

 

 

(2к +

1 ) ( д — arcsin x0j =

х3.

Тогда

 

 

 

 

 

 

 

Я

Хз

 

 

arcsmxo = T -23k+T-

 

Из выражения

(16.76)

при

Т =

л/2 + я& + ф и

I ф I Ф л/2

имеем

 

 

 

 

 

 

Л

 

 

 

 

 

 

 

 

d((p, Т) =

{2к + 1)

^ sinöc/б = (2/с + 1) sing^Tj •

 

 

arcsin Хо

 

 

 

Отсюда заключаем, что d (ф)

= х3 при всех значениях ф.

Граница Г является огибающей однопараметрического

семейства опорных прямых

 

 

 

 

xt cos ф -Г х2 sin ф = х3.

(16.80)

Огибающей семейства (16.80) является окружность радиу­ са х3. Точки этой окружности не принадлежат области управляемости Q.

Таким образом, область управляемости Q представ­ ляет собой внутренность круга радиуса х3, т. е. описыва­ ется неравенством

xt f х\ < x l

(16.81)

Тот факт, что граница Г не может быть ни чем иным, кроме окружности, следует также из того, что фазовые траектории системы (16.73) при и (т) = 0 представляют собой окружности. Действительно, если систему (16.73) можно привести в начало координат из какой-либо точки г б і г ПРИ заданном ограничении х3, то такое приведе-

1] ОГРАНИЧЕННЫЕ ПО ВЕЛИЧИНЕ И ИМПУЛЬСУ СИЛЫ 163

ние можно осуществить при всех начальных состояниях, принадлежащих окружности с центром в начале коорди­

нат,

проходящей через точку х.

В

полупространстве х3 0 пространства Х 3 область

(16.81) представляет собой внутренность конуса (рис. 16.8). Перейдем теперь к вопросу о синтезе в пространстве

Х3 оптимального по времени управления.

 

 

 

Из формулы (5.12) получаем, что оптимальное уп­

равление и (т, Хо) имеет вид

х<=Е(Т,

 

 

“ (*, Хо) =

sgn[sin(cp — т)]

при

Хо),

 

 

О

 

 

 

при іе ( ? ( Г ,

Хо),

}

 

 

 

 

 

 

 

 

где множество Е (Т, %0)

определяется выражением (16.77),

а множество)

G (Т, Хо) — выражением

 

 

 

(НТ,

Хо) = { т е [О,

Л:

I sin (ф - т ) | <

Хо}- [(16-83)

 

В работе [36в] для 'системы

(16.73) рассматривается

задача минимизации интеграла

 

 

 

т

 

 

 

 

 

 

 

 

 

 

 

 

§ I и (т) I dx

при

 

ограничении

 

 

 

о

 

 

 

 

 

 

 

 

 

 

 

 

(1.2).

Оптимальное управление

 

 

 

в

этой

задаче

имеет

ту

же

 

 

 

структуру,

 

что и

управление

 

 

 

(16.82) .

 

 

 

 

 

 

Х 2

 

 

 

 

Найдем

 

на

плоскости

 

 

 

множество

D 0

начальных

со­

 

 

 

стояний

ж,

в

которых

опти­

 

 

 

мальное управление равно ну­

 

 

 

лю в начальный момент време­

 

 

 

ни

и (0, Хо)

6 .

Из

выра­

 

 

 

жений

(16.82),

(16.83)

сле­

 

 

 

дует,

что и (0 , Хо)

= Опри

тех

 

 

 

и только

тех

начальных усло­

 

 

 

виях,

для

которых I sin

ф I О

 

 

 

О

Хо-

При

X >

1 имеем

р

 

 

 

(Т,

х)

= 0

для

любого

Т,

по­

Рис.

16.8.

 

этому при всех значениях Г ве­

 

 

 

 

личина

Хо<1- Отсюда следует,

 

 

 

что

и (0 , Хо) Ф 6 при начальных условиях,

для которых

I Ф I

= я/2.

Будем рассматривать те начальные условия,

для которых

I ф I <С я/2; тогда неравенство | sin ф[ ^

Хо

6*

164

ЗАДАЧИ

БЫСТРОДЕЙСТВИЯ

[ГЛ. II

эквивалентно неравенству

 

 

I <р I <

arcsin Хо-

(16.84)

Следовательно, при начальных условиях, принадлежащих множеству D 0, имеет место неравенство (16.84).

Введем обозначение

к = Г-----— 1 ,

(16.85)

Ln — 2 arcsin хоJ

'

'

которое означает, что к — целая часть выражения, стоя­ щего в квадратных скобках.

Если Т — время быстродействия, то, очевидно, су­ ществует примыкающий к точке х = Т интервал времени — е, Т), на котором и (т, % о) ф 0. Для выполнения

этого условия необходимо наличие одного из двух соот­ ношений:

Ф — Т — —як -г arcsin %0,

либо (рис. 16.9)

—я -f 1 ) + arcsin Хо < Ф— Г<С —л/с — arcsin х0-

В последнем случае уравнение (16.78) приобретает вид

(см. рис. 16.9)

Т — ф — (2к + 1) arcsin х0 = хя.

(16.86)

1] ОГРАНИЧЕННЫЕ ПО ВЕЛИЧИНЕ И ИМПУЛЬСУ СИЛЫ 165

Для определения множества D 0 нужно подставить функцию (16.82) в выражение (1.6). Из (16.74), пользуясь симметрией фазового портрета оптимальной системы, по­ лучаем, что множество точек х е= D 0 определяется соот­ ношениями

т

 

гсі = г+г ^ ІА(г, Хо)sin х dr,

 

О

(16.87)

т

 

Хг + 5 и Хо) cos X dr.

 

о

 

Величины Т и %0, входящие в соотношения (16.87), удовле­ творяют неравенству (16.84) и уравнению (16.86). Мно­ жество D0 двухпараметрическое: в качестве одного пара­ метра выберем угол ср, в качестве другого — величину Хо* При подстановке в выражения (16.87) соотношений

arcsinxo = + ф

(16.88)

получаются, очевидно, уравнения границ множества D 0. Если в формуле (16.88) взять верхний знак, то для вели­ чины Т из уравнения (16.86) получается выражение

Т = ж3 + 2 + 1)ф.

(16.89)

Если взять нижний знак, то получим

 

Т — х3 — 2Аф.

(16.90)

Используя выражения (16.82), (16.89),

вычислим ин­

тегралы (16.87) при условии arcsin Хо = Ф:

Т Ф

®1 = +

5 и (т, Хо) sin т dx =

+

5

М(Ф — ö>Х о) sin (б — ф) dh =

 

О

 

Ф — т

 

 

 

— п к — Ф

 

 

 

= + Г ( - 1)*+1

5

sin (б — ф)

 

 

—Я8—(2fr+l) Ф

 

 

 

— Ф

 

 

 

 

— к

§ sin (б — ф ) 1

=

+

{(к + 1 ) cos 2 ф + к +

 

—Л+ф

 

 

 

 

+ (—l)k+1cos [х3 2 -f-1) ф]}, (16.91)

166

ЗАДАЧИ

БЫСТРОДЕЙСТВИЯ

[ГЛ. II

Т

 

 

Ф

 

 

х2 = + § и (X, Хо) C0Stdr = +

5 и (ф — ö’ b ) cos (б — ф)^0==

О

 

Ф— т

 

 

= + Г(—l )fe+1

—7tfr—ф

 

 

5

cos (б — ф)йб —

 

L

 

—x 3- ( 2 f r + l ) Ф

 

 

—Ф

 

 

 

 

 

— к §

cos (б — cp)I = +

{(к + 1 ) sin 2cp +

 

—л+Ф

+ ( - l ) &flsin [г, +

2 + 1 ) ф]}.

(16.92)

 

При условии arcsin Хо =

—ф вычисление интегралов

(16.87) с использованием формул (16.82), (16.90) дает следующие выражения:

хх =

+

[fccos 2ф + к + 1

-f- (—l ^ c o s (х3 — 2/іф)],

(16.93)

х2 =

+

[/свт2ф + (—l)fc+1 sin(a;3— 2/сф)].

 

(16.94)

Выражение (16.85) после подстановки равенств (16.88)

становится следующим:

 

 

 

 

 

 

 

 

* = [ г = ? П н ] -

 

<№ 95>

Равенства (16.91), (16.92) и (16.93), (16.94) при"фикси­

рованном значении

х3

0

представляют собой,

вместе

с выражением (16.95),

параметрические

уравнения

кри­

вых,

ограничивающих

множество D 0 на плоскости

Х 2.

В уравнениях

(16.91),

(16.92) параметр

ф принадлежит

полуинтервалу

[0.

я/2). В

уравнениях

(16.93),

(16.94)

параметр ф Е [0, —я/2). Эти же уравнения(16.91)—(16.94) описывают в полупространстве х3 0 пространства Х 3 поверхности переключения.

Проведем анализ уравнений (16.91)—(16.95).

Части кривых (16.91), (16.92) и (16.93),(16.94), соответ­

ствующие тем диапазонам значений параметра ф,

в которых

величина к остается постоянной, являются гладкими.

Из

уравнений (16.91),' (16.92)

получаем, что при

ф -а- я /2

Х\ V 0 , х2 —|—х3.

 

 

Из уравнений (16.93),

(16.94)] получаем,

что

при

Ф -> —л/2

 

 

 

XJ-+0, х2 - * + х 3.

1]

ОГРАНИЧЕННЫЕ ПО ВЕЛИЧИНЕ И ИМПУЛЬСУ СИЛЫ

167

Следовательно, один из концов кривых лежит на гра­

нице области управляемости Q в точке х1 = 0, х2 =

+ ж а.

При ф = 0

из обеих пар уравнений получается одна

и та же пара уравнепий

 

 

 

 

хх = + [2к + 1

+ (—lf^ c o s^ ],

х2 = + [(—1 ) Ä+1 sinzg].

Здесь

 

 

 

 

(16.96)

 

 

 

 

 

 

Если

в уравнениях

(16.96) положить

х3 = лк +

а,

где

О ^

а < л, то

получится

 

 

 

 

 

Ху. — +

(2к

1 — cos а),

х2 =

+ sin а.

(16.97)

При наличии только ограничения

| и | ^ 1 (ограни­

чение (1.4) отсутствует) оптимальное по времени управ­ ление принимает значения + 1 . Линия переключения S оптимального управления в такой задаче быстродействия для системы (16.73) построена в работе [47]. Уравнения (16.96) или (16.97), если рассматривать в них х3 как пара­ метр, представляют собой как раз уравнения этой линии

переключения S.

 

0 все четыре кри­

Таким образом, при х3 = const

вые (16.91)—(16.94) начинаются

при ф = 0 с линии S

и при I ф I

я/2 оканчиваются на границе области управ­

ляемости Q, на оси Ху = 0.

=

Зя/2 область управ­

На рис.

16.10 для значения х3

ляемости Q разделена кривыми (16.91)—(16.94) на обла­ сти, в которых оптимальное управление в начальный момент времени равно —1 , 0 (область заштрихована) и 1 .

Рассматривая соотношения (16.91)—(16.94), (16.97) в полупространстве х3 0 , можно полностью понять кар­

тину синтеза оптимального управления в пространстве Х 3. Эта картина изображена на рис. 16.8. На этом рисунке внутренность конуса (16.81) разделена цилиндрической поверхностью (16.97) и поверхностями (16.91)—(16.94) на области, в которых оптимальное управление прини­ мает значение — 1, 0 и 1. На рис. 16.10 показано сечение

конуса Q плоскостью

х3 =

Зя/2.

Обозначим через

Ѳ =

Ѳ(a71? х2) минимальное время

приведения из точки (ху, х2) в начало координат системы

168

ЗАДАЧИ БЫСТРОДЕЙСТВИЯ

[ГЛ. II

(16.73)

при ограничении | и |

1. В

области простран­

ства Х 3, обусловленной неравенством

Ѳ(х1г х2) ^

х3 (см.

неравенства (13.5)), и только в ней оптимальное управле-

 

 

оо

ниѳ при ограничениях | и |

1 , ^ | и (X) | dx ^ х3является,

очевидно,

чисто релейным

о

(принимает только значения

— 1 и 1 )

и не зависит от величины х3.

Если начальное состояние (xlt х2, х3),будучи в конусе (16.81), находится в области 0 (хг, х2) х3, то для него

оптимальное управление на конечном числе отрезков времени обращается в нуль. При этом в конце интервала приведения существует отрезок времени, на котором оп­ тимальное управление отлично от нуля. Оптимальная траектория на этом и только на этом отрезке времени

располагается в области Ѳ(%, х2) ^

х3, точнее

говоря,

на

поверхности Ѳ(zlt х2) = х3.

 

 

 

 

При решении задачи синтеза оптимального управле­

ния для системы (16.1) в случаях, когда ѵ =

0 , получается,

что

оптимальное управление равно

нулю

только

на не­

23

БЫСТРЕЙШЕЕ ПОПАДАНИЕ НА ПЛОСКОСТЬ

169

которых

поверхностях трехмерного пространства

Х 3,

т. е. на множестве точек і ё і 3 нулевой меры. В случае, когда X = О, V < 0 , множество точек і Е І 3і в которых

оптимальное управление равно нулю, является множе­ ством полной меры.

2.ЗАДАЧА БЫСТРЕЙШЕГО ПОПАДАНИЯ НА ПЛОСКОСТЬ

Внастоящем разделе рассматривается система (1.1) при ограничениях (1.2) на управление. Задача быстрей­ шего попадания этой системы на заданную в фазовом про­ странстве гиперплоскость является одной из немногих задач оптимальности, в которых удается аналитически построить поверхности переключения оптимального упра­ вления.

Куказанной задаче сводится вопрос о быстрейшем

приведении (но не удержании) одной из фазовых коорди­ нат системы к заданному значению.

Задача быстрейшего попадания на плоскость может представить интерес для некоторых итерационных вычис­ лительных процессов, например, для процесса Итона [9, 11, 33, 61], поскольку ее можно использовать в каче­ стве промежуточной в этих процессах.

Здесь излагаются результаты, полученные в статье

[55ж].

§17. Постановка задачи

Будем рассматривать управляемую систему, которая

описывается матричным уравнением (1 .1 ) (уравнением

(2 .2) в случае одной управляющей силы).

язв'**»*

В качестве допустимых управлений примем кусочно­

непрерывные функции времени us (т) (s =

1 , . . ., г), удо­

влетворяющие неравенству (1.2). Множество таких век­

тор-функций обозначим через Q.

Х п задана гиперплос­

Пусть

в фазовом пространстве

кость П

г]х = d,

(17.1)

 

где ц = I

I —матрица (1 X п).

Если ц — единичный

вектор, то d — расстояние от начала координат до ги­ перплоскости П.

170

ЗАДАЧИ БЫСТРОДЕЙСТВИЯ

[ГЛ. IJ

Поставим задачу быстрейшего приведения системы (1.1) на плоскость (17.1). Управление и (т), приводящее систему (1.1) из начального состояния ж (0) на плоскость (17.1) за минимально возможное время, будем называть опти­ мальным, а соответствующую траекторию — оптимальной траекторией.

Будем считать в дальнейшем, что начальные состоя­ ния принадлежат области

T[x<C.d. (17.2)

Для тех начальных состояний, которые не удовлетворяют условию (17.2), вместо вектора р можно выбрать вектор

— р и записать уравнение плоскости (17.1) в виде

г\х = d. Тогда условие типа (17.2) будет выполнено. Поэтому предположение (17.2) не ограничивает общности постановки задачи.

§ 18. Решение задачи

Приведем схему доказательства теоремы существова­ ния оптимального управления в поставленной задаче.

Рассмотрим при фиксированных начальных условиях X (0) область достижимости S (Т):

S (Т) = {х {Т): и {t ) G ß ) .

(18.1)

В выражении (18.1) вектор х (Т) определяется формулой Коши (1.5) для решения уравнения (1.1). Область дости­ жимости S (Т), так же как и область (У (Т), обладает свойствами (§ 2) выпуклости (1°) и замкнутости (4°). Свойствами «роста» (2°) и симметрии (3°) область S (Т) обладает при х (0) = 0 .

Для множества S (Т) справедливы утверждения, «по­ хожие» на утверждения, высказанные в леммах 1 и 2

§ 15.

Утверждение, высказанное в лемме 2 § 15, в настоя­

щем

случае

звучит

так.

Лемма 1.

Если

ни одна точка плоскости П не при­

надлежит области S (Т°), то существует такое значение

ТЮ

Т°, что ни одна точка плоскости П не принадлежит

области S (ГР)).

 

Доказательство этой леммы приводить не будем. С по­ мощью леммы 1 докажем теорему существования.

Соседние файлы в папке книги из ГПНТБ