Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Формальский А.М. Управляемость и устойчивость систем с ограниченными ресурсами

.pdf
Скачиваний:
8
Добавлен:
24.10.2023
Размер:
11.01 Mб
Скачать

1] ОГРАНИЧЕННЫЕ ПО ВЕЛИЧИНЕ И ИМПУЛЬСУ СИЛЫ 131

В соответствии с леммой 4, п R плоскостей П (ц^), содержащих множество Р (Т), а значит, и его граничные точки, построить можно. Построим еще одну плоскость.

Возьмем произвольную точку, принадлежащую гра­ нице множества Р(Т) на многообразии размерности Я, и построим в этой точке опорную плоскость П множества Р (Т). Выберем эту плоскость так, чтобы ортогональный ей вектор Цп-к+і не был линейной комбинацией векторов т]ь (Ä = 1, . . ., тг — В). Кроме того, вектор Цп-я+і дол­

жен настолько мало отличаться от вектора

чтобы вы­

полнялось соотношение (14.16) при s = rW +

1, . . ., г.

Последнее условие дает возможность доказать (так же, как в лемме 2), что плоскость П совпадает с опорной

ПЛОСКОСТЬЮ П (Цп-Я+Іі Т).

Поскольку, в соответствии с теоремой 14.5, граница области достижимости Q (Т) имеет угловые точки, по­ стольку для множества Q (Г) имеет место теорема 14.4.

§15. Оптимальное управление

Внастоящем параграфе рассматриваются вопросы существования и единственности оптимального по вре­ мени управления, а также описывается структура этого управления. Прежде чем доказать теорему существования, докажем две леммы.

Лемма 1. Расстояние d (г), Т) до опорной гиперплоско­ сти П5 (т), Т) области достижимости Qs (Т) является не­ прерывной функцией аргументов ц и Т.

При значениях Т «< xn+g/Mg непрерывность функции d (т|, Т) от аргументов т] и Т вытекает из выражения (4.2). Непрерывность интеграла (4.2) от аргумента ц следует из того, что подынтегральное выражение является непре­ рывной функцией вектора ц и переменной т. Величина Т является верхним пределом интегрирования, поэтому расстояние d (ц, Т) зависит непрерывно от аргумента Т.

Пусть

теперь Т

xnJrS/Ms.

Если

цe~Axbs =

const,

то расстояние d (ц, Т) опре­

деляется

выражением (4.2)

при Т ^ xn+s/Ms и выраже­

нием (5.18) при Т

xn+s/Ms. Доказательство непрерыв­

ности здесь не представляет труда.

Если

rie-ATès ^

const, то для доказательства леммы

воспользуемся формулой

(5.17). Подынтегральное выра-

5*

132

ЗАДАЧИ БЫСТРОДЕЙСТВИЯ

[ГЛ. II

женив в этой формуле является непрерывной функцией аргументов ц и т. Область интегрирования Es (Т, %0) состоит из конечного числа интервалов (см. соотношение (5.13)), принадлежащих отрезку [О, Т]. Концы этих интервалов зависят непрерывно от величин Т и %0. Вели­ чина Хо> определяемая уравнением (5.16), зависит не­ прерывно, как нетрудно показать, от аргументов ц и Т.

Из сказанного вытекает непрерывность зависимости величины (5.17) от аргументов ц, Т и справедливость леммы.

Лемма 2. Если точка х ф. Qs (Т°), то существует такое значение Г(1) Т°, что x ^ Q s (T^).

Множество Qs (Т°) — замкнутое (§ 2, свойство 4Ь),

поэтому оно описывается неравенствами (2.7). Поскольку точка x ^ Q s (Т°), постольку существует вектор ц такой, что имеет место неравенство

х\х d (ц, Т°).

В соответствии с леммой 1, расстояние d (ц, Т) зависит непрерывно от величины Т , следовательно, существует такое значение ТЫ Т°, что выполняется неравенство

цх

d (г|, ТЫ),

Это и означает, что х

Qs ( Т Ы ) ,

Теперь докажем теорему существования оптимального

управления в системе (2.2).

Теорема 15.1. Если начальное состояние системы (2.2)

принадлежит области

управляемости (х (0) ЕЕ Qs), то

существует оптимальное по времени управление, перево­ дящее систему (2.2) из состояния х (0) в начало координат.

Если

X (0) ЕЕ Qs,

то, в соответствии

с

определением

области Qs, существует такое значение

Т,

что

х (0) ЕЕ

ЕЕ Qs (Т).

Множество

значений Т , при

которых

х (0) ЕЕ

ЕЕ Qs (Т), ограничено снизу, поэтому существует нижняя грань этих значений, которую обозначим через Т°.

Покажем, что х (0) ее Qs (Т°). Если х (0) ф Qs (Т°),

то, в соответствии с леммой 2, существует такое значение ТЛИ Т°, что X (0) (?É Qs (ТЫ). Это противоречит, одна­ ко, определению величины Т° как нижней грани значений Т, при которых X (0) ЕЕ Qs (Т).

Из определения области достижимости Qs (Т) следует, что за время Т° систему (2.2) можно привести в начало

1] ОГРАНИЧЕННЫЕ ПО ВЕЛИЧИНЕ И ИМПУЛЬСУ СИЛЫ 133

координат из состояния х (0) GE Qs (Т°) с помощью допу­

стимого управления us (х) ^

Qs (Т°).

За время Т <

Т°

такое

приведение

осуществить невозможно, поскольку

X (0) ^

Qs (Т) при

Т°.

Теорема

существования

до­

казана.

 

 

 

 

 

Леммы 1 и 2 имеют, очевидно, место и для системы (1.1), поэтому доказанная теорема существования спра­ ведлива также и для этой системы.

При доказательстве теоремы существования исполь­ зовались, по существу, два обстоятельства: непрерывная зависимость расстояния d ( ц, Т) от аргумента Т и зам­

кнутость области достижимости Q\ (Т). Эти обстоятельства имеют место также и в случае, когда присутствует только ограничение (1.2), т. е. в случае тп = 1. Поэтому наличие ограничения (1.4) никаких специфических особенностей в доказательство теоремы существования не вносит. Иначе обстоит дело при исследовании вопросов единствен­ ности оптимального управления. При этом исследова­ нии наличие ограничения (1.4) вносит специфические особенности, проявляющиеся в том, что граница области

Ql (Т), в отличие от области (Г), имеет плоские участки

Ps (Г) и —Р а (Т).

Прежде чем доказать теорему единственности опти­ мального управления для системы (2.2), докажем несколь­ ко лемм. Будем считать при этом, что система (2.2) впол­ не управляема (это не ограничивает общности рассуж­ дений).

Лемма 3. Если х является внутренней точкой области Qs (Т°), то существует такое значение Г(1><; Т°, что точка X будет внутренней для области Qs (Г(1)).

Точка X, будучи внутренней точкой области Qs (Т°), удовлетворяет строгим неравенствам

I х\х |< d (г), Т°)

при всех векторах ц S. Вследствие непрерывной за­ висимости расстояния d (у), Т) от величины Т, для вся­ кого вектора ()'е 5 существует такая величина Т (т]')<< < Т°, что

I У\'х |< d (Т)', Т (ц')).

Вследствие непрерывности зависимости расстояния d (ц, Т) от аргумента ц, у точки ц' существует такая

134

ЗАДАЧИ БЫСТРОДЕЙСТВИЯ

[ГЛ. II

окрестность S (rj'), что для всех точек г[ SE S (г|') имеет мес­ то неравенство!

I цх |< d (ц, Т (Т]')).

Расстояние d (ц, Т) является неубывающей функцией величины Т, поэтому для всех точек ц ££ S (ц') и всех значений Т !> Т (ц') имеют место неравенства

[ цх І <

d (ц, Т).

(15.1)

Для всякой точки ц' ЕЕ S

найдется

величина Т (tj')

< Т° и окрестность S (p'), обладающие указанными выше свойствами. Сфера S компактна, поэтому из бесконечного числа окрестностей S (т)'), покрывающих сферу S, выде­ лим конечное число окрестностей S (%), . . S (тр), по­ крывающих эту сферу. Для каждой окрестности S {цк) существует свое значение Т (тіь)<^ Т° (к — 1, . . ., I). При этом для всех точек ц 6Е S k) имеют место неравен­

ства

(15,1) при всех Т !> Т (pfe). Введем

обозначение:

 

 

Г(1) =

max Т (щ).

 

 

 

 

 

 

Kfc<i

 

 

 

Легко

видеть, что

Т°. Следовательно,

для

всех

і] £

5

имеют место неравенства (15.1) при

Т =

Т^\

т. е.

I цх [ < d (р, Т^і).

Лемма доказана.

Из леммы 3 следует лемма 4.

Лемма 4. Точка х (0) принадлежит границе области достижимости Qs (Т°) (х (0) 6Е Г8 (Т0)).

Действительно, предположим, что х (0)

является внут­

ренней точкой области Qs (Т°). Тогда, в

соответствии с

леммой 3,

существует такое

значение

TW<C Т°, что

х (0) 6Е Qs (TM). Это, однако,

противоречит

определению

величины Т°

как нижней грани значений Т,

при которых

*(0) е= Qs (Т).

Вслучае, когда уравнение (3.1) имеет нулевой корень,

а система (2.2) является вполне управляемой, граница

Г4 (Т), в соответствии с теоремой 14.2, имеет при

Т

fn+s

м„

 

 

плоский участок P s (Т) размерности п — 1. Докажем лем­ му 5, относящуюся к этому случаю.

li ОГРАНИЧЕННЫЕ ПО ВЕЛИЧИНЕ И ИМПУЛЬСУ СИЛЫ 135

Лемма 5. Если точка х является внутренней для мно­

жества P s (Т°),

то существует

такое значение Т ^ < і Т°,

что

X

будет

внутренней

точкой

множества

P s (Г®).

Если

точка

х

является

внутренней

для

 

множества

P s (Т°),

то она,

в соответствии с теоремой 14.4,

удовлетво­

ряет

условиям

 

 

 

 

 

 

 

 

 

 

I цх \< id (г), Т°) при всех р ё

(S \

S (р °))\5

(—р°),

где

множество

(S \

S (т)°))\5

(—р°) — компактное под­

множество

сферы

S.

 

 

зависимость

расстояния

Используя

непрерывную

d (ц, Т)

от аргументов р,

Т и компактность

 

множества

(S \

S (р °))\5

(—р°), можно, точно так же как в лемме 3,

доказать

существование

такого

значения

 

 

Т°,

для

которого выполняются

неравенства

 

 

 

 

I г)х К

d (р, Г(1>)

при всех т)

ЕЕ (5 \

S (р °))\5

(—р°).

Отсюда

вытекает

утверждение

леммы. Отметим, что

в доказательстве

этой леммы существенную

роль играет

компактность

множества (S \

S (г|0)) \

S (—р°),

выте­

кающая из теоремы

14.4.

 

 

 

 

 

 

 

Из леммы 5 следует лемма 6.

то точка х (0) принад­

Лемма 6. Если х (0) ЕЕ P s (Т°),

лежит

границе множества

P s (Т°).

 

 

 

 

Действительно, если лемма 6 не верна, то, в соответ­

ствии с леммой 5, существует такое] значение

 

Г0,

что X (0) Er Qs (T(l))-

Это, однако, противоречит определе­

нию величины Т°.

 

 

 

 

 

 

 

 

Перейдем к доказательству теоремы единственности

оптимального

управления.

 

 

 

 

 

 

 

Теорема 15.2. Если начальное состояние х (0) системы (2.2) принадлежит области управляемости, то управ­ ление, приводящее систему в начало координат за мини­ мально возможное время Т°, является единственным.

Будем считать начальное

состояние х (0) таким, что

время

быстродействия для

него Т° ^> xn+s/M„.

Точка

X (0),

так же как и точка х (0), принадлежит границе

Г8 (Т°)

области Qs (Т°). Проведем через точку

х (0)

(из рассмотрения формулы (1.6) видно, почему здесь

появляется знак минус)

опорную гиперплоскость

П8 (р, Т°) множества Qs (Г°).

Управление us (т), которое

13В

ЗАДАЧИ БЫСТРОДЕЙСТВИЯ

ІГЛ. II

приводит систему (2.2) из состояния х (0) в начало ко­ ординат за время Т°, максимизирует, очевидно, интеграл (2.10), в который подставлены значение Т = Т° и вектор г), ортогональный плоскости П3 (rj, 710). Могут возникнуть два случая:

x}e~Azbs ф: const и vte~Mbs = const Ф 0.

В первом случае существует, как показано в § 5, единственное (с точностью до значений на множестве ме­ ры нуль) управление вида (5.12), максимизирующее ин­ теграл (2.10). Если матрица А не имеет нулевого собствен­ ного значения, то r\ë~A'tba ф const ни при каком векторе

г)

0, т.

е. всегда возникает первый случай.

 

Второй

случай может

возникнуть, если матрица А

имеет нулевое собственное

значение. В соответствии с тео­

ремой 14.2, граница Г8 (Т°) имеет при этом два плоских

участка.

Тождество цe~A'cbs ~ const Ф 0

означает, что

точка —X (0)

принадлежит

плоскому

участку P s (Т°).

В соответствии

с леммой 6, точка — х (0)

принадлежит

границе множества P s (Т°).

Эта точка,

в соответствии с

теоремой

14.3, является угловой точкой

границы области

Qs (Т°) и через нее можно провести такую опорную гипер­ плоскость П8 (г), Т°), для которой r\e~Mbs ф const. При этом векторе ц существует единственное управление, максимизирующее интеграл (2.10). При условии Т° ф xn+s/Msтеорема доказана. Если начальное состояние а: (0) таково, что Т° ф xn+s/Ms, т. е. ограничение (1.4) для этого начального состояния не играет роли, то область QS(T°) — строго выпуклое множество и доказательство единст­ венности оптимального управления не вызывает никаких

трудностей.

Из теоремы 15.2 следует, что оптимальное по време­ ни управление us (т, %0) для системы (2.2) описывается формулой (5.12). Эта формула дает возможность судить о структуре оптимального управления. В качестве допу­ стимых управлений при постановке задачи быстродей­ ствия были приняты измеримые функции времени. Однако оптимальное управление, как видно из выражения (5.12), представляет собой кусочно-непрерывную функцию, что является важным с прикладной точки зрения.

При наличии только ограничения (1.2) оптимальное управление принимает два значения — M s и M s. В отли-

1] ОГРАНИЧЕННЫЕ ПО ВЕЛИЧИНЕ И ИМПУЛЬСУ СИЛЫ 137

чие от этого, при наличии двух ограничений (1.2), (1.4) оптимальное управление (5.12) принимает три значения

M s, 0, Mg. Задача синтеза состоит в разбиении простран­ ства Х п+1 поверхностями переключения на области, в которых управление принимает соответствующие зна­ чения.

При наличии только ограничения (1.2) имеет место теорема А. А. Фельдбаума об п интервалах постоянства оптимального по быстродействию управления в системе (2.2) [7, 9, 47, 53]. Покажем, что при наличии ограниче­ ний (1.2) и (1.4) имеет место теорема о 2п интервалах по­ стоянства оптимального управления (п — порядок си­ стемы).

Теорема 15.3. Если все собственные значения матри­ цы А действительны, то оптимальное управление us (т) в системе (2.2) при всех начальных условиях имеет не бо­

лее п интервалов, на которых

| us (т) | = M s, и не более п

интервалов, на которых us (т)

= 0. Следовательно, управ­

ление us (т) имеет не более 2п интервалов постоянства.

Для любого начального состояния х (0) существует такая опорная гиперплоскость П„ (ц, Т°), проходящая

через точку

х (0),

что

cp (х) =

x\e~ATbs ф

const.

При

этом функция

I ер (т)

I имеет на

отрезке

[0, Т°\

конечное

число I локальных максимумов.

 

 

 

 

 

 

 

Из выражения (5.12) видно, что число интервалов, на

которых

I us (х, %,) I

== M s, равно

числу

интервалов,

составляющих

множество

Еа (Т°, %0).

Число

интервалов

множества Еа (Ти, %0) не превосходит I.

Т°

есть

нулей

Пусть

O ^ X j^ г2<

. . . <

Xfe^

функции ф (т). Обозначим через m число точек на отрезке [0, Г0], в которых равна нулю производная ф' (х). Если все собственные значения матрицы А действительны, то

k гёС п — І и т ^ и

— 1 [9]. Локальные максимумы функ­

ции I ф (х)

I могут быть в точках, где ф' (х)

=

 

0, а также

в точках

X

= 0, X =

Т°.

Следовательно,

I

 

m +

2 ^

+

1.

Докажем теперь,

что I

п.

 

|

имеет место

Предположим, что для функции Jф (х)

равенство

I = п Д-

1.

Тогда функция

| ф (г)

|

имеет

ло­

кальные

максимумы

в

m = п — 1

точках

интервала

(0, Т°)

и в двух точках х = 0, х =

Т°\ при этом

0

и Tfe<

Т°.

Функция

I ф (х) I в этом случае

не имеет на

отрезке

[0, Г°] локальных минимумов, за

исключением

138

ЗАДАЧИ БЫСТРОДЕЙСТВИЯ

 

[ГЛ.II

точек тІ7 . .

t k.

На интервалах

(0,

Ty)1( t h,

Т°) нет ло­

кальных максимумов, потому что

в

противном случае

на этих интервалах были бы

локальные

минимумы.

По той же

причине на каждом из к — 1

интервалов

(хІ5 т2), . .

("ifc-i,

"ffe) может быть только один максимум.

Тогда получается,

что пг к — 1

 

га — 2,

а

это про­

тиворечит равенству m — п — 1.

Итак, 1 ^

п, и первая

часть теоремы доказана.

 

 

 

 

Г функ­

Если I =

га, то либо при т = 0 либо при т =

ция I ф (т) I

достигает локального

максимума

(см., на­

пример, рис. 1(3.1—16.3). При этом множество Gs (Т°, %0), на котором иа (т, %о) = 0, состоит не более, чем из га отрезков. В случае К п это утверждение тем более спра­ ведливо. Теорема доказана.

Рассмотрим, например, уравнение первого порядка

Х у = — Х у + и.

Нетрудно показать, что для достаточно удаленных от нуля точек Х у (0) оптимальное управление имеет ровно

два интервала постоянства. Что касается, например, си­ стемы второго порядка (16.2), рассматриваемой в § 16, то для нее при всех начальных условиях число интервалов постоянства не превосходит трех.

При наличии только ограничения (1.2) дело обстоит иначе. Для любой вполне управляемой системы (2.2) с действительными собственными значениями существуют начальные состояния, при которых оптимальное управ­ ление имеет ровно п интервалов постоянства [53]. Следо­ вательно, между теоремой об п интервалах в случае ограничения (1.2) и теоремой о 2п интервалах в случае ограничений (1.2), (1.4) нет полной аналогии.

Перейдем теперь к вопросу о построении оптимального управления для системы (1.1). Будем предполагать, что система вполне управляема (р = п). Теорема единствен­ ности оптимального управления для этой системы не имеет места как при наличии ограничений (1.2), (1.4), так и при наличии только ограничения (1.2). В системе (8.20) при начальных условиях хг (0) = х3, х2 (0) = 0, например, оптимальное по времени управление не явля­ ется единственным.

Пусть X (0) — начальное

состояние системы

(1.1),

Т° — соответствующее время

быстродействия.

Будем

1] ОГРАНИЧЕННЫЕ ПО ВЕЛИЧИНЕ И ИМПУЛЬСУ СИЛЫ Ш

предполагать, что

В противном случае ограничение (1.4) не явлется

суще­

ственным при начальном состоянии х (0).

 

 

Для системы (1.1) имеют место леммы 1—4, поэтому

— X (0)

GE Г (Т°) ( Т°) — граница области Q (Тп)).

Про­

ведем

через

точку

х (0)

опорную

гиперплоскость

П (%,

Т°)

множества

Q (Т°).

Управляющие функции

us (т)

(s =

1,

. . г),

которые

приводят

систему

(1.1)

в начало координат из состояния х (0) за время Т°, мак­

симизируют, очевидно,

интегралы

(2.10)

(s

=

1, . . ., г),

в которые подставлены

значение

Т =

Т°

и

вектор r^,

ортогональный построенной плоскости П (т^, Т°). Могут возникнуть два следующих случая.

1.Существует хотя бы одно значение индекса s, при котором максимизирующее управление us (т) определяется однозначно.

2.При всех значениях s = 1, . . ., г максимизирующее управление однозначно не определяется.

Рассмотрим сначала второй случай. Искомые управ­ ляющие функции максимизируют интегралы (2.10), од­ нако не всякая максимизирующая функция (если таковых более, чем одна) является искомой. Второй случай может возникнуть только тогда, когда матрица А имеет нуле­ вое собственное значение. При этом вектор цх является решением системы (14.19); для него имеют место усло­

вия

(14.2)

при s = 1, . . ., г<!>

и

условия (14.3)

при

s =

С1) + 1,

. . ., г.

Величина

гО)

удовлетворяет

нера­

венствам 0

гМ

г, поскольку система (1.1), по пред­

положению,

вполне

управляема (р = п). Время быстро­

действия удовлетворяет неравенству Т° Гг(1), где TrW определяется формулой (14.21). Граница Г (Г°) имеет

плоский

участок

Р (Т°),

принадлежащий построенной

плоскости П (т)15 Т°) =

И (г|х), которая описывается урав­

нением

вида (14.22).

Точка

х (0) принадлежит этому

плоскому участку

(—х (0) G

Р (У0)).

Пусть множество Р (Т°) принадлежит многообразию

размерности R, тогда, в соответствии с теоремой 14.5,

можно

построить

такие

линейно независимые векторы

г)* =

1, . . ., га — В),

что

опорные гиперплоскости

І40

ЗАДАЧИ БЫСТРОДЕЙСТВИЯ

 

ІГЛ. II

П (t)ä,

I 0) — П (г}/,) содержат множество Р (Т°)

и, сле­

довательно, точку — X (0). Для каждого из

векторов %.

может представиться либо первый случай, либо

второй.

Предположим, что для всех векторов r\h (к =

1, . . ., пВ)

имеет место второй случай.

Можно показать, что для множества Р (Т°) имеют ме­ сто леммы 5 и 6. Доказываются эти леммы так же, как и для множества P s (Т°). Тогда точка —х (0) принадлежит

границе множества Р (Т°) на

многообразии размерно­

сти R.

В

соответствии

с теоремой 14.5, можно выбрать

такой

вектор

Цп-н+і,

что

опорная

гиперплоскость

П СПп-я+і,

Т°)

содержит точку —х (0),

при этом

все

векторы r\h (к =

і, . .

п R

+ 1 )

будут линейно

не­

зависимы.

Для этого нового вектора

Цп-н+і может пред­

ставиться первый либо второй случай. Предположим, что для него имеет место второй случай. Тогда точка —х (0) принадлежит множеству, лежащему на многообразии размерности R — 1, и, в соответствии с леммой 6, при­ надлежит границе этого множества. В соответствии с тео­

ремой

14.5, можно

выбрать такой вектор т]п-я+2і

что

— X (0)

е

П (г|п-к+2 ,

Т°) и

все векторы т)й = 1, . . .

. . ., п

R + 2 ) линейно

независимы. Продолжая

опи­

санные выше рассуждения дальше и предполагая, что каждый раз после построения нового линейно независи­

мого вектора r\k имеет место

второй случай, приходим

к следующей ситуации.

независимых векторов r)fe

Существуют п линейно

= 1, . . ., п), для каждого из которых имеют место соотношения

T)fte-AT5S=

0

 

при

.9 = 1 , . . . ,

г{к),

(15.2)

r\ke~Mbs = з(Р ф 0

 

при

s =

г{к) + 1,

. . ., г.

(15.3)

При этом

 

 

 

 

 

 

 

та>

тт00

=

тах

(“І Г 1)

 

(15-4)

при всех к = 1, .

. ., п.

 

 

 

 

 

Покажем, что подобной ситуации быть не может.

1, . . .

Столбцы bs Ф 0 (s =

1, . . ., г), векторы

=

. . ., п) линейно независимы, поэтому для всякого зна­ чения индекса s найдется такой вектор что г)hbs Ф 0

Соседние файлы в папке книги из ГПНТБ