Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Осипов В.М. Математические основы кибернетики. Начала вариационного исчисления и элементы теории оптимального управления учеб. пособие

.pdf
Скачиваний:
9
Добавлен:
23.10.2023
Размер:
3.76 Mб
Скачать

- 46

-

с

- Р

Йиея а виду, что hy = -щт

- ~

t получим

Эта системе и называется канонической системой уравнений Эйле­ ра рассматриваемого функционала J F (x, у , у 'jck.

•г.

Легко получить каноническую систему *для функционалов более общего вида

Для такого функционала имеем систему уравнений Эйлера

(

2

п ) .

Если ввести канонические переменные

по формулам

 

тоt повторяя, по существу, те не выкладки,получим каноническую

систему из

£п -

уравнений

 

 

ауГ

Ух

'

àfx

.( i = I , 2 . . . Л )

Возникает вопрос; что дают нового канонические переменные? Окавывается, что они обладают рядом практически полезных свойств и имеют большое теоретическое значение. Так, напри­ мер, Ранее мы нашли основную формулу для вариации функциона­ ле при переходе от экстремали к близкой кривой у ^ с о сво­ бодными концами

В «адонических переменных это выражние.получает

весьма прос­

той вид

^

, .

Далее для экстремалей с изломом мы имеем следующее условие

-50 -

матсш-тическуд формулировку задачи об оптимальном управлении объектом. Прежде чем рассматривать эти задачи, нам необходимо остановиться ка способах математического описания управляемых объектов, т.е.,как говорят, на математической модели объекта. Рассмотрим простой пример. Предположим, что автомобиль совер­ шает прямолинейное движение. В каждый момент времени состояние автомобиля как объекта (управляемого) можно характеризовать пройденным расстоянием (от какой-то начальной точки) и ско­ ростью движения ( т . е . д : и 2^=х). Эти два величины меняются с течением времени, но не самопроизвольно, а сообразно воле во­ дителя, который по своему желанию управляет работой дья^-геля, увеличивая или уменьшая его силу тяги F . Имеем, таклм обра­

зом,

3 связанных

между собой величины х ,

1? ,

F .

(Рис.І)

 

 

 

 

 

 

 

 

 

Величина х

,

,

характеризую-

р

 

 

 

 

 

 

5

 

щие состояние

автомобиля,

назы-

 

 

*"

 

 

 

 

*

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ваются дшрв.ыми

координатами,

а

 

 

 

 

 

 

 

 

 

величину F

называют

управляю-

 

 

 

Рис.І

 

 

 

 

щим параметром.

 

 

 

Если рассматривать движение автомобиля на

плоскости, а не по

прямой, то фазовых координат будет 4 (две "географических"

координаты X ,

у,

 

и две

компоненты

скорости х

z z£.

и у -

).

Управляющих параметра

будет 2

(сила

тяги

F

и угол

поворота

руля ві

).

У летящего

самолета

фазовых координат

будет 6

( х ,

у.

,

X

, 2£

,

,

 

) и несколько управляющих параметров

(сила тяги, положение руля высоты, направления).

 

 

Рассмотренные

примеры

позволяют сделать

следующее

обобщение.

Состояние объекта задается в каждый момент времени

П величина

ми х<,

хг

,

хп

,

которые называются

фазовыми координатами

объекта,

движение

объекта

заключается в том

Со математической •

 

 

 

 

 

 

 

 

- 51

-

 

 

 

 

 

 

 

точки зрения)0 что его состояние

о течением времени меняется

 

ave.

ssf

, sCg „ . . о

jr ß язляются

переменными величинами

(функциями

jap-екбзи). Движение объекта щюиоходит не самопроизвольно, им

 

моаао заправлять0 для этого объект' снабжен своеобразными

"руля­

ми", аоложение которых в жаждав момент времени характеризуется

m

зеякчжкамк U, ., i/s

 

, , 3

Um ,

называемыми управляющими

 

HajgbfôTgaMB.

"рулями" можно

"манипулировать" т . е . по своему

 

дейазию менять £s допустишк

пределах) управляющие параметры

 

ц

г

£ / s

о , »

 

 

 

 

другими словами, по своему желанию

зиСнрагд

фуккцшіі

 

 

 

,

Us(éj

 

.Un/éJ.

Естественно,

выб­

рав

уЕравлишзде фунац&да s

зная состояние

объекта в начальный

 

жасеяг зраменЕ

 

£0

 

ш можем однозначно раечитать

поведе­

ние

oöseasa для всех

i

 

 

,

î , e . можем кайти

 

«

 

,

- о .

Яп{&)° Щ>й.ътегяя?. объект,

о котором идет речь

обычно

изо­

 

 

 

 

 

 

 

 

 

 

бражают так, как это показано

 

 

 

 

 

 

 

 

 

 

 

на чертеже (Рис. 2 ) . .Иногда,

 

 

 

 

 

 

 

 

 

 

 

управляющие параметра

С/,

...и^

 

 

 

 

 

 

 

 

 

 

аазнвают

входными величинами,

 

 

 

 

 

 

 

 

 

 

 

а фазовые координаты

xf

..« осп -

 

 

 

Рис .2

 

 

 

-

выходнымио Удобно управляющие па-

pajässpK

&t

« о .

и,?? раосмаярввать как координаты

некоторого

вектора

(зектор-ёснкшк)

 

 

 

 

 

 

 

 

 

 

 

Us

(UvcUg,-.. Um)

U(éJ

 

 

 

 

 

который шанзав»

gspaBjgHHeMo

Точно также величины

 

 

...

зс„

удобно рассматривать

как координаты

/7 -мерного вектора

(век-

 

 

 

X

я х(і/«

 

(х,,

 

xs,

...

Я л / ,

 

 

 

 

т . е . жак точку

л

-мерного

пространства

с координатами

 

г хг

.. о .iÇ, „ Эту точку

обычно называют

фазовым состоянием

объекта,

а

о -мерное

эвклидово

пространство, з котором в виде

точек

 

- 52 -

изображается фазовые состояния объекта,, называют фазовым крострянством. Вектор - функцию обычно называют фаз^вш^воктоіюм..

В частном случае,

когда фазовое состояние

объекта определяется

 

 

 

 

 

 

только

.двумя фазовыми координа­

 

 

 

 

 

 

тами, будем иметь фазовую плос­

 

 

 

 

 

 

кость. Изменение фазовых коорди­

 

 

 

 

 

 

нат во времени определяет некото-

о

 

 

 

 

 

рую линию, которую прочертит зѳк-

 

Рнс.з

 

 

 

тор своим концом при изменении

его координат. Эта линия называется базовой граектор,?:-... При

/7 = 2 это плоская кривая, которую легко построить. Точка

x(t,J-

•яг, есть

начальное фазовое состояние. В векторных

обозначе­

ниях,

которые мы ввели,

объект

может

быть условно

изображен бо­

 

 

 

 

 

 

лее просто

Рис.

4

. Связь меж-

 

I

 

 

 

 

ду вектором

управления.

 

и фа­

 

 

 

 

 

зовым вектором как

правило

виража-

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

р с 4

 

 

 

ется в виде дифференциального урав­

нения. Рассмотрим

простой пример.

 

 

 

 

 

 

 

 

Пусть

некоторое

тело,

снабженное двигателем

(тот

же автомобиль).

 

 

 

 

 

 

совершает

прямолинейно; движение.

 

 

 

^

 

а,

Масса

этого тела

равна

m

. Рас-

 

 

t—,J

" С Т 0 І П ш е >

пройденное

телом к мо-

\

х *

 

 

 

 

менту времени

t

.отсчитывать

 

р и

с >

5

 

 

будем от

некоторой

начальной точ­

ки, и обозначать

х,

. Производная ягг представляет собой

ско-

рость движения тела. Будем предполагать, что на тело действуют

две внешние силы;

сила

трения

~ bxf

и

сила

упругости

-- кос .

Тело движется под действием силы тяги і/г

развиваемой

двигате­

лем. По второму закону Ньютона движение описывается дифферен­ циальным уравнением

- 53 -

тх,

bec, -f кос

= иг

 

 

 

Обозначим Xr

= Ä J , тогда

получил» два уравнения

 

 

Здесь xf

и

хе есть фазовые координаты

объекте, a

U - уп­

равляющий параметр, т . е . мы имеем объект

с одним входом и дву­

мя выходами. Введем вектор управления U = ( 0

я)

и фа­

 

 

 

зовый вектор

X = (

Xf , х2 ) ,

t«- тогда связь между ними запишется

£*

!в виде

или более компактно

 

 

•j^f-s Ах*

BU .

(I)

 

В более общем случае,

когда, фазовый вектор Ä имеат размер­

ность

п

,' а объект оішоываѳтоя системой линейных

уравнений,

связь между входом я выходом также устанавливается

уравнением

( I ) . Матрицы А % В

в

етом случае

будут иметь размерность

Пип.

В самом общей случае

вакоя. движения объекта

описыва­

ется евстемоИ

нелинейных дифференциальных уравнений вида

 

•x\

(*<••••

**;

и,,--

Um) ;

 

где ^ , / , ß„ - некоторые.функции фазовых координат и управляющих-параметров, определяемые внутренним'устройством объекта. В векторной форме систему условно можно записать так

X J/ее. UJ

(2)

 

 

 

 

- 54 -

 

 

 

 

 

 

Уравнение (I) есть частный случай уравнения (2).

Уравнение

( I )

получим когда

/(х,и)

станет

линейной функцией

sc и

U

т . е .

/fx,uj-

dsc + &и зная управляющие функции

и,ft),

••• Umlt)

 

для i

>te мы можем однозначно

определить движение объекта.!, ре ­

шая уравнение

(2) при заданном начальном фазовом

состоянии

 

 

- х".

В случае фазовой плоскости

( п = 2 ) мы можем

 

изобразить

р'шяше

объекта в виде фазовой траектории.

(Рис.?)

 

 

 

 

 

Пусть для некоторого

управления

 

 

 

 

мы определили фазовую траекторию с

 

 

 

 

помощью уравнения (2).

Если мы из -

&меним управление (сохранив го se

 

начальное, состояние), то получим

другую траекторию, исходящую из той же точки

,

причем по

этой новой траектории мы можем попаоть Б состояние

Je' , что.

и раньше,

когда мы двигались по траекторий .1/

но можем и не

попасть.

Вновь изменим управление , получим новую траекторию

и т.д* Таким обраэом, рассматривая различные управления, ш получим различные траектория, Исходящие из точки л* „ Зтор ко­ нечно, не противрречет геореме.о существовании и единственно­ сти ршенші уравнения (2) .

• . Допустимые" управдевдд

Обычно уіпрааляющие параметры не могут прини— мать произвольных значений«а подчинены'яокоторыы ограннчеаН" ям в соответствии с различным смыслом задачи. Так, например,

в случае рассмотренного'нами; объекта

естЕственно предполо­

жить, что тяга двигателя

не может быть сколь угодно боль­

шой, а подчинена ограничениям вида

 

 

 

-

55 -

 

 

 

4L * и £ f

 

 

 

где

Ы. и ß

некоторые постоянные. В частности, может быть

аі'-итвл

 

ß ' L / m a

a

e .

„тогда

- и т

а я $U4Un,a*

ИЛИ

/L//SUmJX

,

чио

означает,

чтс

двигатель

может развивать силу, не превышаю­

щую по абсолютной

величине

некоторую максимальную. Аналогично

дело

обстоит

я для других

объектов. Таким образом, управляю­

щие параметры могут быть аодчкнеяи ограничениям вида неравенств

dt&UiSß*

 

 

-^SUiSjt,

 

......

 

с<т

*Um6fm

Если управляющих

параметра два ограничения в плоскости пара-

 

i U

l

 

 

 

метров

предсга'вляются в виде

У/

 

 

 

 

 

прямоугольника. Этот прямоуголь­

'

/ /

А

 

 

ник будет

областью

управления.

'•{

и,

 

.'

 

 

 

Область

управления

есть множест­

1 /

 

 

 

 

1 /

, ////>

 

 

во точек

гп -мерного пространства,

 

 

 

h

 

 

 

 

Рис.8

 

 

условиях. При гп ~ 3 получим 3

удовлетворяющих определенным

 

мерный параллепилед з качестве области управления. д>.ч произ­

вольного m будем иметь область управления в виде

m -мерного

зараллепипеда. Область управления не обязательно

должна иметь

зэд вараллепипеда; она может иметь более сложный геометричес­

кий характер. Аналитически это выражается ограничениями вида

У-(u,t...(Jm!$0

 

-«/В частности, может быть ограничение в

виде интеграла j

р(х,ц)а'і$

 

/

Задание

области

управления вхо­

 

 

 

 

 

 

дит в математическое описание уп­

 

 

 

 

 

 

равляемого объекта. Подчеркнем

 

 

 

 

 

 

одно важное обстоятельство о ха­

 

 

 

 

 

 

рактере

управляющих функции. Бу-

Рис

- 5 6 -

Лем предполагать, что они могут относится к классу кусочно-не- прернвных, т . е . наряду с непрерывными управлениями ми будем рас­ сматривать и кусочно-непрерывные.. Последнее означает^ "что "рули4'' являются безинерционными и мы можем их мгновенно перебрасывать из одного положения в другое. В действительности всякий реаль­ ный процесс обладает инерционностью, однако в любой реальной задаче можно ввести также величины, которые могли бы играть роль управляющг.. параметров и в тоже время , с той или иной етепзвью точности, 1 )гли бы считаться безішерцвонныш*

Так, например, пусть ot - угол поворота руля (самолета mm ко­ рабля). Если принять эту величину sa управляющий яараметр,, тс

мы не можем считать её безинвріщоннойл диаграмма работк руяя[рис]

имеет вид. Требуется некоторое

врэш 4 t , чтоба повернуть

руль

 

из нейтрального аолокения

до

it

d-maœ . Если se- в качестве уп- "

равлящэго параметра ваять

око-

J.--U

рость угла соворота d-U,

тс

 

t

пооледнэи) можно с большой

точ-

Рис.10

 

 

ностью считать безинерционной величиной, т . е . способной мгновен­ но переключаться с одного значения на другое . (Рис.10 Итак, управляющие функции могут относиться к классу кусочно-не­

прерывных,

Дадим определение.

 

ш

Допустимым управлением назы­

 

вается всякая кусочне-ненрерывная

 

функция

и(і)ъъ значениями в

 

области

управления. ( Р и с . I I )

Р и с . I I

- 5? -

Отметим, что ограничения подобно рассмотренным могут накла­ дываться не только на управления, но и на фазовые координаты. Например, скорость движения автомобиля или самолета (корабля) не моаея превышать некоторую допустимую величину. При управле-

ння выводшкосмичѳского корабля (или спутника) на какую-то траек­ торию полета необходимо заботиться о том, чтобы перегрузка на космонавтов s приборы не превышала допустимую, а это значит, что ускорение не должно превышать определенный уровень.

Учет ограничений на управление и фазовые координаты вносит реаль­ ный смысл в различные задачи управления, что тлеет существенное значение. Более тоге, чаото оказывается„ что неучет ограничений даааег задачу об оптимальном управлении бессодержательной, ли­ шенной реального омыола.

- 62 -

Для того чтобы сделать этс, необходимо сформулировать цель уп­ равления, т . е . мы должны четко и объективно сформулировать чего мы хотим получить от нашего устройства.

Такой объективной характеристикой может служить некоторый функ­ ционал, выражающий меру отклонения переходного процесса от нуля (т;е . от установившегося режима):

%

-- J

F (х,

. . . / ? , ;

і

и,....

U„)eft

при следующе-: граничных условиях:

 

 

Xi(o) = xf

; « ^ о Д я Д - . . . .

x„(oJ* x%

И Х,&)'0 - г ,„ .. Х п М*0^

U,lo)-U*

i

 

' Umio)-Un

к U,(»)-- 0, . . . . Um(<e>)*0 .

Граничные условия

означают, что возникшее г моментt> 0отклонение

в результате переходного процеооа станет равным нулю, В терминах

теории управления это значит, что объект из начального фазового

состояния

х"

переводится в начало координат фазового

прост­

ранства.

 

 

 

 

 

Мы ухе отметили, что функционал У,

выражает меру отклонения

Переходного процесса от нуля. Чем меньше этот функционал» тем

лучше переходный процесс, поэтому мы должны вайти такой вакрн

управления

U(x, xj* U , ноторыА бы миннмиаировал

функционал

У/ и переводил

Он наш объект из проиввольного фабового

состоя­

ния х" в начало координат. Заметим, что функционал й{

называ­

ется оитиьшэирущим функционалом. Теперь мы можем

математически

сформулировать нашу задачу. Найти закон регулирования (закон уп­ равления) Lt-UfaxJ, принадлежащий области допустимых управлений и минимизирующий функционал

при граничных условиях

Соседние файлы в папке книги из ГПНТБ