Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Осипов В.М. Математические основы кибернетики. Начала вариационного исчисления и элементы теории оптимального управления учеб. пособие

.pdf
Скачиваний:
9
Добавлен:
23.10.2023
Размер:
3.76 Mб
Скачать

 

- 9 3 -

Режеш* дня

assess звд

Vi* С,

Составляем ramussTOsesaH

Мшсзхст $унхцвя

достигается при

 

= umScan

4<i

- Um

Sign /с, »Рі^ CiePci

)

Это H acïïb искомый алгоритм

управления.

 

Зосле окожчаиня

управления

U

' должно

быть равно Щт~

Зосздянше

С,,

н

доляжы быть подобраны так, чтобы в

момент t • Т объект оказался в

аоложешш s ' „

Яродасс з/нраздгшя МОЕНО иллюстрировать следующими дкаграм- шиш, (Рис.17)

Рис.17 Переходный процесс при Оптимальное управление

подаче на вход и~ —

ЕСЛИ объект описывается дифференциальным уравнением

-94 -

••силу зздишюв ѵкстеми дифференциальны:-, уривѵыыи.

i-.-rp порядка с постоянными коэффициентами, то определе­ ние оптимального алгоритма управления производится совершен-

 

~~й "

 

 

 

 

>

 

-/•77. ~ Z- "g"C. '

, J r -

J"<-

•-'

W

но аналогично. Имеет место следующая'теорема od " п " ш -

 

тервалах',квпервыедоказанная Фельд^аумом.^тт- 1

•'

і. _.- .•,

 

>Вс^-'Ьоьбкт''СШс1вве9ёй''линейв1н дифф^енциалыши.1?:-

м ѵ •

уравнением - ff -го порядка

с постоянными коэффициентами и

 

корни4, его' характеристического" уравнения вещественные

отри-

,

цательные"или нулевые, то оптимальное управление будет со-

 

держать'не

более" ^И;іійтерваайв;-Ше*оансет«^йака, в-кото-

 

рых оно принимает граничное^

 

 

 

знака Л.<.ѴИ.-Й.Н

за период " у п р а в л е н и я ' н е й р е в ы Ш а е т . и о з ь

 

а

 

Пусть

объеіст' ^бписываетсяЧ-диіфе#ёвдиалввым

уравнением •«.." •

с

пдстояшшми'каэффип^ен^амИ'01^1'-" іФ-порядкать

ііолунаалезіо-

ликлі-.

 

- : ^ т е ш y n p ^ B h ^ c

 

 

 

 

=

 

 

 

 

Ые- +

 

cfn.,

 

+ ...

+ с/,

+

a>öX

KU

 

 

 

 

 

 

 

oit

 

 

 

 

 

 

Рассмотрим задачу о максимальном быстродействии, г . е .

эа -

 

дачу о

переводе

объекта

из

состояния х

в

х

за

мини­

 

мальное

время. На

единственный управляющий

параметр

нало­

 

жено ограничение Juf

é Umax

 

 

 

 

 

 

 

Запишем уравнение объекта в форме системы

( х-х,

)

 

 

 

X,

 

=

Xj

 

 

 

 

 

 

 

 

 

 

 

sc„ = - aâ/7-/ х„

а , х :

- сУаХ,

*

KU

 

 

 

 

 

 

 

 

 

 

 

Или в векторной

форме

 

 

 

 

 

 

 

 

 

 

X

=Лх

t

ѣи ,

 

 

 

 

 

 

 

где

О

{

0

о

 

О

 

 

 

 

 

 

 

 

 

 

Ь = (о,о,

 

 

 

 

а

о

1

о

 

О

 

 

 

 

 

 

 

 

 

 

 

 

-а. -а/, -с/г

Вздем иредаш&гать,, что собсквешше числа матрицы

А

т . е . кор-

ш яараетвркстичіеского

уравиешвд объекта

-

вещественные

отри-

Ярвшшш для

оаредедекня зектор-^ункцик

Ч> - ( % , % , ... Ѵл )

где

-

транспонированная матрица

(поэтому

V,-

-

называются сооряхеЕНши

яеременкши).

 

 

 

Коли собственные

числа

матрицы

А - вещественные,

то будут

 

 

 

 

 

 

„1-

 

 

 

звщэствешшш s

собственные числа матрицы

- Я І

пусть они

а д а

 

Рп

, тогда общее решение для

f- (é J

зашшеуся так

 

 

 

 

 

 

 

 

 

С о с т в ш шшльтониан

Условием шксимума гамильтонигда с учетом ограничения будет

LU Umex $ig„ (%*>/ = ^внмг Sign К +п =

VÇ,

S . K ,

 

 

 

 

 

 

 

 

 

fft

 

fr

 

Pot

у- _

/>*<!

 

%(ij-.C,e

2е'+...

+ с„е

= I , *

 

йоввдму оптимальное управление определится формулой

 

^

= и„ож

Sign {LCKe

J

 

 

 

MssecTHo, что сумма

п

экспонент

с вещественными

показате-

дшкзн саэает

шагь не более

/ 7 - /

корней. Следовательно, число

ян?ерзадов

постоянства

знака

U(t)

будет

не более

п .

именно это и утверждается в

теореме.

Точки

переключения знака

есть,, очевидно, нули H^n(tj.

2.Порядок решения обшей задачи р ущі^дтщщ

быстродействии для линейного объекта.

Рассмотрим нередок решения вадачн о максшвшьмои бисвродействии в с. эдующей более общей постановке» Задан объект. описываемый системой жкейшк даетежнйі

или а векторной форме

 

 

 

 

 

 

и

S

- взатрмцы пхп

 

 

 

X. = (х,,

scis...

x „ J

_ фазовый вектор Ù^iu1tU,,...Un)

-

вектор

управления..

 

 

 

 

 

 

Оба вектора есягь фунвди ареиешо

US и- будем ечвдаяь,, адо

 

Un-

мерный

паранлеяекйнед,,

 

 

Требуется

к а й я •паразленаэ

U

.

9 кагоров он иереаоди©

объект

из СОСТОЯНИЯ

X(Oh

Xе

з другое соогояшѳ,,

довдшар,

в

аачадо «хгадина?

x(Tj*Q

 

за шшмаяьйое

вреда.

 

Из рассиотрекннх ранее арьиеров и раосувдешй

ййедаеЯц «га©

эта задача разоивавѵоя на несколько ошоскоягельЕгк щадач»

 

Задача I .

йайтга решекае

 

оопрязекногс уравдеаая

при произвольном начальном условии

V(oJ «

-,

 

Эта 5>.'дачг в оркнцише корсшо изученао Если HSBecsnœ

зорт

характеристячасггагз

уравнения

(собственные числа

) ,

тс

(для различных .корней)

 

 

 

 

 

- УѴ -

где

~ некоторые векторы.

 

 

 

Существуют и радличные"метода приближенного решения этой

. •

.п-...,э.- .

 

 

 

вадачн.

 

 

 

 

' " И с п о

л ь з у я

принцип максимума^найти

управление

для

аайдешого' нетривиального 'решения

-? .'-

 

Для решения этой задачи

составляется

гамильтониан

 

 

•V,"-, Atoo...

. . . . . .

. _ . - н ' . . .

 

 

и определяется

из условия максимума .

 

 

Шerse Й

- ГПах

£<!/У

 

 

Найденное' упра^енйеЧІЬ^ет"едннс^

4 1

" ш

Заеоь следует 'ааметжтьf°4TO "граничное"'"усайаие' Vffî >&•>'' будет

 

 

 

задачи выполняться всегда,

 

 

 

 

 

 

[.

Зная''упракаеятв'1'^/,,^ йаЛйг соответстзуюипло

траекторию

x{tj

, исходящую ss заданной начальной сочки

 

,

 

удоздвСБсряи

-^едузвцему уровцеілю*

 

п

 

 

 

 

 

 

 

 

 

 

 

 

"~ Этаг задачасэодиасяJE решений

даЦдоетрального уравнения объек-

' та при оятамааьаом зшраасенни„

Эта классическая задача. Ре-

rjt

.-• • at.-

г-.

О,

rjm;

 

. .-.-ѴѴЧІІ"' '-.„г.

 

 

 

шать её

ш умеем. Однако здесь* иы сталкиваемся со следующим

u;j>.?.sHi№ уелеоа 4-- мзте/

^ЯІІѴКОВО .< іі.алхсу устойчивое-.. І - О З -

лршцашвад&нш обстоятельствок„

 

 

 

 

 

g^eascrc

^аижекия

агасеіо

объекта

л A :

•.-ііи.еяяьі

ид;«л:эльпь •

Управление

^/с/гашскт

от начальных условии

г

, сЛёдова-

талы ) определенная фазовая траектория xitj

будет

зависеть

В лачгсл'ф: (вуккшіЕ. .Іяг.уноза

эс-ььмеи вы ^г.-шс

 

 

от

г;*-

. Вели мы наудачу выбрали

Y

» то у нас мало шан-

ъ

. ''

X

. з?г.. и.

 

ит ; dt

- V ' - ^ r .

-^tf',''

 

сов надеяться яа те, что полученная траектория Л"/с/попадет в

По наяалт; кс%дшшо.{нух4оег конечноеІ еостоявие^. Для разныхл f '

Аожаѵельно

определена. и>стаэи7. золну» Зіоизаод;о*

ар&меьь

 

 

 

 

 

 

-

98

-

 

 

 

 

 

 

 

 

 

 

 

будут получаться разные траектории выходящие из точки

•2Г'3

(Вие.І8)

 

іісли удастся

найти именно

такое

начальное

значение

f"

,

при

 

 

 

 

 

 

 

 

 

 

котором фазовая

траектория

 

 

 

 

•'се

 

 

 

 

проходит

через

начало

коор-

 

 

 

 

 

 

 

 

динат,

то такая

траектория

J 4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

л:

 

 

 

 

 

 

 

Ci

: и,:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4/у}

 

 

 

 

с. и соответствующее управле-

ФУ-

 

Ді-

зе

 

кие и. ^Убудут

оптимальны­

 

7

/

 

 

 

ми. Ш приходим, таким об-

 

 

 

Рис.18

 

 

 

 

 

^разом,

к следующей и послед­

 

 

 

 

 

 

 

 

ней задаче.

 

 

 

 

 

Задача

1У. ЙЬЙТІІ начальное

 

 

 

 

 

 

значение " у>'

,

при котором

 

соответствующая траектория

 

x(i'J

,

 

 

 

 

 

исходшцая"из

заданной

 

'точки'

X

/"приходит

в- іШчало" координат."

 

 

 

 

 

 

1

Оптимальная

траектория

существует/и

она единственна,

 

 

поэтому

существует единственное

значение

І"

 

. Это следует из

 

теоремы о "существовании

и единственности

решения дифференциаль­

 

ного уравнения.

Точное

решение

этой

задачи

 

в общем

случае

Чі-:- .ц;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

нсвозмадк). Существуют

 

приближенные

Способы,

 

которые

могут

й Т І

бцть ас^лйзонаіш

не ЭЦВМ. Идея - приодижнного,..решения

состоит

урай;6»даии«««

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Оад«ыгсяфооазвольнык

значением

 

f "

, затем ого определенным

 

сиэбобом: улучиіййт, TLK чтобы

"улучшенная"'траектория

ближе

*'

ііо.л;'о.д;Ло„к

пілхлу координьт. Зьтш'п-юцесс

 

"улучшения" пов-

 

торяит

до-.тех nay, пок^ пи приблизятся'к

требуемому начально-

 

му значению. В розудьтате-.р'ейения

всех этих

задач мы получаем

 

онтймальноь

упѵюадениь^і/ (tj

кик функцию времени с для оп-

'ЛйЬЛиПШХ CiKKCKOtei-WaUX ІіііЧ&ЛЫШХ и конечных условий.

Іш э:'оі. ой:!иьо_[!/:о2&т быті создано программное управляющее

- 99 -

усяройотвор которое-вырабатывало бы. вектор управления U(tJ . Если граничные условия изменились, тс расчет необходимо про­ делать заново и азаренастроить программное устройство.

ЗИбчиуаш» более удобным является решение задачи оптизбажького уЕравленыЕ в форме синтеза, когда оптимальное управявняв ищется гак функция ТОЧКЕ фазового пространства U~ Uf^/, Рзшзние э форма синтеза удобно тем, что оно реализует оптиЗйааьшай процесс пра произвольных начальных условиях. Решение задачж в такой форме есть задача синтеза регулятора с нелиней-

ЗКЙЕ СВЯЭлШ.

-IOC -

у.нонятид о мьтодв щ ш т а щ р , .Ш^ГРАШі^ВАІШ

Метод оптимизации, которыі. s настоящеее время: называется методом динамического программирования,, был предложен американ­ ским математиком Р. Беллманом s начале 50-х годов.

Рассмотрим этот метод применительно к задаче оптимального уп­ равления объектом, который описывается системой диффурекцвальных уравнений

Х.---А (х,,.:Я„

и,,... OlvJ (i: >,i,..,nj

о st«. «>.

Предположим, что начальные и конечные значения переменных за­ даны

X;{oJ-

x'i

<

'-0

(c-

•'• nJ

U K ( O I ,

U'K

;

W W -

О

(K*t,l....m)

Пусть требуется управлять объектом так„

что функционал

 

ta

 

 

 

 

У

= ff

fa,...

Х„ І U,,... Um J

&

 

о

 

 

 

 

принимал минимальное значение, другими словами нужно найти уп­ равления Ц ) . . . Um миішмизирующие функционал $t , имеющий смысл некоторой меры несовершенства системы. Предположим, что ни зкаеи такие управления, тогда функционал принимает минимальное значе­ ние, зависящее от начальных условий. Обозначим

S(X° .. Х° I - ГПіп У • ГПіп if fa , '...Х!„ ; i/it... a„/Wt U,..Mm U,...Lh,J0

.Если подставить

управление, гйинимизіфующае фунісционал з урав­

нения объекта,

то получим оптимальную траекторию в фазовом

пространстве x(tj.

Разобьем

оптимальную траекторию на два

участка: первый

от

£ = О

ди t = t

к второй

от t* î до £ * п г ' . ,

Р И-ллманом

был выдвинут

следуюліий

принцип

оптимальности:

101

"Поведение системы при-і"*Р не-зависит от''предоетврии, т . е . от поведения системы з' прошлом?- и определяетсяее 'настоящим состоя­

нием т:; е. в момент

r:"X«s''VWj.:. .

. .

іеі.

 

 

Согласно

этому принЩпу,

'если траектория

в интервале

от

11 О

и

t » f

оптимальна,

то

второй участок

траектории от

t*

t до

t

* «*

также яыляется

оптимальным.

 

 

 

 

Запишем

S faff** /"следующим-образом--— - —

 

 

Согласно принципу оптимальности Беллмана, если некоторые уп­

равления доставляют, минимум интегралу

ï

Fc/t

, то они ö"-

дут доставлять

также минимум интегралу.. . I-Fttt

;.,

 

Поэтому:>

 

-:

-чк.

 

 

 

 

 

Г

 

 

ГГІіа \fctt--

S

 

(г),

...л„(t)]

 

 

 

Вели Т

достаточно малая величина,

то

имел в

виду,

что

х.

(г)

•*"<• (о)

*

л х- .

х'

+

л xi

t

 

 

можем написать

~

.<

 

 

 

 

 

 

 

 

 

 

 

 

 

• • * Jug

à

 

-

5

i x <

• • • •

J *

Вели учесть, что <; .

у

-

у

r

я;~

 

 

±

 

 

то получим

 

 

 

 

 

 

 

 

 

 

 

SSkCtJ,...

x„

CT']

 

n

 

 

f.

(ас',

u'Jt

 

 

 

 

 

 

 

 

 

 

 

 

-

ш

-

 

 

 

 

 

 

 

 

 

 

Ііоско-чііку

t

 

г.-.алая величина,

 

гложад

палисптьь

 

 

 

 

 

г

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

I Fc/t

-- F fx*.

• ••

20% ;

uf\ .

 

j t .

 

 

 

 

 

О

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таким образом

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S,

 

min

 

[F(x;w/r

 

* Sa

* I t

fg. f,

(oc;

u'frj,

 

 

Utr.- Um

 

 

 

 

 

~'*

6

 

 

 

 

 

 

откуда

следует

 

 

 

 

 

 

 

 

 

 

 

 

 

 

men

ff(*%

w;+

f

 

 

/ , ice°,

w j j .

 

о

 

 

 

Согласно принципу онткѵальност:: это

выражение долыю

онть

справедливым

для

текущих

координат ж

г

&

(

поэтому

 

 

ГПСп

[F(cc.üJ+ І_ g

 

h

(*. иJ]

= о

 

 

 

'ovo и

есть функциональное

уравнение

Бь-ллмане

т . е .

условие ОП-

ТШаЛЪНОСТК.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Полученное

условие означает,

что

минимум

выражения.а. скобках

по управляющим параметр™: равен нулю. Для получения значений

уирышіющих

 

наянмь'.;;ов,

ш(н»1миэирующих этой выраяение, нуяаго

взять частные пгмииэодшк. ло Ut,

 

 

Um ,

 

результате

получа­

ется система

ургт.-ниіі

 

 

 

 

 

 

 

 

 

 

 

 

і*ли

U

 

-

управлыг.к ,

::.'.ііденное из этой системы, т . е . оііти-

.ллыки. Уііргшлокисі, то знг',еі;:е

/Ѵіп

равно

нулю

г.и.

 

•з этого

ура'ьнсш:я шг/л

быть

наіідеііа функция

S(•*,

> • •

хп)

'ле?о„

••;ікам!іческо:,о

л^ограѵ.ѵлровання

приводи? к

уравнениям

Соседние файлы в папке книги из ГПНТБ