Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Цирлин, А. М. Основы оптимального управления конспект лекций

.pdf
Скачиваний:
9
Добавлен:
19.10.2023
Размер:
6.17 Mб
Скачать

где # c i

=Jj/fr)[xatffr-//

-/fau,

 

Jjirr-w<//s

При

заданном значении _Х\ и ;

второе слагаемое

в i I 5 . I 0 )

не эа-

внспт

от варьируемых

составляющих решения. Выражение

l i b . I I )

для"

дифференцируемой

tj

у{)

можно записать

в несколько оолее удобной

форме,

введя

функцию

 

 

 

 

 

 

 

Получим

 

 

 

 

 

 

 

 

 

 

с &

 

 

 

 

 

 

 

 

U5 . I3)

Подинтегральное выражение в vI5.U) состоит из двух слагаемых,

первое из которых сингулярно и

содержит только У

(4),

второе

же,

куда входят X и U .

, регулярно зависит от времени. Так что связь

регулярна

по

1L

и

сингулярна

по У

.

 

 

 

15.5.

Интегральные

уравнения

 

 

 

 

 

 

 

 

 

 

 

 

 

г

Ub.14)

Переписав

У

( Т

)

в форме интеграла,

получим

 

 

 

 

 

Слагаемое

 

 

 

 

 

 

 

4

 

 

 

у

 

 

 

-/

 

 

 

 

 

В частности, для линейного интегрального уравнения, связывающего выходной У и входной Ы. сигналы динамической системы:

i5i

-г,

Для системы автономной, физически реализуемой

£a

= МШМ

~ *MAfr-

VSfto/r

U 6 . I 7 )

Связь

сингулярна по

У

н регулярна до

.

 

J.t>.t>. Рекуррентные

соотношения.

 

 

В некоторых

задачах

наряду с переменными, зависящими от непре­

рывного аргумента,

встречаются и фу!1кция

дискретного

аргумента.

Ввиду

того,

для

связей

между такими функциями также

получим

слагаемые в

/?

. Так,для рекуррентного соотношения

 

о

где

6 = 0,1,

. . ., л/.

 

Подилтетральное

выражение сингулярно из-за наличия

S-функций,

что

приводит

к

сингулярности связи не только по X,

но и по I t

 

отличие от дифференциального уравнения).

 

 

Ра>

=<y/i+,

 

Это выралвние совпадает с выражением, полученным в § 12-Дсм.таб­

лицу 12.IJ.

Псе остальные

слагаемые

записанные в табли­

це

12.1, можно получить таким же образом,

причем

для

заяиои из:

в

канонической

форме U4.6)

приходится вводить

§ -

функции, а

это значит, что по переменным, зави'-ящим от дискретного аргумента, задача всегда сингулярна, а значит их следует отнести к переменным второй группы.

15Z

15.7. Таблица слагаемых

и некоторые формы

 

 

 

критериев оптимальности.

 

 

 

Сведем полученные слагаемые для различных форм связей

в

таблицу.

 

 

 

Таблица

1 5 . I .

*n.Di

Связь

се

I г р .

I I TJb

 

 

 

 

I .

о

при - t^a,^}

3.

У

 

5.

•fj(r)c/r; и

v(r+j- 0

6.

o/T.

Выше для канонической формы

записи было показано, что

ограни­

чениям в функционале

Лагранжа

^

соответствуют такие

же сла­

гаемые, как и связям,

но на знак

множителя j i

наложены условия

неположительности

(14.26), еоли

 

соответствувдее ограничение

С учетом

этого

обстоятельства табл.

15 . I может

быть ис­

пользована и для задач

с ограничениями.

 

 

При формулировке достаточных условий оптимальности в пункте

14.6 использован функционал £ ' • , в

подиятегральном

выражении

ко ­

торого каждой

связи

соответствовало

слагаемое

1^>.

По форме

это

•слагаемое

отличалось

от

PC g

только темчто в функцию ji

вво­

дилась зависимость от переменных задачи. Ввиду этого нет нужды

находить

слагаемые

Q t g

для

различных форм связей и составлять

отдельную

таблицу. Можно брать

/?(^из табл.

15.1

и вместо

 

подставлять </1 \.

4

) .

 

 

 

 

 

Таблицу (15

.IJ можно использовать и при критериях оптимальности,

отличных

от ( 1

4 . I ) .

В качестве

примера рассмотрим критерий вида

 

 

 

4^[0,Т]

 

 

 

 

 

 

(15.18)

 

Аналогично дискретной

задаче

(.см.п. 12.5)

перепишем

выражение

 

U5.8)

в форме

двух

условий

 

 

 

г

 

 

 

 

S^p

Т=

 

 

 

 

 

/фс//}

 

 

В этих

условиях

 

-

постоянный параметр,

не зависящией

от £

.

Если целевой функции (14.I)

в R

соответствовало

слагаемое

 

^ 0 = - £ v c / i ^ '

т о

Фуикционзлу

 

в

/?

соответствует

слагаё-

причем , / / о 6 0 ~

0,

а

^

 

меняется в открытой области. Так как

в другие слагаемые

R

eg

параметр

%

не входит,

то условие

ста ­

ционарности )S>

по

~%

приводит к

равенству

 

 

 

 

 

JJoftjdi-

 

 

 

 

 

(15.19)

 

 

 

 

о

 

 

 

 

 

 

 

 

 

 

Критерий, зависящий от конечного состояния объекта^

может оыть записан в форме (14.I)

Соответствующее этому критерию слагаемое в R

аь.21)

Наконец, критерию общего вида

I

- f j . W i

-

т>

 

соответствует

 

 

 

 

 

 

(15.22)

Здесь

функции ^ 0 и

цредполагаются

непрерывными по

совокуп-

ноотн

своих аргументов.

 

 

 

 

Полученные результаты

удобно свести

в таблицу, аналогично

табл.... 15. 1м

 

 

 

 

 

 

Таблица 15.2.

& п/п

Максимизируемый

#0

I r p .

И г р .

 

функционал

 

 

 

 

 

 

i .

о

 

/ .

 

 

 

 

2?

 

 

и

У

о

 

 

 

3.

 

 

 

 

«

Ln/CyJJ

 

 

 

 

4шт]

 

 

 

При неполь8ованйн табл. 15 . I и 15.2 составляют функднш

причем к переменным первой группы на интервале («//ауФ'Д/ относят лишь те нереиеннне', которые в /?„ и в каждой из ^с^# фигурируют, как переменные первой группы.

§ 16. Задачи со связями в форме дифференциальных уравнений. Необходимые условия оптимальности-:-

В природе очень многие процессы с достаточной точностью опи­ сываются дифференциальными уравнениями. Работы, посвященные опти­ мальному управлению объектами, характеризующимися совокупностью дифференциальных уравнений, составляют львиную долю общего числа работ по оптимальному управлению. Остановимся в этом параграфе на необходимых условиях оптимальности в задачах со' связями в форме

дифференциальных

уравнений.

 

 

 

 

 

 

16.1. Задача

со свободным правым концом*.

 

 

 

Пусть управляемая

система

описывается

уравнениями

 

 

 

 

 

 

 

 

 

 

416.1)

 

X

 

^J^J

 

 

Ра 1,2,.., Л

 

Требуется

перевести

систему

из

заданного

начального состояния .Х(О)

в п-мерном

пространстве .^Чфазовом пространстве

системы)

в

неко­

торое нефиксированное заранее состояние

J^(T)

за Время

Т(

кото­

рое также

требуется

г.тйти,

 

чтобы функционал

 

 

 

был максимален. Управленце

 

^замкнутой и ограниченной

области

в ft] -мерном пространс'тве ~Ц~.

Функции

у£{

0 =* 0 , 1 , . . . rt )

предполагаются непрерывными по совокупности своих аргументов и не ­ прерывно дифференцируемыми по У и т£~.

Наряду с системой из ?Z уравнений (16.I) запишем уравнение для (п+1)-й переменной - времени

УПН (TJ- свободно.

 

 

 

f56

 

 

для получившейся

задачи

запишем функцию

/4?, пользуясь табл.

I 5 . I .

 

 

л

 

 

Здесь вектор

J/

имеет

размерность (п+I,). Задача регулярна

по

и сингулярна

по . Выделим ту часть

функции z^7 , которая

зави­

сит от управлония

 

^

 

 

функцию Н называют функцией Гамильтона по имени английского ученого использовавшего аналогичную конструкцию в задачах аналитической ме­ ханики.

Условия стационарности функционала Лагранжа /Sf по У и максиму­ ма по \4i примут в данном случае вид

у = 1,2,.

. у / 1

U€- Vv

(16.6)

Наконец, уравнения связей ^16.1) также можно записать через функ­ цию Гамильтона

У

Таким образом, необходимые условия § 14 для данной задачи при­ водят к теореме 16.1 ( принцип максимума Понтрягина). Если У( l6 ) 'оптимальное управление, то существует такая непрерывная ненулевая

вектор-функция

 

, удовлетворяющая (16.5),

[что для любого

момента 2Г

выполнено условие

(16 . б) . Из непрерыв­

ности^ft

(•£ ) "и условия

( 7Х ) = 0

(ом.табл. 15.1) следует

что на границе

интервала

,

 

yf(Tj= 0

а б . 7 )

.'5 7

Условие общности положения прииенительное к

этой задаче означает,

что

множество

Vu

и уравнения (16.1)

должны

быть

такими, чтобы

траектория

не была изолированной. Ее должны

"окружить"

допу­

стимые траектории.

 

 

 

 

 

 

Схема решения такова:

 

 

 

 

1)

из условий

максимума Н определяется

*Ц *~ , как функция ^

;

2)

решав совместно (16.4) с условиями

(16.7); (16.6) с условиями

У(0)=Уи^ (16.5),

паходят оптимальные и

 

 

Задача

эта

далеко не проста, так как граничные условия для дифференциальных

уравнений заданы па различных концах траектории.Кроме того, нужно

одновременно с

решением

уравнений обеспечивать условие максимума Н

по

£•/

, Ниже в специальном параграфе мы остановимся

подробнее

на

вычислительном

аспекте

задачи.

 

 

 

Рассмотрим

поведение

функции Н вдоль решения, удовлетворяющего

необходимым условиям. Обозначим для кратности через

вектор

с

составляющими

^

, У

. Из условия (16.5) следует [24 ]

 

Из

этих

неравенств

получим

 

 

Так как

в е к т о р е

и функция Н непрерывны^при

Д-*-0) крайние члены

в (16.8)

стремятся

к нулю, а значит к нулю стремится и приращение

функции

Н на оптимальном решении, что говорит

о непрерывности Н по

4 даже в точках разрыва управления.Это можно было предполагать, так как в момент переключения

1S8

Для всех моментов времени, кроме моментов разрыва управления,

функция Н дифференцируема по £.

,

прячем

ее

полная

производная

по ~£

равна

частной. Действительно, для

Н

(У (U

*)j^(^/г)

Но из

условий

С16.Ъ), записанных

в

векторной

форме

( ^ а - ^ j j —

следует, что сумма двух первых слагаемых в этом выражении равна нулю, так что полная производная

для любого допустимого управления при выполнении ^16.5). Иначе,

Pwc. /6. /

-in-

t

Но на оптимальном управлении U. (4) при выполнении условий выбора

Правая же часть этого равенства равна нулю, так как значение функционала I при оптимальном выборе Т= / больше или равно зна­ чению этого функционала при Т = Т *" - S0 с гt~ И t - t + S t , откуда следует, что С = 0,' а

т

Т

(?=/

, S9

Если, в частности, функции Jo и не зависят явно о* ~£ (система автономна), то на оптимальной траектории функция Гамиль­ тона тождественно равна нулю. Естественно, что для всех остальных допустимых управлений она неположительна.

16.2. Другие постановки задачи Д. Значение аргумента Т и состояния в конце процесса связаны

друг с другой.

 

 

В остальном

задача совпадает с п. 1 6 . I . Уравнение

связи имеет '

вид

 

 

.

FfjCCrJ, Г) 'О

Ц 6 . Ю )

Функция F предполагается непрерывной и непрерывно дифференцируе­ мой по совокупности своих аргументов.Запишем функцию & с учетом (16,10), пользуясь табл. 15.I , 15.2 •

+

JSrf-

т;гм

( 1 б Л 1 )

Здесь

- ( Л + I )

- мерный вектор. Условия ее

экстремума noJ^

С учетом

того, что при

-t

>

Т ^

уравнения

в пределах

o i

^

s

Т_до

условиям

 

 

 

 

 

 

у,(Т>)

= Л Ъ

У р

 

( ^ « О , ннтегрироввниз этого * Т.,. приводи к краевым

(16.12)

 

 

 

р =1,2, ..

 

Геометрически эти условия

означают, что вектор W

ъ момент Т

ноллинеарвй

градиенту функции F

.Вектор же градиента нормален к

поверхности

уровня (16.10)

функции

Z 7 .

 

Таким образом, PfTj$вжзв нормалей к поверхности

=0. Условия

(16,12) называют условиями

трансверсальности. Остановимся на