Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Цирлин, А. М. Основы оптимального управления конспект лекций

.pdf
Скачиваний:
9
Добавлен:
19.10.2023
Размер:
6.17 Mб
Скачать

200

примет вид

 

 

 

 

 

 

 

 

 

 

после исключения Л1 (4).

Для физически реализуемой

автономной

системы

 

 

 

 

 

 

 

 

 

 

 

причем

К2

( 4

,

Т

)

= 0

при /

•?*•.

 

 

 

 

Пример 19*1. Найти ограниченное воздействие

 

, которое

за

фиксированное

время

Т

, приведет к максимальному значению

сигнал М(4)

на

выходе

автономной

линейной системы

с

импульсной

характеристикой

К ( -i

)

(задача Булгакова). Запишем

критерий

I

= йХ

(Т)

в интегральной форме

 

 

 

 

Уравнение связи между 'U и

У

 

 

 

 

 

 

 

=оfk(r-{J

Uf/Jc/J Л /

f

 

 

Используя (19.9), получим

 

'

 

 

 

откуда

U*-

Sign JC(T-

{)\

на рис.19.1

показал

переход от

к ( 4 ) к ы*П).

 

 

 

 

 

 

 

 

19.2. Достаточные

условия оптимальности

 

 

 

 

Для получения

верхней оценки,

а в ряде случаев

и самого реше­

ния задачи (19.1)». (19.2), можно использовать достаточные условия

оптимальности. Пусть,

кроме

ограничений на

^

,

есть еще огра­

ничения на переменные

состояния

У 6Г Vx •

Обозначив через ^

век­

тор с составляющими <У ,

, можно

записать

^

Ц / , где

 

- прямое произведение множеств

Vx

и

Vu

. Функция

R

гон

• для

задачи (19.1), (19.2)

отличается

от выражения (19,8)

лишь

введением

дополнительных переменных

в

 

d(f).

 

 

 

 

 

 

о

 

 

 

 

 

 

 

 

 

 

 

 

Для

любой

функции

j/

( ^

1 ) , удовлетворяющей необременительным .

условиям теоремы

о.

/ &

»

функционал

 

 

 

 

 

не меньше значения

I на искомом решении, если функция

R

принимает

максимальное

значение

по у £ \ / .

Если

же окажется,

что

2), т.е,

сУ

__и Ц

 

удовлетворяют

не только

ограничениям,

 

но и

овязям,

то

S С "^*)

=

I

(

 

) , а сама

пара

X

 

1С*

является

искомым решением.

Как это

делалось

и выше

( см. п.п. 7.7, 12.6,

17.4), чтобы обеспечить

лопадаяие_ ^ ^ н а

Д,

стараются

выбрать

У

 

яак»

чтобы

максимум

Q

по одной

группе

переменных

не зависел от значения переменных второй группы. Разбиение же на первую и вторую группы производят так, чтобы одни переменные оп­

ределяли другие

черев уравнения связей. Ив такого

подхода (см."

п.17.2) вытекел

для связей в форме дифференциальных

уравнений

алгоритм динамического

программирования, применимый к широкому кру­

гу задач. Здесь такого

общего алгоритма пока нет, но для получения

верхней оценки и для некоторых

частных задач использование доста­

точных условий

может

оказаться

эффективным.

 

Рассмотрим

случай,

 

когда

и ^ / линейны по

^-1

Функция ё~Мь+А(ич-ХЛ&)-"/%Ф//%Ъ)с/{Г

О

'Z02

Требование независимости

OS

приводит к соотноше­

ния

 

 

7~

 

 

После

подстановки найденной

* / / (

) в & у дС определя­

ется

из условия

 

 

 

 

• & -

о « . / ° / " % f c * j t

 

 

 

 

 

 

 

 

 

( I 9 . I I )

Область

V /

определяется не

только

ограничениями

на фазовые ко­

ординаты,

но и ограничениями

на управления.

Полученная не (19.11)

траектория-является

решением

дивь в том случае, если управление

dX. , ооответствутацее эй я салу уравнения связи, окавалооь до-

цуотимым. В противной случае

найден^оэ значение &

^ Х у ^ д а е т

зернгоют.' Оценку решения. Знание У

и в атом

случае полезно,

так как дает

представление об обвей

характере

решения.

Рис. '

203

 

§ 20. Скользящие режимы в задачах оптимизации .

 

 

20.1.В параграфах тринадцатом и четырнадцатом

использовалось расшире­

ние

вариационных

задач. Там было доказано,

что для любого из базо­

вых

значений ^ ф у н к ц и я

/14.9/

достигает

своей точной

верхней гра

ни. Если при пбсти всех

4

значение

<^е единственно,

то

соответству

гощее управление

является решением исходной задачи в классе кусоч­

но-непрерывных

функций. Но верхняя

грань

функции Н по

U может

на множестве значений i

ненулевой

меры достигаться

не при одном,

а при нескольких

значениях

W

. В этом случае будем говорить, •:.

что условия оптимальности расширенной задачи, сформулированные в §14, являются условиями оптимальности для исходной задачи в классе скользящих режимов.

Чтобы для конкретной задачи получить условия оптимальности в

классе скользящих режимов, нужно, пользуясь

табл].

15.1 и

15.2,

записать функцию Q ; выделить

составляющие

первой группы Ц , вхо­

дящие в регулярную часть как

/ 0 , т а к и всех

имеющихся в

задаче

свя­

зей; подсчитать число связей,

в #оторые входят Ц . Пусть это

чис­

ло равно Li .

Тогда для определения оптимального скользящего

ре ­

жима требуется

при каждом найти //ц+I /-но значение ^(i),

весо

вых коэффициентов, соответствующих оптимальным базовым значениям L/g(-4) "расщепленного" управления.

Имеем следующие расчетные соотношения:

Z ' o S W ;

 

/ 2 0 - 2 /

Здесь

через &±

обозначена совокупность тех слагаемых в

, ко­

торые

не зависят

от U. .

 

204
2Q.2. Связи в форме дифференциальных уравнений.. Конкретег-ируем условия (20.1 ) f (20.3 ) для связей в форме
обыкновенных дифференциальных уравнений
В данном случае
Используя, как и в § Г5,виеото,/(-Ь функции ^ ( 4 j ^>//{гМ№У , перепишем условия (20.1.) и (20 . 3 ) соответственно,
как
(20.5);

 

 

 

 

 

 

 

7>Х

 

 

(20.6.)

На tfK

и

 

$к

наложены

обычные

ограничения

(20.2..). Здесь

tYJ

число уравЁений

(120.4'),

которые

для

скользящего

режим?,

примут

форму

ГУ)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Эти уравнения становятся обычными уравнениями принципа макси­

мума Понтрягина (см. п. 15.4), если для

любого

интервала

("^.,"4)

£

[Ъ)Т]

 

функция

Н достигает своей

верхней грани при един­

ственном

значении U f ю

есть вое функции

^(-Цкроме

одной,

тождественно

равны кулю. '1'ак как величина

максимума функции Н, -

а

значит

и

/?

для каждого из управлений Ык. одинакова, эти

управления

"равноправны"

по своему вкладу

в величину функционала;-

I .

Это дозволяет из

множества

траекторий,

удовлетворяющих/20,7/(

1

Ж

выбирать

наилучшую,

она может

не

соответствовать

ни

одному из

уп ­

равлений

 

в

отдельности,

но в каждый момент времени ее наклон

лежит

внутри

пространственного

угла,

образованного

направлениями

J

(UiCj't

) •

Рассмотрим

один лроотой чаотный олучай. Пусть

заданы начальные

и конечные условия

для У ." У(0)-Ус^ Х(Т)*Ут

,

а n J-*,

и

правые чаоти

уравнений овязи

зависят

только

от управ-

лений. Тогда

из

(20,6 ) следует,

что

г 1

»

0,

а

следовательно,

 

Пусть

для

некоторого

С функция

Н достигает

максимума веточках

 

 

 

множества

 

Каждому

из

значений

управления

 

ооответотвует направление

 

 

 

в

пространстве

У

. Построим

угод

Q вершиной

в точке

У0

,

образованный

такими

направлениями.

Еоли

точка

У

окажется

внутри

этого

угла,

то

оиотема

 

 

£=•1

ноаволяет с помощью найденных управлений подучить траекторию,удов­ летворяющую условию на правом конце. Значение же С,в свою очередь,

определяется

из условия, чтобы упрагч'ния

(С) не только удов­

летворяли

условию

J((T)"

, w o

и

Доставляли максимум.',

выражению

J^'

1 (U *(С))«

Заметим,

что эта

задача легко может

быть преобразована к статичеакой задаче оптимизации в среднем

(см. п. 8.4

) .

 

 

 

 

 

22.3.

Связи в

форме интегральных

уравнений

 

 

= '^(ХШ^ШМ)^

 

 

(20..-.8)

 

 

и

 

 

 

 

 

Функция Q. (см.п. 15.5) имеет вид

206

При лоиоке оптимального решения в клаосе скользящих режимов уравнения (20. 8) и функция Р запищутоя в форме

о kso

'

( 2 0 , 9 )

fc=0

о

 

Условия оптимальности

(20. < ) и {20.5)

примут вид

В частности, для линейного интегрального уравнения типа свертки

 

 

 

 

°

 

120. И)

 

-

i '

я

w

¥ f - c ^

 

 

 

 

i t o

'

 

 

(20.12)

Если не только

,

но и 14.

скалярные функции, то

число неизвест­

ных в последней

задаче

равно

шести (.X, , / / / ^ У, , Mo,

)•

Подсчитаем общее

число

условий

для их определения. Уравнения

(2О./0), (2.0.1?) и (.20.42) Дают

три услогия. Оставшиеся три

доставляет неравенство

( 2 Q . l l ) .

Действительно, из

него

следует

Ufa)- Hfrt),

/-/(U,)

= S<y,

/ / С* Ч t

J J ,

207-

<l<£Vu.

Последние два

при управлении,

лежащей внутри \ / ^ , превращаются

в равенство

ЪН$

(%

0,1).

Аналогично с использованием табл. 15.1 могут быть составлены'

уравнения для

определения

управлений Цл({)

при наличии з

задаче озяэей

различного

типа.

 

Упражнения. -

I.Записать условия оптимальности в классе скользящих режимов для функционала

то.* /"Пик*

со связями в форме дифференцяальннх уравнена?.

2. Как изменятся условия оптимальности в классе скользящих режимов, полученные в этом параграфе, при наложении на вектор управлений Ы условий

3. Найти управление bCf^J, переводящее линейный стационарный объект с импульсной характеристикой из состояния ЬС(0)=У(о в состянЕе^ХУт^- J(r, за время Т и мннииквирухщ-эе функционал

о i -

о

§" 21. Чиояенные методы решения непрерывных зада» оптимизации.

В § 7 мы рассмотрели некоторые из многочисленных методов решения задач о условном максимуме функции. Каждому из них может быть по­ ставлен в соответствие аналогичный подход при определении максиму­ ма функционала.. Подчеркнем эту аналогию на примере методов, упомя­

нутых

в § 7. Численные

алгоритмы удобно

излагать для

задачи с ка ­

нонической формой связи.

Это позволяет,

воспользовавшись таблицей

1 5 . I ,

применить

тот или

иной алгоритм для произвольного набора

связей, записав

каждую их них в канонической форме.

 

 

Аналог метода

проектирования

градиента

 

Пуоть требуется найти

функцию у(4),

доставляющую

максимум

функционалу

 

 

 

 

 

 

 

при

условии

 

 

 

 

 

 

 

 

iff*)

-

//tew*,

т;<#_

 

 

(

a l a

Для простоты считаем, что множеотво допустимых

значений у

совпа­

дает оо всем пространством У

. Функции Jt

и

J-

дифференцируемы

по

совокупности

своих аргументов. Чтобы найти

направление

условно­

го

градиента

функционала . X

в окрестности

начального приближения

£/o&JВДжно, как это было показано в п. 7

. 1 ,

решить вспомогатель­

ную, экстремальную задачу определения

функции

£{{) такой,

что:

I . достигает максимума скалярное

произведение

градиента

I на

.. год

2.

Скалярное произведение градиента аУ (Т* )

на £{{.) для любо­

го

равно

нулю

 

 

т

 

 

J

У>/ШЛ)

( я м )

3.

Норма

функции ъ(Ъ равна единице

 

Нормировать ^ ( 1 ) можно по-разному. Чаще воего испольвуют квадратичную норму

Здесь К - размерность вектор-функции Каждое из этих выражений является функциональным аналогом

формул (7.5), (7.3) и (7Л) соответственно. Найдя направление условного градиента, переходят к следующему приближению

Таким образом,решение исходной задачи сводится к последователь­ ности вспомогательных экстремальных задач, линейных относитель­ но искомой вектор-функции £(-t) с условием нормирования (21.5).

Размерность же вектора равна размерности После несколь ких шагов необходимо минимизировать возникающую невязку в уравне­ нии связи (21.2), потребовав

3

X,

о

 

 

и решив

численно эту

задачу

с начальным

приближением ^ j ( 4 ) , ко­

торое мы нашли после

первой

серии поиска

по методу проектирования

градиента.