книги из ГПНТБ / Цирлин, А. М. Основы оптимального управления конспект лекций
.pdf200
примет вид |
|
|
|
|
|
|
|
|
|
|
||
после исключения Л1 (4). |
Для физически реализуемой |
автономной |
||||||||||
системы |
|
|
|
|
|
|
|
|
|
|
|
|
причем |
К2 |
( 4 |
, |
Т |
) |
= 0 |
при / |
•?*•. |
|
|
|
|
|
Пример 19*1. Найти ограниченное воздействие |
|
, которое |
|||||||||
за |
фиксированное |
время |
Т |
, приведет к максимальному значению |
||||||||
сигнал М(4) |
на |
выходе |
автономной |
линейной системы |
с |
импульсной |
||||||
характеристикой |
К ( -i |
) |
(задача Булгакова). Запишем |
критерий |
||||||||
I |
= йХ |
(Т) |
в интегральной форме |
|
|
|
|
|||||
Уравнение связи между 'U и |
У |
|
|
|
|
|||||||
|
|
|
=оfk(r-{J |
Uf/Jc/J Л / |
f |
|
|
|||||
Используя (19.9), получим |
|
' |
|
|
|
|||||||
откуда |
U*- |
Sign JC(T- |
{)\ |
на рис.19.1 |
показал |
переход от |
||||||
к ( 4 ) к ы*П). |
|
|
|
|
|
|
|
|||||
|
19.2. Достаточные |
условия оптимальности |
|
|
|
|||||||
|
Для получения |
верхней оценки, |
а в ряде случаев |
и самого реше |
ния задачи (19.1)». (19.2), можно использовать достаточные условия
оптимальности. Пусть, |
кроме |
ограничений на |
^ |
, |
есть еще огра |
|||
ничения на переменные |
состояния |
У 6Г Vx • |
Обозначив через ^ |
век |
||||
тор с составляющими <У , |
2У |
, можно |
записать |
^ |
€ Ц / , где |
|
||
- прямое произведение множеств |
Vx |
и |
Vu |
. Функция |
R |
гон
• для |
задачи (19.1), (19.2) |
отличается |
от выражения (19,8) |
лишь |
|||||||||||
введением |
дополнительных переменных |
в |
|
d(f). |
|
|
|
||||||||
|
|
|
о |
|
|
|
|
|
|
|
|
|
|
|
|
Для |
любой |
функции |
j/ |
( ^ |
1 ) , удовлетворяющей необременительным . |
||||||||||
условиям теоремы |
о. |
/ & |
» |
функционал |
|
|
|
|
|
||||||
не меньше значения |
I на искомом решении, если функция |
R |
принимает |
||||||||||||
максимальное |
значение |
по у £ \ / . |
Если |
же окажется, |
что |
2), т.е, |
|||||||||
сУ |
__и Ц |
|
удовлетворяют |
не только |
ограничениям, |
|
но и |
овязям, |
|||||||
то |
S С "^*) |
= |
I |
( |
|
) , а сама |
пара |
X |
|
1С* |
является |
||||
искомым решением. |
Как это |
делалось |
и выше |
( см. п.п. 7.7, 12.6, |
|||||||||||
17.4), чтобы обеспечить |
лопадаяие_ ^ ^ н а |
Д, |
стараются |
выбрать |
|||||||||||
У |
|
яак» |
чтобы |
максимум |
Q |
по одной |
группе |
переменных |
не зависел от значения переменных второй группы. Разбиение же на первую и вторую группы производят так, чтобы одни переменные оп
ределяли другие |
черев уравнения связей. Ив такого |
подхода (см." |
п.17.2) вытекел |
для связей в форме дифференциальных |
уравнений |
алгоритм динамического |
программирования, применимый к широкому кру |
||||
гу задач. Здесь такого |
общего алгоритма пока нет, но для получения |
||||
верхней оценки и для некоторых |
частных задач использование доста |
||||
точных условий |
может |
оказаться |
эффективным. |
|
|
Рассмотрим |
случай, |
|
когда |
и ^ / линейны по |
^-1 |
Функция ё~Мь+А(ич-ХЛ&)-"/%Ф//%Ъ)с/{Г
О
'Z02
Требование независимости /г |
OS |
приводит к соотноше |
ния |
|
|
7~ |
|
|
После |
подстановки найденной |
* / / ( |
) в & у дС определя |
ется |
из условия |
|
|
|
|
• & - |
о « . / ° / " % f c * j t |
|
|
||
|
|
|
|
|
|
|
( I 9 . I I ) |
Область |
V / |
определяется не |
только |
ограничениями |
на фазовые ко |
||
ординаты, |
но и ограничениями |
на управления. |
Полученная не (19.11) |
||||
траектория-является |
решением |
дивь в том случае, если управление |
|||||
dX. , ооответствутацее эй я салу уравнения связи, окавалооь до- |
|||||||
цуотимым. В противной случае |
найден^оэ значение & |
^ Х у ^ д а е т |
|||||
зернгоют.' Оценку решения. Знание У |
и в атом |
случае полезно, |
|||||
так как дает |
представление об обвей |
характере |
решения. |
Рис. '
203
|
§ 20. Скользящие режимы в задачах оптимизации . |
|
|
||||||
20.1.В параграфах тринадцатом и четырнадцатом |
использовалось расшире |
||||||||
ние |
вариационных |
задач. Там было доказано, |
что для любого из базо |
||||||
вых |
значений ^ ф у н к ц и я |
/14.9/ |
достигает |
своей точной |
верхней гра |
||||
ни. Если при пбсти всех |
4 |
значение |
<^е единственно, |
то |
соответству |
||||
гощее управление |
является решением исходной задачи в классе кусоч |
||||||||
но-непрерывных |
функций. Но верхняя |
грань |
функции Н по |
U может |
|||||
на множестве значений i |
ненулевой |
меры достигаться |
не при одном, |
||||||
а при нескольких |
значениях |
W |
. В этом случае будем говорить, •:. |
что условия оптимальности расширенной задачи, сформулированные в §14, являются условиями оптимальности для исходной задачи в классе скользящих режимов.
Чтобы для конкретной задачи получить условия оптимальности в
классе скользящих режимов, нужно, пользуясь |
табл]. |
15.1 и |
15.2, |
|
записать функцию Q ; выделить |
составляющие |
первой группы Ц , вхо |
||
дящие в регулярную часть как |
/ 0 , т а к и всех |
имеющихся в |
задаче |
свя |
зей; подсчитать число связей, |
в #оторые входят Ц . Пусть это |
чис |
ло равно Li . |
Тогда для определения оптимального скользящего |
ре |
жима требуется |
при каждом ~к найти //ц+I /-но значение ^(i), |
весо |
вых коэффициентов, соответствующих оптимальным базовым значениям L/g(-4) "расщепленного" управления.
Имеем следующие расчетные соотношения:
Z ' o S W ; |
|
/ 2 0 - 2 / |
|
Здесь |
через &± |
обозначена совокупность тех слагаемых в |
, ко |
торые |
не зависят |
от U. . |
|
|
|
|
|
|
|
|
7>Х |
|
|
(20.6.) |
||
На tfK |
и |
|
$к |
наложены |
обычные |
ограничения |
(20.2..). Здесь |
|||||
tYJ |
— число уравЁений |
(120.4'), |
которые |
для |
скользящего |
режим?, |
||||||
примут |
форму |
ГУ) |
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
Эти уравнения становятся обычными уравнениями принципа макси |
||||||||||||
мума Понтрягина (см. п. 15.4), если для |
любого |
интервала |
("^.,"4) |
|||||||||
£ |
[Ъ)Т] |
|
функция |
Н достигает своей |
верхней грани при един |
|||||||
ственном |
значении U f ю |
есть вое функции |
^(-Цкроме |
одной, |
||||||||
тождественно |
равны кулю. '1'ак как величина |
максимума функции Н, - |
||||||||||
а |
значит |
и |
/? |
для каждого из управлений Ык. одинакова, эти |
||||||||
управления |
"равноправны" |
по своему вкладу |
в величину функционала;- |
|||||||||
I . |
Это дозволяет из |
множества |
траекторий, |
удовлетворяющих/20,7/( |
1
Ж
выбирать |
наилучшую, |
она может |
не |
соответствовать |
ни |
одному из |
уп |
||||||||||
равлений |
|
в |
отдельности, |
но в каждый момент времени ее наклон |
|||||||||||||
лежит |
внутри |
пространственного |
угла, |
образованного |
направлениями |
||||||||||||
J |
{Я (UiCj't |
) • |
Рассмотрим |
один лроотой чаотный олучай. Пусть |
|||||||||||||
заданы начальные |
и конечные условия |
для У ." У(0)-Ус^ Х(Т)*Ут |
, |
||||||||||||||
а n J-*, |
и |
правые чаоти |
уравнений овязи |
зависят |
только |
от управ- |
|||||||||||
лений. Тогда |
из |
(20,6 ) следует, |
что |
г 1 |
» |
0, |
а |
следовательно, |
|
||||||||
Пусть |
для |
некоторого |
С функция |
Н достигает |
максимума веточках |
||||||||||||
|
|
|
множества |
|
Каждому |
из |
значений |
управления |
|
||||||||
ооответотвует направление |
|
|
|
в |
пространстве |
У |
. Построим |
||||||||||
угод |
Q вершиной |
в точке |
У0 |
, |
образованный |
такими |
направлениями. |
||||||||||
Еоли |
точка |
У |
окажется |
внутри |
этого |
угла, |
то |
оиотема |
|
|
£=•1
ноаволяет с помощью найденных управлений подучить траекторию,удов летворяющую условию на правом конце. Значение же С,в свою очередь,
определяется |
из условия, чтобы упрагч'ния |
(С) не только удов |
|||||
летворяли |
условию |
J((T)" |
, w o |
и |
Доставляли максимум.', |
||
выражению |
J^' |
1 (U *(С))« |
Заметим, |
что эта |
задача легко может |
||
быть преобразована к статичеакой задаче оптимизации в среднем |
|||||||
(см. п. 8.4 |
) . |
|
|
|
|
|
|
22.3. |
Связи в |
форме интегральных |
уравнений |
|
|||
|
= '^(ХШ^ШМ)^ |
|
|
(20..-.8) |
|||
|
|
и |
|
|
|
|
|
Функция Q. (см.п. 15.5) имеет вид
206
При лоиоке оптимального решения в клаосе скользящих режимов уравнения (20. 8) и функция Р запищутоя в форме
о kso |
' |
( 2 0 , 9 ) |
fc=0 |
о |
|
Условия оптимальности |
(20. < ) и {20.5) |
примут вид |
В частности, для линейного интегрального уравнения типа свертки
|
|
|
|
° |
|
120. И) |
|
|
- |
i ' |
я |
w |
¥ f - c ^ |
|
|
|
|
i t o |
' |
|
|
(20.12) |
|
Если не только |
, |
но и 14. |
скалярные функции, то |
число неизвест |
|||
ных в последней |
задаче |
равно |
шести (.X, , / / / ^ У, , Mo, |
)• |
|||
Подсчитаем общее |
число |
условий |
для их определения. Уравнения |
||||
(2О./0), (2.0.1?) и (.20.42) Дают |
три услогия. Оставшиеся три |
||||||
доставляет неравенство |
( 2 Q . l l ) . |
Действительно, из |
него |
следует |
Ufa)- Hfrt),
/-/(U,) |
= S<y, |
/ / С* Ч t |
J J , |
207-
<l<£Vu.
Последние два |
при управлении, |
лежащей внутри \ / ^ , превращаются |
|
в равенство |
ЪН$ |
(% |
0,1). |
Аналогично с использованием табл. 15.1 могут быть составлены'
уравнения для |
определения |
управлений Цл({) |
при наличии з |
задаче озяэей |
различного |
типа. |
|
Упражнения. -
I.Записать условия оптимальности в классе скользящих режимов для функционала
то.* /"Пик*
со связями в форме дифференцяальннх уравнена?.
2. Как изменятся условия оптимальности в классе скользящих режимов, полученные в этом параграфе, при наложении на вектор управлений Ы условий
3. Найти управление bCf^J, переводящее линейный стационарный объект с импульсной характеристикой из состояния ЬС(0)=У(о в состянЕе^ХУт^- J(r, за время Т и мннииквирухщ-эе функционал
о i -
о
§" 21. Чиояенные методы решения непрерывных зада» оптимизации.
В § 7 мы рассмотрели некоторые из многочисленных методов решения задач о условном максимуме функции. Каждому из них может быть по ставлен в соответствие аналогичный подход при определении максиму ма функционала.. Подчеркнем эту аналогию на примере методов, упомя
нутых |
в § 7. Численные |
алгоритмы удобно |
излагать для |
задачи с ка |
|
нонической формой связи. |
Это позволяет, |
воспользовавшись таблицей |
|||
1 5 . I , |
применить |
тот или |
иной алгоритм для произвольного набора |
||
связей, записав |
каждую их них в канонической форме. |
|
|||
|
Аналог метода |
проектирования |
градиента |
|
|
Пуоть требуется найти |
функцию у(4), |
доставляющую |
максимум |
функционалу |
|
|
|
|
|
|
|
|
при |
условии |
|
|
|
|
|
|
|
|
iff*) |
- |
//tew*, |
т;<#_ |
|
|
( |
a l a |
Для простоты считаем, что множеотво допустимых |
значений у |
совпа |
||||||
дает оо всем пространством У |
. Функции Jt |
и |
J- |
дифференцируемы |
||||
по |
совокупности |
своих аргументов. Чтобы найти |
направление |
условно |
||||
го |
градиента |
функционала . X |
в окрестности |
начального приближения |
£/o&JВДжно, как это было показано в п. 7 |
. 1 , |
решить вспомогатель |
||
ную, экстремальную задачу определения |
функции |
£{{) такой, |
что: |
|
I . достигает максимума скалярное |
произведение |
градиента |
I на |
.. год
2. |
Скалярное произведение градиента аУ (Т* ) |
на £{{.) для любо |
|
го |
равно |
нулю |
|
|
т |
|
|
J |
У>/ШЛ) |
( я м ) |
|
3. |
Норма |
функции ъ(Ъ равна единице |
|
Нормировать ^ ( 1 ) можно по-разному. Чаще воего испольвуют квадратичную норму
Здесь К - размерность вектор-функции Каждое из этих выражений является функциональным аналогом
формул (7.5), (7.3) и (7Л) соответственно. Найдя направление условного градиента, переходят к следующему приближению
Таким образом,решение исходной задачи сводится к последователь ности вспомогательных экстремальных задач, линейных относитель но искомой вектор-функции £(-t) с условием нормирования (21.5).
Размерность же вектора равна размерности После несколь ких шагов необходимо минимизировать возникающую невязку в уравне нии связи (21.2), потребовав
3 |
X, |
о |
|
|
|
и решив |
численно эту |
задачу |
с начальным |
приближением ^ j ( 4 ) , ко |
|
торое мы нашли после |
первой |
серии поиска |
по методу проектирования |
||
градиента. |
|
|
|
|