книги из ГПНТБ / Цирлин, А. М. Основы оптимального управления конспект лекций
.pdf2Ю
2f"2. Аналог метода Ньютона для определения условного макси мума -
Рассмотренный в предыдущей пункте подход использовал условный градиент функционала I , движение осуществлялось малыш шагами вдоль направления градиента. Скорость сходимости таких методов обычно невелика, особенно в окрестности максимума, когда величина градиента мала. В задачах нелинейного программирования для уско рения сходимости используют те или иные разновидности алгоритма Ньютона, смысл которого состоит коротко в том, что целевая функция аппроксимируется квадратичной формой, а уравнения связи, как и в методе проектирования градиента, линеаризуются. Затем решается вспомогательная задача о минимуме квадратичной функции при линей
ных связях. Величину шага уже не приходится выбирать. Решение
и-
воломогательной задачи ^ |
дает очередное приолижение. |
Иногда, |
|||||
правда, |
оходимость улучшается, е оли |
очередное |
приближение |
выби |
|||
рается |
о "недоходом", т . е . движение |
осущес'хвляеюя не в точку ми- |
|||||
шшуме, |
а по направлению к ней,в точку, |
отстоящую от начального |
|||||
приближения на некоторую |
долю К (к=0,5 |
* 0,8) |
расстояния |
д о ^ * * |
|||
Аналог этого метода часто используют и в задачах о максимуме- |
|||||||
Функционалов |
C ^ ' J - |
Пусть вектор-функция |
удовлет |
||||
воряет |
набору |
связей (24t2). Приложим |
|
|
|
•подставим э*о выражена*: в функцию J-0 и упростим ее, разложив в ряд Тэйлора в окрестнооти i^(-i)' и удержав лишь квадратичные слагаемые этого ряда* То же проделаем и о каждой из составляющих
функции J-,'однако, ограничимся для них лишь |
линейным приближением, |
«ункциояалн I и CJ примут вид; I » K y J |
%(ФУ(ЪЧ)*&3(тМ |
причем |
Л I |
квадратичный, а |
& £3 |
- линейный |
функционал. |
Так как |
|||||||
о / |
( ^ а |
) = |
О и |
находят среди допустимых |
функций, |
то |
|||||||
|
|
|
|
A Zlfc^J^ |
0, |
|
|
|
(21.6) |
||||
• и |
задача |
сводится к |
определению |
вектортфункции |
1 ^ , доставляющей |
||||||||
максимум |
функционалу |
A l |
( V |
) |
при условии |
(21.6). Очередное |
|||||||
приближение |
находим |
по формуле |
|
|
|
|
|
|
|||||
где К - положительное число |
меньшее |
единицы |
(коэффициент |
"недо |
|||||||||
хода") . Читателю предоставляется показать, что |
для связей |
в фор |
|||||||||||
ме |
дифференциальных |
уравнений |
условия |
(2/.6) |
оказываются |
линейны |
ми дифференциальными уравнениями с линеаризованными краевыми усло
виями. Очень близок к этому подходу |
кетод квааилинеаризации |
( 3 |
j , |
||||||||
предложенный Беллманом. |
Им же получены условия |
сходимости |
для |
от |
|||||||
дельных |
случаев, |
впрочем,довольно |
жесткие. |
|
|
|
|
|
|
||
21,3. |
Аналог |
способа |
вычисления |
условного |
градиента с |
|
|
|
|
||
|
использованием |
множителей |
Лагранжа.- |
|
|
|
|
|
|
||
Как это неоднократно делалось в |
предыдущих |
параграфах, |
разобь |
||||||||
ём все составляющие решения на зависимые »У(4) |
|
и свободные |
|
U(4) |
|
||||||
так,чтобы первые из них определялись условиями |
(24.2) при |
подста |
|||||||||
новке в |
последние K(-t). Пусть »У0(4) и U,(4) |
- |
начальное |
прибли |
|||||||
жение, удовлетворяющее'связям. Выберем вектор-функцию^ (4> |
так, |
||||||||||
чтобы подинтегральное выражение |
£ |
функционала |
Лагранжа |
AS |
было |
||||||
стационарно по |
в окрестности |
начального приближения. |
Получим |
|
где |
производные вычисляют при ^Х=У0; U = K 0 .Свободные составляю |
щие |
решения разобьем,в свою очередь,на составляющие 1 ( с , по ко- |
|
|
|
|
212 |
|
|
|
|
|
|
|
торым |
задача |
сингулярна, и составляющие |
Ц р , |
по которым она регу |
|
||||||
лярна. По первым из них |
находим |
градиент |
Q |
в окрестности началь-" |
|||||||
ного |
приближения V U t Q |
и делаем шаг вдоль этого направления. |
|
||||||||
По регулярным составляющим, на первый взгляд, можно искать мак |
|
||||||||||
симум |
R. |
на |
множестве |
\Дд.р и * |
Допустимых |
аначений и переходить |
|
||||
в эту |
точку. В действительности |
это |
не |
так. |
Не только новое управ-* |
||||||
ление Up, ("£),найденное |
таким путем, будет |
отличаться от Wpo(-t) |
|
||||||||
на конечную величину, но и соответствующие ему эавиоимые |
составляй |
||||||||||
щие t X ( |
{{). |
Между тем |
вычисление |
jj |
( |
•{ |
) ив условий |
(2/.?) |
|
||
гарантировало |
стационарность fS |
по |
-У |
|
лишь поблизооти |
от |
. |
Поэтому при таком выборе алгоритм в общем случае приводит к расхо*
дящейся процедуре. Чтобы улучшить сходимость, выбирают вместо ( / * |
|||||||||
новое |
значение |
р ( |
(4) |
по формуле: |
|
|
|
|
|
а величину Е находят |
таким |
образом, |
чтобы |
после |
подстановки |
||||
в уравнения связей и определения Xj |
выполнялось |
условие: |
|
||||||
Таким |
обраэом,в |
начальной |
точке ^„(4) |
{ - У о , 1 ^ ^ |
|
определяются |
|||
t .// ft) |
из условия (;2/.}0. |
По ним находится новое |
значение |
Hj( - t), |
|||||
сингулярные составляющие которого изменяются пропорционально |
|||||||||
градиенту,, а-регулярные-по |
условиям |
|
(2.1.9). |
Затем |
из |
||||
уравнений связей |
(2/. 2) определяются Xt(-k) |
и т . д . |
Такой |
подход |
для |
задач со связями в форме дифференциальных уравнений предло |
гов |
И.А.Крыловым и Ф.Л.Черноусько £ 4 6 ). Применительно.к |
системам, содержащим дифференциальные уравнения и конечные соотношения такого типа,алгоритмы развиты в работах Г.М.Остров ского и Ю.М.Волина {. 1*3 J .
213
21.4. Использование штрафных функций..
Методы,использующие функции штрафа,для замены задачи условного
иаксииуиа |
задачей безусловного ыаксинуиа 1; как правило, редко |
|||
позволяют |
найти решение £f*(~k) точно. Но |
по |
величине |
|
функционала полученное приближение оказывается чаото вполне |
||||
удовлетворительный. Образуем |
функционал |
|
|
|
где _//(^"J>0, а функционалы |
I и У (tr) соответствуют |
выражениям |
(2./.I) и (2(f.2). Будем искать безусловный макоимум этого функцио
нала п о ^ ( { ) , например, |
методом градиента. Для многих видов задач |
|||||||||
докааано |
£ , 1? |
3» ч т о |
при росте |
JI (х) |
полученное решение |
|||||
стремится к решению задачи |
( 2 i . I ) |
и {2.1.2). Практически по мере |
||||||||
решения |
задачи на ЦВМ выводят на печать |
значение I |
) и |
|||||||
величину |
максимальной ординаты £f ( Т |
) . По характеру измене |
||||||||
ния этих |
кривых |
при увеличении Л |
( t ) можно |
выбрать'момент |
||||||
окончаний счета. |
|
|
|
|
|
|
|
|
|
|
2/.5. Аналог |
алгоритма поиска оедловой точки |
функции |
||||||||
|
|
|
Лагранжа.. |
|
|
|
|
|||
Так как решение |
задачи |
(21 Л ) , |
(21.2) |
является |
оедловой точкой |
|||||
функционала Лагранжа |
£ |
, |
в которой этот функционал максимален |
|||||||
по ^-(4) |
и минимален |
n O i / / ( T ) , то для поиска |
уоловного макси |
|||||||
мума может быть |
использован алгоритм, подобный |
изложенному в |
||||||||
|
|
|
|
|
|
|
|
|
|
i |
п . 7 . 3 . Аналогично формулам (7.9), (7.10) подучим для данной задачи выражения
. т-
214
Функции ^(^.J и ) положительны. Их выбор не только влия ет на скорость оходимости, но и позволяет учесть некоторые усло
вия задечи. Так, е с л и ^ ( О ) |
и Ц |
СТ ) фиксированы, |
то |
доста |
точно взпть^Ц - ), проходящим через |
эти точки, а Ъ\(р)-\ |
(Т)=0. |
||
Мы не останавливались на |
деталях алгоритмов, выборе |
их |
рабо |
чих параметров, доказательстве сходимости и оценке скорости схо
димости. |
Не рассматривали и условия |
типа |
(24.2) в форме нера |
|||
венств. |
Некоторые из этих вопросов нетрудно учесть в |
процессе |
||||
решения |
конкретных |
задач, другие |
подробно |
и тщательно |
разобраны |
|
в соответствующей |
литературе С |
А |
1, С |
|
t |
ореди которой стоит особо выделить превосходную книгу Н.Н.Моисе ева.
В этом параграфе нам хотелось лишь подчеркнуть общность идей, лежащих в основе численных методов максимизации функций и функ
ционалов^ |
дать возможность читателю с использованием |
таблиц |
1 5 . I , 15.2 |
самостоятельно записать численную процедуру |
решения. |
Упражнения.
1 . Конкретизировать алгоритм п.21.2 для задачи о максимуме функ ционала Г
о
со связями в форме нелинейного интегрального |
уравнения. |
||
2. Для функционала |
|
|
|
|
7~ - та/ |
rni.Lrb J0 |
fX |
и связей в форме дифференциальных уравнений |
записать алгоритм |
||
поиска решения |
п. 21.3. |
|
|
3. Для той se |
задачи составить |
функционал |
/ V , записанный . |
в п.21.4. |
|
|
|
US
§ 22. О корректности постановки оптимальных аалач и ах регулядизации
Задачу естественно назвать корректно поставленной, если уоловия задачи однозначно определяют ее решение и последнее сущеотаует. Иначе говоря,должны быть выполнены требования суще
ствования, единственности и устойчивости решения, |
' |
Не Оудем останавливаться на вопросе о существовании |
решения, |
так как обычно физический смыол задачи, еоли он не утерян при переходе к модели, гарантирует существование решения. Условие единственности связано с числом элементов множества!), в которых макоиыизируемый функционал достигает максимума. Ниже для просто ты будем считать, что оно выполнено.
Требование устойчивости состоит в том, чтобы при малых измене ниях условий задачи столь же мало менялооь и решение. На этом требовании остановимся подробнее. Здеоь можно выделить fpu основ ных вопроса.
1. Опасна ли неустойчивость решения?
2. Если да, то как узнать корректна ли поставленная перед нами задача?
3.Если задача оказалась некорректной,то как превратить ее в корректную (провести регуляризацию)? Обсудим оущео'л'во
каждого из этих |
вопрооов. |
|
|
|
|||
Экстремальные |
задачи можно разбить на две большие |
категории. |
|||||
I.Задачи, целью решения которых является величина |
иаксишгзнру- |
||||||
емого функционала Л |
. Если в |
окрестности оптимального решения |
|||||
эта |
величина мало чувствительна |
к его изменениям, тем лучше.Зна-' |
|||||
Ч Е Т |
при |
практической |
реализации |
найденного режима |
неизбежные по» |
||
рошности |
не приведут |
к большим потерям. Решение же |
ней |
216
не |
очень важно. В подооных задачах устойчивость решения |
часто |
не |
играет большой роли, так как палые изменения условий |
задачи |
и погрешности вычислений, даже сильно меняя решение, почти не влияют на максимальное значение функционала. Иначе говоря, бли-
аооть |
решения Uj к |
V, |
определяется |
разностью между максиму |
|||
мом I |
и I ( UA |
). |
А эта'метрика'как |
правило,оказывается |
слабой. |
||
П. Задачи, в которых функционал есть |
лишь индикатор |
правиль |
|||||
ности |
найденного |
решения. |
Условия такой |
задачи можно--тракто |
вать, как некоторое устройство отбора, которое отсеивает перво начально значения переменных, не отвечающие ограничениям и свя зям, а затем из отооранных выделяет то сочетание переменных, для которого функционал максимален. Раоотавт это устройстве, к сожалению, не всегда идеально. Между тем для задач второй груп пы требуется именно устойчивость решения как к неизбежным иска
жениям исходных данных, так и к вычислительным |
погрешностям. |
|
|||||||||||
Близость |
двух |
решений |
оценивается здесь равномерной "метрикой" |
|
|||||||||
Уоловия, |
гарантирующие корректность |
задачи, |
обычно |
проверить |
д о |
||||||||
вольно трудно |
£ |
8 |
3* |
Часто для |
ответа на |
вопрос |
о |
коррект |
|||||
ности постановки |
задачи, |
имея в виду |
вычислительный |
аспект, |
дос |
||||||||
таточно |
воспользоваться |
такими соображениями. |
|
|
|
|
|
||||||
Пусть Kj U;) - решение, удовлетворяющее связям и доставляю |
|||||||||||||
щее функционалу I некоторое значение I ( Ut |
). |
Если |
можно |
найти |
|||||||||
семейство решений 1L^(+), которые в равномерной "метрике" отли |
|
||||||||||||
чаются от ^/((-fc) на конечную величину, причем уравнение связи |
|
||||||||||||
нарушается на |
бесконечно |
малую величину, и |
разность I |
( U.^ |
) - |
||||||||
I ( |
\ХА |
) по модулю также сколь угодно мала, |
то |
задача |
постав |
||||||||
лена |
некорректно. |
|
|
|
|
|
|
|
|
|
|
|
217 |
|
|
|
Приведем |
в качестве примера |
задачу определения характеристики |
|
объекта по данным эксперимента. |
Известен |
экспериментально получен |
||
ный |
очгнал |
на выходе линейного |
объекта |
и сигнал, поданный |
на |
его вход |
J^C-i). Требуется подобрать .чмпульсную характеристику |
||
К |
( - t , T ) |
так, чтобы функционал |
|
|
|
|
о |
|
|
был минимален, если
о
При численном решении механизм отбора, реализующийся на машине, par ботает с определенной погрешностью. Как уравнения связи, так и условия максимума функционала могут быть проверены машиной лишь о определенной точностью. И во многих случаях оказывается, что бесчисленное множество решений удовлетворяют и тому и другому у с ловию. Погрешности в вычислительной процедуре приведут к получению
любого |
решении из |
|
(-i). Так, задача |
определения К ( " t j t ) |
по |
|||||
данным |
эксперимента |
не корректна, ибо любая из функций |
|
|
||||||
|
|
|
= |
1С, G r . t j + c U ^ & A . u ^ |
,22.4) |
|||||
при достаточно большом |
СО |
и конечном d |
доставляет функционалу |
|||||||
I Г и правой |
части |
уравнения |
(22.2) |
с точностью до <£ то же самое |
||||||
значение, |
что и |
Kj |
( |
) . |
Это связано |
со сглаживающим |
характе |
|||
ром оператора свертки в (22.2) и интегрирования в (22.1) |
и (22.3). |
|||||||||
То же может наблюдаться |
и в задаче |
с конечномерным решением, |
когда |
|||||||
изменение |
одного |
из |
искомых переменных |
можеа1 быть сколь |
угодно |
точно компенсировано изменением других переменных. Геомэтрически это означает,'что значения максимизируемой функции для некоторого
.конечного подмножества в пространствеX практически не отличаются.
22.2.. Некорректность по регулярный состцвляюшим решения Задача может быть корректна по одним и некорректна по другим
составляющим решения. Рассмотрим задачу оптимизации со связью, заданной в канонической форме
о
Здесь подинтегральное выражение функционала связи разбито на ре
гулярную |
и |
сингулярную |
части. Через |
Х(4 |
~) обозначены |
те |
состав |
||||||||||||
ляющие решения, которые входят как в |
, |
так |
и г |
/ г . |
Состав |
||||||||||||||
ляющие |
ве "U (t) |
входят |
только в регулярную-часть |
подинтегрального |
|||||||||||||||
выражения функционала связи. По терминологии, принятой в § \Л , |
|||||||||||||||||||
задача |
регулярна |
по |
1А_ |
и сингулярна по |
У |
. Регулярность |
вада- |
||||||||||||
чи по |
U ( 4) |
позволяет |
испольаовать |
для |
линеаризации функционалов |
||||||||||||||
I |
и £fC£" |
) |
по |
1L |
скользящий |
режим и расширить |
множество |
допусти |
|||||||||||
мах функций сравнения. Однако она же приводит к |
некорректности за |
||||||||||||||||||
дачи |
по |
lL(h. |
Действительно, |
изменения |
К (4) |
конечные |
по мо |
||||||||||||
дулю, |
но достаточно |
высокочастотные |
(аналогично |
(22,ч)) |
сколь |
||||||||||||||
угодно |
мало |
|
повлияют |
на |
величину |
I |
и |
Cf( |
Т" ) . Таким образом, ес |
||||||||||
ли задача |
относится |
ко |
второму |
из упомянутых выше |
типов задач, |
||||||||||||||
2 0 |
при постановке -(22.5), |
|
(22 - 6) |
нельзя |
гарантировать |
получение |
|||||||||||||
устойчивого |
|
решения |
1-L*( |
\_ ) . Между |
тем |
по |
X |
(4) |
задача может |
||||||||||
•быть корректна. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Устойчивости решения зависит и от вычислительных алгоритмов. Еоди, к примеру, о использованием условий оптимвльнисти решение введено к нахождению чиоловых значений некоторых параметров, каждый иа которых существенно влияет на величину функционала, то оно может оказаться устойчивым. Так, задачу со связями в форме
2/9 |
|
|
|
дифференциальных уравнений, линейную по X |
и |
U . |
, условия |
принципа максимума сводят к нахождению моментов |
переключения ог |
||
раниченного управления. Задача оказывается |
корректно |
поставленной.- |
|
• 2 2 . 3 . Регуляризация |
|
|
|
Таким ооразоы, неустойчивость решения,как правило, связана с малой чувствительностью задачи (уравнений связи, ограничений, мак симизируемого функционала) к изменению решения на некотором под множестве допустимых решении Jl^ .Чтобы постановка аадачи была кор ректна (обеспечивала получение устойчивого решения), ее прихо
дится изменять. Обычно такие изменения связаны с сужениен множе
ства Л » |
проводимым с учетом тех свойств, |
которыми |
должно |
обладать |
решение. |
|
|
Например, если известно, что решение U |
(I) не должно быть раз |
||
рывным,, |
то к максимизируемому функционалу I |
добавляют |
регулири- |
эующее слагаемое |
|
|
о
при |
> 0 сумма I + 1рможет иметь максимум лишь на |
множестве |
||
кусочно-дифференцируемых дикций, ^сяи ввести связь |
t o |
= |
||
то ясно, что добавление |
к функционалу (22.5) переводит |
К. ( {• ) |
||
в разряд тех составляющих решения, по которым задача |
сингулярна. |
|||
На множестве ку сочно -дифференцируемых функций задача |
может |
ока |
||
заться |
корректной по |
Ч ( 1 ) < |
|
|
•Сужение множества J |
производят и посредством задания струк |
туры предполагаемого решения. Так, в задаче о составлении |
модели |
|
объекта по данным эксперимента, задание структуры |
обвекта |
приводит |
к конечномерной задаче о нахождении коэффициентов |
модели. Причем, |
|
чем меньше искомых коэффициентов, тем больше шансов, что |
полу- |