Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Цирлин, А. М. Основы оптимального управления конспект лекций

.pdf
Скачиваний:
9
Добавлен:
19.10.2023
Размер:
6.17 Mб
Скачать

2f"2. Аналог метода Ньютона для определения условного макси­ мума -

Рассмотренный в предыдущей пункте подход использовал условный градиент функционала I , движение осуществлялось малыш шагами вдоль направления градиента. Скорость сходимости таких методов обычно невелика, особенно в окрестности максимума, когда величина градиента мала. В задачах нелинейного программирования для уско­ рения сходимости используют те или иные разновидности алгоритма Ньютона, смысл которого состоит коротко в том, что целевая функция аппроксимируется квадратичной формой, а уравнения связи, как и в методе проектирования градиента, линеаризуются. Затем решается вспомогательная задача о минимуме квадратичной функции при линей­

ных связях. Величину шага уже не приходится выбирать. Решение

и-

воломогательной задачи ^

дает очередное приолижение.

Иногда,

правда,

оходимость улучшается, е оли

очередное

приближение

выби­

рается

о "недоходом", т . е . движение

осущес'хвляеюя не в точку ми-

шшуме,

а по направлению к ней,в точку,

отстоящую от начального

приближения на некоторую

долю К (к=0,5

* 0,8)

расстояния

д о ^ * *

Аналог этого метода часто используют и в задачах о максимуме-

Функционалов

C ^ ' J -

Пусть вектор-функция

удовлет­

воряет

набору

связей (24t2). Приложим

 

 

 

подставим э*о выражена*: в функцию J-0 и упростим ее, разложив в ряд Тэйлора в окрестнооти i^(-i)' и удержав лишь квадратичные слагаемые этого ряда* То же проделаем и о каждой из составляющих

функции J-,'однако, ограничимся для них лишь

линейным приближением,

«ункциояалн I и CJ примут вид; I » K y J

%(ФУ(ЪЧ)*&3(тМ

причем

Л I

квадратичный, а

& £3

- линейный

функционал.

Так как

о /

( ^ а

) =

О и

находят среди допустимых

функций,

то

 

 

 

 

A Zlfc^J^

0,

 

 

 

(21.6)

• и

задача

сводится к

определению

вектортфункции

1 ^ , доставляющей

максимум

функционалу

A l

( V

)

при условии

(21.6). Очередное

приближение

находим

по формуле

 

 

 

 

 

 

где К - положительное число

меньшее

единицы

(коэффициент

"недо­

хода") . Читателю предоставляется показать, что

для связей

в фор­

ме

дифференциальных

уравнений

условия

(2/.6)

оказываются

линейны­

ми дифференциальными уравнениями с линеаризованными краевыми усло­

виями. Очень близок к этому подходу

кетод квааилинеаризации

( 3

j ,

предложенный Беллманом.

Им же получены условия

сходимости

для

от­

дельных

случаев,

впрочем,довольно

жесткие.

 

 

 

 

 

 

21,3.

Аналог

способа

вычисления

условного

градиента с

 

 

 

 

 

использованием

множителей

Лагранжа.-

 

 

 

 

 

 

Как это неоднократно делалось в

предыдущих

параграфах,

разобь­

ём все составляющие решения на зависимые »У(4)

 

и свободные

 

U(4)

 

так,чтобы первые из них определялись условиями

(24.2) при

подста­

новке в

последние K(-t). Пусть »У0(4) и U,(4)

-

начальное

прибли­

жение, удовлетворяющее'связям. Выберем вектор-функцию^ (4>

так,

чтобы подинтегральное выражение

£

функционала

Лагранжа

AS

было

стационарно по

в окрестности

начального приближения.

Получим

 

где

производные вычисляют при ^Х=У0; U = K 0 .Свободные составляю­

щие

решения разобьем,в свою очередь,на составляющие 1 ( с , по ко-

 

 

 

 

212

 

 

 

 

 

 

 

торым

задача

сингулярна, и составляющие

Ц р ,

по которым она регу­

 

лярна. По первым из них

находим

градиент

Q

в окрестности началь-"

ного

приближения V U t Q

и делаем шаг вдоль этого направления.

 

По регулярным составляющим, на первый взгляд, можно искать мак­

 

симум

R.

на

множестве

\Дд.р и *

Допустимых

аначений и переходить

 

в эту

точку. В действительности

это

не

так.

Не только новое управ-*

ление Up, ("£),найденное

таким путем, будет

отличаться от Wpo(-t)

 

на конечную величину, но и соответствующие ему эавиоимые

составляй

щие t X (

{{).

Между тем

вычисление

jj

(

•{

) ив условий

(2/.?)

 

гарантировало

стационарность fS

по

 

лишь поблизооти

от

.

Поэтому при таком выборе алгоритм в общем случае приводит к расхо*

дящейся процедуре. Чтобы улучшить сходимость, выбирают вместо ( / *

новое

значение

р (

(4)

по формуле:

 

 

 

 

а величину Е находят

таким

образом,

чтобы

после

подстановки

в уравнения связей и определения Xj

выполнялось

условие:

 

Таким

обраэом,в

начальной

точке ^„(4)

{ - У о , 1 ^ ^

 

определяются

t .// ft)

из условия (;2/.}0.

По ним находится новое

значение

Hj( - t),

сингулярные составляющие которого изменяются пропорционально

градиенту,, а-регулярные-по

условиям

 

(2.1.9).

Затем

из

уравнений связей

(2/. 2) определяются Xt(-k)

и т . д .

Такой

подход

для

задач со связями в форме дифференциальных уравнений предло­

гов

И.А.Крыловым и Ф.Л.Черноусько £ 4 6 ). Применительно.к

системам, содержащим дифференциальные уравнения и конечные соотношения такого типа,алгоритмы развиты в работах Г.М.Остров­ ского и Ю.М.Волина {. 1*3 J .

213

21.4. Использование штрафных функций..

Методы,использующие функции штрафа,для замены задачи условного

иаксииуиа

задачей безусловного ыаксинуиа 1; как правило, редко

позволяют

найти решение £f*(~k) точно. Но

по

величине

функционала полученное приближение оказывается чаото вполне

удовлетворительный. Образуем

функционал

 

 

где _//(^"J>0, а функционалы

I и У (tr) соответствуют

выражениям

(2./.I) и (2(f.2). Будем искать безусловный макоимум этого функцио­

нала п о ^ ( { ) , например,

методом градиента. Для многих видов задач

докааано

£ , 1?

3» ч т о

при росте

JI (х)

полученное решение

стремится к решению задачи

( 2 i . I )

и {2.1.2). Практически по мере

решения

задачи на ЦВМ выводят на печать

значение I

) и

величину

максимальной ординаты £f ( Т

) . По характеру измене­

ния этих

кривых

при увеличении Л

( t ) можно

выбрать'момент

окончаний счета.

 

 

 

 

 

 

 

 

 

2/.5. Аналог

алгоритма поиска оедловой точки

функции

 

 

 

Лагранжа..

 

 

 

 

Так как решение

задачи

(21 Л ) ,

(21.2)

является

оедловой точкой

функционала Лагранжа

£

,

в которой этот функционал максимален

по ^-(4)

и минимален

n O i / / ( T ) , то для поиска

уоловного макси­

мума может быть

использован алгоритм, подобный

изложенному в

 

 

 

 

 

 

 

 

 

 

i

п . 7 . 3 . Аналогично формулам (7.9), (7.10) подучим для данной задачи выражения

. т-

214

Функции ^(^.J и ) положительны. Их выбор не только влия­ ет на скорость оходимости, но и позволяет учесть некоторые усло­

вия задечи. Так, е с л и ^ ( О )

и Ц

СТ ) фиксированы,

то

доста­

точно взпть^Ц - ), проходящим через

эти точки, а Ъ\(р)-\

(Т)=0.

Мы не останавливались на

деталях алгоритмов, выборе

их

рабо­

чих параметров, доказательстве сходимости и оценке скорости схо­

димости.

Не рассматривали и условия

типа

(24.2) в форме нера­

венств.

Некоторые из этих вопросов нетрудно учесть в

процессе

решения

конкретных

задач, другие

подробно

и тщательно

разобраны

в соответствующей

литературе С

А

1, С

 

t

ореди которой стоит особо выделить превосходную книгу Н.Н.Моисе­ ева.

В этом параграфе нам хотелось лишь подчеркнуть общность идей, лежащих в основе численных методов максимизации функций и функ­

ционалов^

дать возможность читателю с использованием

таблиц

1 5 . I , 15.2

самостоятельно записать численную процедуру

решения.

Упражнения.

1 . Конкретизировать алгоритм п.21.2 для задачи о максимуме функ­ ционала Г

о

со связями в форме нелинейного интегрального

уравнения.

2. Для функционала

 

 

 

7~ - та/

rni.Lrb J0

fX

и связей в форме дифференциальных уравнений

записать алгоритм

поиска решения

п. 21.3.

 

 

3. Для той se

задачи составить

функционал

/ V , записанный .

в п.21.4.

 

 

 

US

§ 22. О корректности постановки оптимальных аалач и ах регулядизации

Задачу естественно назвать корректно поставленной, если уоловия задачи однозначно определяют ее решение и последнее сущеотаует. Иначе говоря,должны быть выполнены требования суще­

ствования, единственности и устойчивости решения,

'

Не Оудем останавливаться на вопросе о существовании

решения,

так как обычно физический смыол задачи, еоли он не утерян при переходе к модели, гарантирует существование решения. Условие единственности связано с числом элементов множества!), в которых макоиыизируемый функционал достигает максимума. Ниже для просто­ ты будем считать, что оно выполнено.

Требование устойчивости состоит в том, чтобы при малых измене­ ниях условий задачи столь же мало менялооь и решение. На этом требовании остановимся подробнее. Здеоь можно выделить fpu основ­ ных вопроса.

1. Опасна ли неустойчивость решения?

2. Если да, то как узнать корректна ли поставленная перед нами задача?

3.Если задача оказалась некорректной,то как превратить ее в корректную (провести регуляризацию)? Обсудим оущео'л'во

каждого из этих

вопрооов.

 

 

 

Экстремальные

задачи можно разбить на две большие

категории.

I.Задачи, целью решения которых является величина

иаксишгзнру-

емого функционала Л

. Если в

окрестности оптимального решения

эта

величина мало чувствительна

к его изменениям, тем лучше.Зна-'

Ч Е Т

при

практической

реализации

найденного режима

неизбежные по»

рошности

не приведут

к большим потерям. Решение же

ней

216

не

очень важно. В подооных задачах устойчивость решения

часто

не

играет большой роли, так как палые изменения условий

задачи

и погрешности вычислений, даже сильно меняя решение, почти не влияют на максимальное значение функционала. Иначе говоря, бли-

аооть

решения Uj к

V,

определяется

разностью между максиму­

мом I

и I ( UA

).

А эта'метрика'как

правило,оказывается

слабой.

П. Задачи, в которых функционал есть

лишь индикатор

правиль­

ности

найденного

решения.

Условия такой

задачи можно--тракто­

вать, как некоторое устройство отбора, которое отсеивает перво­ начально значения переменных, не отвечающие ограничениям и свя­ зям, а затем из отооранных выделяет то сочетание переменных, для которого функционал максимален. Раоотавт это устройстве, к сожалению, не всегда идеально. Между тем для задач второй груп­ пы требуется именно устойчивость решения как к неизбежным иска­

жениям исходных данных, так и к вычислительным

погрешностям.

 

Близость

двух

решений

оценивается здесь равномерной "метрикой"

 

Уоловия,

гарантирующие корректность

задачи,

обычно

проверить

д о ­

вольно трудно

£

8

3*

Часто для

ответа на

вопрос

о

коррект­

ности постановки

задачи,

имея в виду

вычислительный

аспект,

дос­

таточно

воспользоваться

такими соображениями.

 

 

 

 

 

Пусть Kj U;) - решение, удовлетворяющее связям и доставляю­

щее функционалу I некоторое значение I ( Ut

).

Если

можно

найти

семейство решений 1L^(+), которые в равномерной "метрике" отли­

 

чаются от ^/((-fc) на конечную величину, причем уравнение связи

 

нарушается на

бесконечно

малую величину, и

разность I

( U.^

) -

I (

А

) по модулю также сколь угодно мала,

то

задача

постав­

лена

некорректно.

 

 

 

 

 

 

 

 

 

 

 

217

 

 

 

Приведем

в качестве примера

задачу определения характеристики

объекта по данным эксперимента.

Известен

экспериментально получен­

ный

очгнал

на выходе линейного

объекта

и сигнал, поданный

на

его вход

J^C-i). Требуется подобрать .чмпульсную характеристику

К

( - t , T )

так, чтобы функционал

 

 

 

о

 

 

был минимален, если

о

При численном решении механизм отбора, реализующийся на машине, par ботает с определенной погрешностью. Как уравнения связи, так и условия максимума функционала могут быть проверены машиной лишь о определенной точностью. И во многих случаях оказывается, что бесчисленное множество решений удовлетворяют и тому и другому у с ­ ловию. Погрешности в вычислительной процедуре приведут к получению

любого

решении из

 

(-i). Так, задача

определения К ( " t j t )

по

данным

эксперимента

не корректна, ибо любая из функций

 

 

 

 

 

=

1С, G r . t j + c U ^ & A . u ^

,22.4)

при достаточно большом

СО

и конечном d

доставляет функционалу

I Г и правой

части

уравнения

(22.2)

с точностью до <£ то же самое

значение,

что и

Kj

(

) .

Это связано

со сглаживающим

характе­

ром оператора свертки в (22.2) и интегрирования в (22.1)

и (22.3).

То же может наблюдаться

и в задаче

с конечномерным решением,

когда

изменение

одного

из

искомых переменных

можеа1 быть сколь

угодно

точно компенсировано изменением других переменных. Геомэтрически это означает,'что значения максимизируемой функции для некоторого

.конечного подмножества в пространствеX практически не отличаются.

22.2.. Некорректность по регулярный состцвляюшим решения Задача может быть корректна по одним и некорректна по другим

составляющим решения. Рассмотрим задачу оптимизации со связью, заданной в канонической форме

о

Здесь подинтегральное выражение функционала связи разбито на ре­

гулярную

и

сингулярную

части. Через

Х(4

~) обозначены

те

состав­

ляющие решения, которые входят как в

,

так

и г

/ г .

Состав­

ляющие

ве "U (t)

входят

только в регулярную-часть

подинтегрального

выражения функционала связи. По терминологии, принятой в § \Л ,

задача

регулярна

по

1А_

и сингулярна по

У

. Регулярность

вада-

чи по

U ( 4)

позволяет

испольаовать

для

линеаризации функционалов

I

и £fC£"

)

по

1L

скользящий

режим и расширить

множество

допусти

мах функций сравнения. Однако она же приводит к

некорректности за­

дачи

по

lL(h.

Действительно,

изменения

К (4)

конечные

по мо­

дулю,

но достаточно

высокочастотные

(аналогично

(22,ч))

сколь

угодно

мало

 

повлияют

на

величину

I

и

Cf(

Т" ) . Таким образом, ес­

ли задача

относится

ко

второму

из упомянутых выше

типов задач,

2 0

при постановке -(22.5),

 

(22 - 6)

нельзя

гарантировать

получение

устойчивого

 

решения

1-L*(

\_ ) . Между

тем

по

X

(4)

задача может

•быть корректна.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Устойчивости решения зависит и от вычислительных алгоритмов. Еоди, к примеру, о использованием условий оптимвльнисти решение введено к нахождению чиоловых значений некоторых параметров, каждый иа которых существенно влияет на величину функционала, то оно может оказаться устойчивым. Так, задачу со связями в форме

2/9

 

 

 

дифференциальных уравнений, линейную по X

и

U .

, условия

принципа максимума сводят к нахождению моментов

переключения ог­

раниченного управления. Задача оказывается

корректно

поставленной.-

• 2 2 . 3 . Регуляризация

 

 

 

Таким ооразоы, неустойчивость решения,как правило, связана с малой чувствительностью задачи (уравнений связи, ограничений, мак­ симизируемого функционала) к изменению решения на некотором под­ множестве допустимых решении Jl^ .Чтобы постановка аадачи была кор­ ректна (обеспечивала получение устойчивого решения), ее прихо­

дится изменять. Обычно такие изменения связаны с сужениен множе­

ства Л »

проводимым с учетом тех свойств,

которыми

должно

обладать

решение.

 

 

Например, если известно, что решение U

(I) не должно быть раз ­

рывным,,

то к максимизируемому функционалу I

добавляют

регулири-

эующее слагаемое

 

 

о

при

> 0 сумма I + 1рможет иметь максимум лишь на

множестве

кусочно-дифференцируемых дикций, ^сяи ввести связь

t o

=

то ясно, что добавление

к функционалу (22.5) переводит

К. ( {• )

в разряд тех составляющих решения, по которым задача

сингулярна.

На множестве ку сочно -дифференцируемых функций задача

может

ока­

заться

корректной по

Ч ( 1 ) <

 

 

•Сужение множества J

производят и посредством задания струк­

туры предполагаемого решения. Так, в задаче о составлении

модели

объекта по данным эксперимента, задание структуры

обвекта

приводит

к конечномерной задаче о нахождении коэффициентов

модели. Причем,

чем меньше искомых коэффициентов, тем больше шансов, что

полу-