Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Системы экстремального управления

..pdf
Скачиваний:
10
Добавлен:
19.11.2023
Размер:
33.28 Mб
Скачать

при этом способе оценки градиента принимают вид

*(iv+i) = *(*) +

д-я [Q {x N +

gei) -

 

Q ( X N - . * * ) ] ,

\

^ +

% l Q ( X * +

gen) -

Q

( X N ~ gen)1,

]

(15.1.11)

где

*aN

Рассмотрим особенности поведения поиска по методу градиента при оптимизации объектов различного рода.

Прежде всего, напишем уравнение траектории поиска по методу градиента. Пусть все частные производные опре­ деляются за промежуток времени At. Тогда можно запи­ сать коиечноразностное вектор­

ное уравнение:

H = _ agradÇ, (15.1.12)

которое при малом а и при Дг-»-0 переходит в дифференциальное уравнение вида

^ = - a grad Ç (X). (15.1.13)

Рис. 15.1.2. Шаговая и непрерывная траектории по- иска по методу градиента,

На рис. 15.1.2 показаны траектории, соответствующие конечноразностному и дифферен­

циальному уравнениям поиска. Эти траектории довольно близки, а при малых значе­ ниях параметра а они практически совпадают. Это озна­ чает, что поведение объекта при поиске по методу гра­ диента при малом а можно изучать при помощи диффе­ ренциального уравнения (15.1.13).

А это уравнение линии градиента, которая всюду ортогональна поверхностям равного уровня объекта. Таким образом, траектория градиентного поиска близка к градиентной кривой, чего, собственно, и следовало ожи­ дать. При больших значениях параметра а траектория поиска может значительно отличаться от линии градиента.

Рассмотрим линейный объект

Q(X) = Q0 + 1Х ,А ),

(15.1.14)

где А = (ах, а2, ., ап). Определим градиент одним из способов (например, первым) в точке Х0. Получаем для частных производных

/\

 

= \

+ **i), М - [*о, А}} = Oi (I = 1 , 2 , ... , п \

 

(15.1.15)

Следовательно, вектор А является градиентом линейного поля, образуемого функцией (15.1.14). Таким образом, в линейном поле градиент определяется точно, независимо от значения величины пробного шага g.

Обратимся к квадратичному объекту. Рассмотрим

сначала одномерный

объект

 

Q (ж) =

Q* + к(х * )2.

(15.1.16)

Оценим градиент этой функции в точке х методом гра­

диента

с центральной

пробой. Оп равен

ч

 

 

 

-jg" = j

[* (* + g — x*Y — к (х — ж*)2] =

к [2 (ж — ж*) + g).

 

 

 

(15.1.17)

Точное

же значение градиента имеет вид

 

g

= 2fc ( * - * • ) .

(15.1.18)

Выразим оценку градиента (15.1.17) через его точное значение (15.1.18);

# = ^ + (15.1.19)

Как видно, оценка градиента отличается от точного зна­ чения на величину kg. Это приводит к тому, что при

— <С

оценка будет ошибочна не только по вели­

чине, но и по

знаку.

Направление рабочего шага по

методу

градиента

в

этом случае будет противоположно

тому,

который в

действительности следует делать. Это

происходит из-за того, что, находясь на расстоянии ближе чем g/2 от цели и делая пробный шаг g, мы «перескакиваем»

 

 

 

 

цель и оказываемся в состоя­

 

 

 

 

нии х

g с большим

значе­

 

 

 

 

нием

показателя

качества,

 

 

 

 

нем исходное.

 

 

 

 

 

 

 

Ыарис. 15.1.3показано по­

 

 

 

 

ведение производной (сплош­

 

 

 

 

ная линия) и ее оценки (пунк­

 

 

 

 

тир). Заштрихована зона, где

 

 

 

 

оценка приводит

к ошибоч­

Рис. 15.1.3. Соотношение меж­

ному

шагу — здесь

знаки

производной

и

ее

оценки

ду градиентом

и

его оценкой

разные.

 

 

 

с центральной

 

пробой

для

Теперь рассмотрим дву­

квадратичного объекта.

ределяемую

квадратичной

мерную систему (п =

2 ), оп-

фупкцией качества вида

< ? = < ? * + йп Х2 +

- ■0 2 2 ^ 2

+ ЬхХх + Ь2х2. (15.1.20)

Составляющие

градиента в

этом

случае

имеют

вид

 

 

0 ^- — 2 а1 1 а;1

-f- aXix2 + by,

 

(15.1.21)

 

 

=

2ai2x2+

-j- 6 2,

 

 

 

 

 

 

a их оценки по методу градиента с центральной пробой равны

2а1хх1+ а-\гхг + bi + ang,

(15.1.22)

яГГ — ЯйгъРг + о,\гхх + Ь2+ аъч8*

и, выражая оценку (15.1.22) через точные значения (15.1.21), получим

Как видно, полученные оценки смещены на постоянную величину, которая не зависит от состояния (а^, х2), где оценивается градиент.

Определим эффективность полученных оценок. Будем определять эту эффективность косинусом угла между век­ торомградиента grad Q(ajx, х2)

и его оценкой

grad <?(xl t :r2) = (-Ц-, Щ (15.1.24)

(рис. 15.1.4). Этот косинус равен

созФ= - [jP dQ-.grad Q) т [grad Q|-| grad Q |

(15.1.25)

При — у < ф < у оценку бу­

Рис. 15.1.4. Соотношение меж­ ду градпентом и его оценкой с центральной пробой в дву­ мерном случае для квадратич­ ной формы.

дем считать эффективной (при условии, что величина а выбирается достаточно малой,

поиск будет приводить к уменьшению показателя каче­

ства). В противном случае, когдау < ф

, движение

в направлении антиградиента всегда увеличит показа­ тель качества, т. е. градиентный поиск пе работает.

Определим условия, при которых оценка эффективна. Уравнение границы, на которой cos ф = 0, имеет вид

(te-)*+ ( И ) * + « а» &

+

= °-

(15.1.26)

В пространстве частных производных

это окружность с

радиусом-^- V а\х + а|2 и с центром в точке ^

.

Она показана на рис. 15.1.5. Внутри этой окружности оценка градиента неэффективна. При g — 0 окружность

стягивается в точку

дО дО

Л

 

0.

Определим зону неэффективности оценки в простран­ стве параметров {хг, х2}. Для этого достаточно подставить в (15.1.26) выражения частных производных (15.1.21).

Получаем уравнение границы в виде

(4ац -J- а12) х I

(4а22 4“ Я12) # 2 Ч" 4а12

(#ц

Ч~ Д22) ^1 ^ 2

Ч~

Ч~

Ч~ 2а12&

Ч~ fffl2 2 fti2

Ч-

 

Xj -j-

 

4“ (4я2 2 52 Ч" 2 л1 2 6 1 -J-

 

Ч" 2 ^ 22) ^ 2

Ч"

Ч" ^ 2

Ч"

 

4“ éf (^н

Ч~ ^2 2 ^2 ) =

0 .

(15 1.27)

Это — уравнение эллипса,

проходящего

через

экстре­

мум функции качества (15.1.20). На

рис.

15.1.6 показан

Рис. 15.1.5. Зона

про­

Рис. 15.1.6. Зона пространства

странства градиентов, в

параметров, где оценка гради­

которой

градиент

будет

ента с центральной пробой не­

оценен

неэффективно.

эффективна.

пример зоны неэффективной оценки (она заштрихована).

При g -> 0 эта зона стягивается к экстремуму (х[, х2). Для иллюстрации показаны градиент и его оценка для точек внутри зоны. Хорошо видна неэффективность оценки

внутри

зоны.

 

 

 

 

 

 

Рассмотрим теперь многомерный случай. Уравнение

квадратичного

объекта имеет

вид

 

 

 

 

Ç ( X

П

П

 

71

 

 

 

)= <?* + Г 2 * ,

3

е д

+ 3

ЬЛ 1.

(15.1.28)

 

 

4 = 1

J = 1

i = l

J

 

Его частные производные

 

 

 

 

 

 

П

 

 

 

 

 

 

g” =

2 (a ij aji) xj~i~

 

(i =

1, • .

ri).

(15.1,29)

M

Оценки частных производных, выраженные через точные значения:

А

dQ .

 

 

 

dQ_

(1 =

1 , ... , п).

(15.1.30)

дщ

 

 

 

 

 

Эффективность этой оценки, как и ранее, при п = 2 будем определять косинусом угла между градиентом и его оценкой (15.1.25). Граница зоны, где этот косинус равен нулю, определяется уравнением

1д г +1*а|,^ =о-

<15л-з1)

В пространстве частных производных ||^ - | это уравнение определяет гиперсферу с радиусом

 

Л - И Д - ь Г

(15.1.32)

и с центром в точке с координатами

 

 

(г =

1.........и).

(15.1.33)

Сечение этого пространства

плоскостью

= 0, где

i = 3, 4,

., п, показано на рис. 15.1.5.

При g -> 0

гиперсфера

стягивается в точку экстремума.

Таким образом, рассмотренная выше шаговая оценка градиентного направления с центральной пробой эффек­ тивна не при всех значениях управляемых параметров X. В непосредственной близости от цели X* имеется зона, где шаговая оценка приводит к грубым ошибкам. Попа­ дание в эту зону всегда приводит к увеличению показа­ теля качества, т. е. к расстройке объекта.

Теперь рассмотрим эффективность оценки с парными

пробами (15.1.10)

на квадратичном объекте (15.1.28).

После очевидных

преобразований получаем

А

 

(15,1.34)

т. е. оценка градиента с парными пробами всегда не только эффективна, но и точна в любой точке пространства параметров и при любых значениях пробного шага. Это очень ценное свойство оценки с парными пробами широко используется для работы с объектами типа квадратичной формы, хотя за это и приходится «платить» удвоением числа проб.

§ 15.2. Работа метода градиента при наличии ограничений

Ограничения, накладываемые на оптимизируемые параметры, как сказано в § 1 1 .1 , имеют двоякий характер. Ограничения первого рода имеют вид равенств

gi (^1 >

• • , Я'л) ■ 9 (ï — 1, . ., /с

/î), (15.2.1)

где функции gi (•) могут быть заданы аналитически или же быть выходами объектами типа «черный ящик».

Ограничения второго рода представляют собой нера­ венства

(^i» •> ^п) ^ 0 (/ = 1, . . ., р), (15.2.2)

которые также могут быть выходами объекта или заданы в виде аналитических выражений.

Одним из простейших способов учета ограничений в процессе поиска может быть метод штрафных функций, описанный в § 12.3. Однако этот метод при ограничениях типа равенств приводит к появлению оврагов функции качества, что практически исключает применение градиент­ ного метода (подробнее об этом см. главу 19). Поэтому при градиентном методе поиска в. обстановке ограничений функции штрафа обычно не применяются.

При ограничениях второго рода (15.2.2) применение градиентного метода не столь затруднительно. В этом случае при нарушении ограничений следует оптимизацию производить не по функции качества, а по нарушенным

ограничениям [15.1], т. е. минимизируя сумму 2

(X),

к

 

где суммирование ведется по к нарушенным ограничениям (к ^ р). Такой способ эквивалентен минимизации новой функции качества без ограничений, которая образуется

путем переключения следующего вида:

Q(X)

при

& j(X)> 0

( / = 1 , •»

9(Х ) =

(Х) ПРИ

(Х) <

°-

— S

 

 

 

(15.2.3)

Блок-схема реализации такого метода показана на рис. 15.2.1, где блок управления В У определяет вид мини­ мизируемого показателя качества. При выполнении всех

Рис. 15.2.1. Блок-схема реали­

Рис.

15.2.2. Работа градиент­

зации

градиентного метода

ного

поиска при ограничении

с

переключениями.

второго рода методом переклю­

 

 

 

чения.

ограничений минимизируется показатель качества объек­ та. А при нарушении хотя бы одного ограничения мини­ мизируется выход этого ограничения за допустимую границу. На рис. 15.2.2 показан пример применения метода градиента при наличии ограничений второго рода. Хорошо видно, что процесс оптимизации происходит путем своеобразных покачиваний (галсов) относительно поверхности нарушенного ограничения. Очевидно, что такой процесс не очень эффективен. Это обстоятельство и необходимость работать с ограничениями типа равенств заставляют обращаться к методу проецирования градиента.

Смысл этого метода сводится к проецированию век­ тора градиента на ограничения и движению объекта в на­

правлении,

обратном

этой проекции.

Определим сначала проекцию произвольного вектора

Y — {ух%

уп) на

ограничение g (X ) = 0, заданное

в аналитической форме (рис. 15.2.3). Градиент этого огра­ ничения равен

g r a d g ( X ) = ( m g l ,

 

8g(X)

(15.2.4)

дхп

 

 

 

Очевидно, что проекция Z вектора

Y

на ограничение

g (X ) = 0 ортогональна градиенту (15.2.4), т. е.

[Z,

grad g (X )] =

0,

 

(15.2.5)

но в силу линейной зависимости

 

 

 

 

Z =

Y + a grad g (X ),

 

(15.2.6)

где а —неизвестный параметр,

который легко опреде­

 

ляется

после

наложения усло­

 

вия ортогональности (15.2.5):

а =

Получаем

[У, grad g (Z)]

(15.2.7)

I grad (ЛГ) I2

 

 

 

Z = Y + [F,

dir grad g (X)l X

Рис. 15.2.3. К

методу про­

X dir grad g (X ). (15.2.8)

Рассмотрим далее проекцию век­

ецирования градиента.

£i (X ) — 0 и

g2 (X) = 0.

тора Y на два ограничения

Очевидно, что

в этом случае

следует процедуру проецирования произвести два раза: сначала получить Z1 —проекцию Y на первое ограниче­ ние, а затем Z2 —проекцию Zx на второе ограничение:

ZX= Y + [Г,

dir grad gx] dir grad glt

Z2 = Zx + [Z1}

’I (15.2.9)

dir grad g2] dir grad g2

Теперь, подставляя первую формулу во вторую, получим окончательное выражение для проекции вектора Y на оба ограничения:

Z2 = Y -f- [Y, dir grad gx] dir grad gx + [Y", dir grad g2] X X dir grad g2 + [IF, dir grad gjdir grad gx, dir grad g2]X X dir grad g2. (15.2.10)

Совершенно аналогично можно получить проекции произвольного вектора на любое число ограничений типа равенств.

Теперь используем эти выражения для организации работы метода градиента в обстановке ограничений обоего рода (по-прежнему заданных аналитически). Алгоритм оптимизации в этом случае имеет вид

X N+I = X N — a grad Q (X N), (15.2.11)

где

grad Q (X)

— проекция

градиента

показателя каче­

ства

grad Q {X)

на ограни­

чения, которые

нарушены.

Например,

при

наруше­

нии /-го ограничения первого рода g) (X) Ф О имеем

Рис. 15.2.4. Работа проекцион­ ного градиентного метода на ограничениях второго рода.

grad Q (X) = grad Q (X) + [grad Q {X), dir grad gj (X)] X X dir grad gj (X)). (15.2.12)

Если же нарушено /с-е ограничение второго рода, т. è. М * ) < 0, то

grad Q (X) = grad Q (X) + [grad Q (X), dir grad hk (X)] X X dir grad kh (X). (15.2.13)

Здесь мы воспользовались той же формулой, что и для ограничения первого рода. Это вполне естественно при движении градиентным методом, так как при нарушении ограничений (15.2.2) в этом случае следует двигаться вдоль поверхности h (X) = 0 (рис. 15.2.4).

Теперь рассмотрим поиск для случая, когда ограни­ чения определены не аналитически, а являются реализа­ циями выходов объекта типа «черного ящика». Для того чтобы воспользоваться полученными выражениями (15.2.12) или (15.2.13), необходимо уметь оценивать гра­ диент ограничений по точечным замерам, т. е. векторов

grad gj (X), grad hk (X). Это можно сделать обычных образом —путем пробных шагов вдоль координатным