
книги / Системы экстремального управления
..pdfПри этом спуск производится лишь по той координате, вдоль которой модуль приращения показателя качества максимален. Для этого перед спуском необходимо опре делить приращения вдоль каждой координаты;
А<?, = Q(X + Clg) - Q ( X ) . |
(14.3.1) |
В результате п измерений показателя качества прини мается решение о спуске вдоль /-и оси, для которой
|Д@; | = max |Дф|. |
(14.3.2) |
»=i... n |
|
(Заметим, что для работы метода достаточно рассмотреть п — 1 приращение показателя качества, исключив при этом направление, вдоль которого производился преды дущий спуск.) Такое поведение будет стимулировать лишь такие движения системы, которые наибольшим об разом снижают показатель качества, т. е. повышают эффективность оптимизации. Однако такое повышение эффективности получено за счет дополнительных потерь на оценку частных производных.
Легко представить, что возможны случаи, когда общий баланс может оказаться не в пользу релаксационного метода. Поэтому естественно определить условия, которым должен удовлетворять объект, чтобы применение релак сационного метода было оправданным. Сформулируем их.
Преимущество от движения вдоль наилучшего на правления должно быть по крайней мере в п раз больше, чем от движения вдоль наихудшего направления. В про тивном случае релаксационный поиск не будет эффек тивнее поиска с поочередным изменением параметра. Отсюда следует, что объект, в котором все параметры примерно равноправны, следует оптимизировать методом Гаусса — Зайделя.
Б. Случайная модификация метода Гаусса — Зайделя. Своеобразной модификацией метода является введение элемента случайности в выбор координаты последующего спуска [14.1]. Блок управления {ВУ) (см. рис. 14.1.1) в данном случае представляет собой генератор жребия, который реализуется переключателем. Такая мера по зволяет избежать зацикливания в ловушке, столь харак терного для метода Гаусса —Зайделя.
Если же при этом добавить невозврат в исходную точку при увеличении показателя качества, то метод приобретает свойства глобального поиска [14.2]. Опишем этот метод.
Рекуррентная формула для рабочего шага этого алго ритма имеет вид
AXi+1 = |
AXj при Q(XM) < Q m , |
(14.3.3) |
||
ale* при Q (ХЬ1) > Q (Xi), |
||||
|
|
|||
где I —случайное число |
|
|||
6 - |
+1 |
с вероятностью V21 |
(14.3.4) |
|
—1 |
с вероятностью 7г» |
|||
|
|
TJ —целое случайное число, равномерно распределенное в интервале 1 т] ^ я; — единичный орт вдоль ц-й координаты.
Глобальность этого алгоритма связана, прежде всего, с тем, что им, вообще говоря, может реализоваться любая заданная траектория (из отрезков, параллельных осям, разумеется). Если для того, чтобы выйти в зону притяже ния глобального экстремума, необходимо сделать N строго определенных, шагов, то вероятность Р образова ния такой траектории в самом худшем случае будет боль ше, чем
Р = (Р ) " |
(44.3.5) |
т. е. конечна. Это обстоятельство обеспечивает такой слу чайной модификации большие возможности.
В. Поиск с последействием. Для преодоления всех рас смотренных выше неприятностей, связанных с движением
вдоль узких «щелей» функции качества типа Q = ж® -|-
-4-х\ — |AXI.T2 при р 2, можно воспользоваться прие мом введения последействия. Суть этого приема заклю-
dQ л
чается в том, что система после момента -^ = О продол
жает некоторое время двигаться в том же направлении. Команда на переход к оптимизации очередной координаты дается с задержкой на промежуток времени At. Это при водит к тому, что вместо мелких «дрожаний» система движется к экстремуму большими шагами. Суммарная
длина траектории поиска при этом остается той же, но значительно сокращается число изломов траектории.
Таким образом, введение последействия в процесс поиска по методу Гаусса — Зайделя позволяет снизить число переключений процесса оптимизации с одного пара метра на другой. Если каждое переключение требует вре менных затрат, то эффективность поиска с последействием вдали от цели значительно повышается. Однако при работе в районе цели последействие вносит значительные потери на рысканье. Поэтому при попадании в зону эк стремума следует снова возвращаться к методу Гаусса — Зайделя без последействия.
§ 14.4. Метод Розенброка
Выше отмечалось, что одним из существенных недо статков метода Гаусса — Зайделя является его зависи мость от выбора системы координат. При удачном выборе
|
эффективность |
метода |
|
|
значительно выше, чем |
||
|
при неудачном. |
|
|
|
Метод |
Розенброка, |
|
|
по сути своей, сводится |
||
|
к отысканию «удачной» |
||
|
системы |
координат |
|
|
[14.3]. Блок-схема систе |
||
|
мы оптимизации с при |
||
|
менением этого |
метода |
|
Рис. 14.4.1. Блок-схема реализации |
показана на рис. 14.4.1. |
||
метода Розенброка. |
Здесь между оптимиза |
||
|
тором, работающим по |
методу Гаусса — Зайделя, и объектом располагается ли
нейный |
преобразователь |
|
|
|
|
X = AY, |
|
(14.4.1) |
|
где А |
—матрица п X п |
|
|
|
|
а11 |
Я12 |
&1п |
|
|
А = ®21 |
Я22 |
а 2п |
(14.4.2) |
Параметры этой матрицы определяются вычислительным устройством ВУ , которое и реализует алгоритм, предло женный Розенброком.
Перейдем к описанию алгоритма. Пусть |
|
|
{Y i) = (e\, el |
А) |
(14.4.3) |
— система ортогональных координат на г-м цикле поиска.
Здесь е) —/-й орт на г-м цикле. Первая система коорди нат (Fi) совпадает с системой координат объекта {X },
т.е. матрица (14.4.2) является единичной. Пусть на г-м цикле произведены п спусков:
= (Si, S i Si), (14.4.4)
и выходные параметры оптимизатора Yi изменились следующим образом:
= Ъ + S и |
(14.4.5) |
где Yi —управляемые параметры до спусков, У, — управляемые параметры после спусков г-го цикла.
Вектор смещения Si несет информацию об эффектив ности произведенных спусков: чем больше (по модулю)
величина спуска S}, тем существенней координата ej.
И наоборот, при | S) | ^ 0 направление ej неперспектив но. Поэтому переход к следующей системе координат {У,+1} должен учитывать это обстоятельство. Это можно
сделать так: брать направление е}-с весом S}, т. е. перей ти к базису
nV . . |
1 |
£i+1 — |
|
7 = 1 |
|
й " = 2 sW. |
(14.4.6) |
7 = 2 |
|
= 2 ^ = ЙА . 7=5Л
Однако этот базис не ортогональный и не нормированный. Его ортогонализацию и нормирование можно произвести
стандартным образом:
e*+i = |
г+1 |
(14.4.7) |
|
|
КГ1 |
Второй орт е£г образуется как линейная комбинация «1“ И Й":
h e? 1+ Й“ . |
(14.4.8) |
Параметр &2 определяется, исходя из требований ор тогональности (14.4.8) к ei+1, откуда получаем
S |
1 |
_ |
(14.4.9) |
|
= |5|“ - Й * 1.4*114+1| |
' |
где квадратными скобками обозначено скалярное про изведение. Таким способом можно получить все орты но вого ортогонального ба
зиса.
Заметим, что в данном случае наибольший инте рес представляет первая
|
|
|
г+1 |
так как |
|
|
координата ei |
, |
|||
|
именно вдоль нее ожидает- |
||||
|
ся наибольший |
спуск на |
|||
|
(г +1)-м |
|
цикле |
поиска |
|
|
Поэтому |
остальные коор |
|||
|
динаты ег+\ |
• • |
• >е'п1могут |
||
|
быть образованы любым |
||||
Рис. 14.4.2. К иллюстрации ра |
(в том числе и случайным) |
||||
боты метода Розенорока. |
образом |
с |
единственным |
||
|
требованием |
их |
ортого |
||
|
нальности. |
|
|
|
Образование новой системы координат можно про иллюстрировать [14.4] на примере квадратичного объекта, показанном на рис. 14.4.2. Здесь исходная точка Х0 ле жала на одной из-прямых, на которых происходит излом траектории. Как видно, после перестройки системы ко
ординат цель х[ — х*2 = 0 будет достигнута за один спуск.
'Если предположить, что • смещения при спусках про-' порциональны частным производным вдоль выбранных-
координат, т. е. Si = |
(это предположение |
вполне естественно), то направление ехг будет в точности совпадать с антиградиентным направлением:
е'*1= — |
grad Q |
(14.4.10) |
|
grad Q |
|
и определять наилучшее направление спуска. Покажем это для первого цикла (для остальных циклов это дока зывается аналогично). Итак, пусть
(i = l,. |
•Jn). |
(14.4.11) |
Тогда получаем |
|
|
I = q grad Q |
|
(14.4.12) |
и, используя (14.4.7), приходим к (14.4.10). |
||
Таким образом, метод Розенброка |
на |
каждом цикле |
стимулирует такое изменение координатных осей, при котором направление первого спуска очередного этапа стремится к оптимальному, т. е. к антиградиентному, при чем в направлении дпа оврага.
§ 14.5. Метод параллельных касательных
Этот метод опирается на следующий очевидный в дву мерном случае факт. Если из двух произвольных точек Х10
и Х 2о, не лежащих па прямой, |
параллельной |
оси |
хх |
|
(рис. 14.5.1), мы |
произведем два |
спуска вдоль |
оси |
хх |
в точки Хп и Х 2х |
соответственно, то экстремум X* ква |
|||
дратичной формы |
Q (хх, х2) расположится на |
прямой |
Х10, Х20, т. е. может быть определен путем одного спуска вдоль этой прямой.
Докажем сказанное на простом цримере:
Q (zi> |
я2) = х\ |
+ х \ — |
|
Спуск из точки Х10 |
= |
(а£0), а410)) приводит в точку Ххх = |
|
= ( - р р , 4 10)) , а из |
Х2о = |
(420), 4 20)) —в Ха1 |
а^20*)- Как видно, точки Х10иХ 20 располагаются на прямой
х2 |
2 |
* |
• |
п |
= — |
которая проходит через экстремума^ = |
хг ~ |
0. |
|
|
И* |
|
|
|
Следовательно, спуск вдоль направления Х г1Х 21 решает поставленную задачу.
Таким образом, в двумерном случае экстремум квадра тичной формы может быть определен лишь гремя спус ками.
В случае трехмерного объекта, функция качества которого является квадратичной формой, могут быть произведены аналогичные рассуждения. Однако здесь следует говорить не о параллельных прямых,а о парал
|
лельных плоскостях. Для |
|||
|
этого, прежде всего, |
сле |
||
|
дует |
найти |
минимумы |
|
|
функции качества в каж |
|||
|
дой из |
этих |
плоскостей, |
|
|
т. е. дважды решить дву |
|||
|
мерную задачу, рассмот |
|||
|
ренную выше. Пусть |
Xi |
||
|
и Ха —эти |
экстремумы. |
||
|
Очевидно, что экстремум |
|||
|
квадратичной формы рас |
|||
|
положен на прямой, соеди |
|||
Рис. 14.5.1. К методу параллель |
няющей положения полу |
|||
ных касательных. |
ченных экстремумов в ука |
|||
|
занных параллельных пло |
скостях, и задача решается одним спуском вдоль направ
ления Х хХ г. Как видно, для решения трехмерной задачи оптимизации необходимо сделать 3 + 3 + 1 = 7 спусков.
Совершенно аналогично можно построить поиск и для большей размерности объекта.
Определим число спусков, необходимых для решения л-мерной задачи. Обозначим это число N n. Легко заме тить, что имеет место следующее рекуррентное соотно шение:
N n = 2Nn.l + 1 , |
(14.5.1) |
которое позволяет определить необходимое число спусков при условии, что N2 — 3. Как видно, это число быстро возрастает с увеличением размерности объекта. Это об стоятельство ограничивает применение этого метода.
§ 15.1. Метод градиента
Метод градиента является одним из самых распро страненных методов поиска экстремума. Смысл его сво дится к организации движения системы в градиентном (при максимизации) или аптиградиентном (при миними зации) иаправлеиии. Так как градиентное направлениеfl пространстве параметров по определению является на правлением, в котором показатель качества локально увеличивается наиболее интенсивно, то движение в этом направлении (или противоположном ему) приводит к наи лучшему результату, т. е. к наибольшему изменению по казателя качества. Именно поэтому метод градиента можно считать локально-оптимальным методом.
Рассмотрим переход из состояния X N Хдг+1 по методу градиента:
X N+1 = X N + AXiv+i,
где AXJV+1 — рабочий шаг, выражение для которого по методу градиента в случае минимизации имеет вид
ДХл+1 = — aNgrad Q (X N), |
|
(15.1.2) |
где aN — параметр длины рабочего шага, |
который в об |
|
щем случае зависит от номера шага N; |
grad |
Q {XN) — |
оценка градиента показателя качества в точке |
X N (пере |
вернутой «птичкой» здесь и далее обозначается не точное значение, а оценка).
Составляющие градиента —частные производные dQ/dXi (i — 1 , п) оцениваются путем измерений по казателя качества в пробных состояниях. В качестве таких пробных состояний могут быть выбраны состояния в районе исходной точки XN- Рассмотрим два способа определения пробпых состояний.

Как легко заметить, при уменьшении величины пробного шага g получаем в пределе точное значение частных про изводных:
g 7 = lim i(Ç (X „ + w )-(?(XN)] (i = l ....... |
п ). (15.1.7) |
V X % g — О S |
|
Таким образом, выражение (15.1.6) можно рассматривать лишь как приближенную оценку частной производной, которая в принципе может уточняться при уменьшении g.
Выражения для координат нового состояния теперь можно записать в следующем виде;
*("« > = |
X(N) + |
a 'N {Q {X N + |
gei) - |
Q (X * )] , |
|
|
|
|
(15.1.8) |
* f +1) = |
+ |
aN [Q (X N + |
gen) - |
Q (XN)], |
Поиск, в котором градиент оценивается таким обра зом, будем называть поиском с центральной пробой, подчеркивая участие исходного состояния в оценке каж дой частной производной.
2.При другом способе определения градиента замеры
показателя качества необходимо сделать в 2п точках;
X N ± g e i (i = 1, п), (15.1.9)
показанных светлыми точками на рис. 15.1.1, б для дву мерного случая.
Частные производные показателя качества в этом
случае оцениваются по формуле |
|
Ц - = T g (XN + geà — Q(X N — |
(i = 1 , . . n). |
|
(15.1.10) |
При g 0, как легко заметить, эта оценка в точности совпадает с частной производной вдоль координаты х
Поиск, в котором градиентное направление опреде ляется таким образом, будем называть поиском с парными пробами. Выражения для координат нового состояния