Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Системы экстремального управления

..pdf
Скачиваний:
10
Добавлен:
19.11.2023
Размер:
33.28 Mб
Скачать

Подставляя их в (19.3.8), получаем

 

Q

у,) ® ЛГ (rf + rf ^ + у1Уг-§- ^

(19.3.12)

Как видно, линии равного уровня Q = const в данном

случае представляют

собой

сильно

вытянутые

эллип­

 

 

 

 

 

 

 

сы,

показанные

на

 

 

 

 

 

 

 

рис.

19.3.1.

С

рос­

 

 

 

 

 

 

 

том величины N Д эти

 

 

 

 

 

 

 

эллипсы вытягивают­

 

 

 

 

 

 

 

ся

 

все

сильнее и

 

 

 

 

 

 

 

сильнее. Главная ось

 

 

 

 

 

 

 

при

этом

стремится

 

 

 

 

 

 

 

к оси ух.

 

образом,

 

 

 

 

 

 

 

 

Таким

 

 

 

 

 

 

 

 

функция

 

(19.3.12)

 

 

 

 

 

 

 

имеет ярко выражен­

Рис. 19.3.1. Пример овражной ситуации.

ный

прямолинейный

 

 

 

 

 

 

 

овраг, показанный на

 

 

 

 

 

 

 

рисунке пунктиром.

Наличие оврага в данной задаче, направленного при

большом N вдоль оси

хорошо подтверждается следую­

щим простым

рассуждением.

 

Пусть

/ (z,

х2) — най­

денная функция, ми­

 

 

 

 

 

 

 

 

 

нимизирующая

не­

 

 

 

 

 

 

 

 

 

вязку

с

эксперимен­

 

 

 

 

 

 

 

 

 

том (эта минимальная

 

 

 

 

 

 

 

 

 

невязка в данном слу­

 

 

 

 

 

 

 

 

 

чае равна No2). Тогда

 

 

 

 

 

 

 

 

 

последовательная ва­

 

 

 

 

 

 

 

 

 

риация параметров хг

 

 

 

 

 

 

 

 

 

и х2

на

величину Ô

 

 

 

 

 

 

 

 

 

приводит

к

дру­

 

 

 

 

 

 

 

 

 

гим функциям

(рис.

 

 

 

 

 

 

 

 

 

Î9.3.2). Первая из них

 

 

 

 

 

 

 

 

 

/ (z,

+

Ô, а£)

уве­

 

 

 

 

 

 

 

 

 

личивает

невязку по

 

на

величину b2N

(это —

сравнению с

минимальной

сумма

N

отрезков

величиной

Ô2).

Вариация

вто­

рого параметра

дает

функцию

/ (z,

х.2 -f- Ô),

которая

имеет

невязку,

превышающую

экстремальную

невязку

на величину ô2/V2А, что в N А раз больше, чем при вариа­ ции параметра xv Это обстоятельство при больших N и де­ лает параметр хх (или ух) существенным, а х2 (или у2) несущественным.

Оптимизация подобного объекта локальными методами поиска не решает задачу, так как переменная хх при этом не будет оптимизироваться.

Однако подобная ситуация сложилась за счет выбора

именно

такой стратегии

замеров.

 

 

Рассмотрим другую стратегию измерений, при которой

овражности не будет.

 

делаются в случайных точках zit

2.

Пусть

замеры

распределение которых нормально с математическиможида­

нием т и дисперсией

т. е. при больших N имеют место

выражения:

 

 

 

 

 

 

N

 

 

N

 

 

 

2

Zj æ Nm,

2 zi ~ (°o +

N.

(19.3.13)

 

i=l

 

 

Î=1

 

 

При этом из (19.3.8)

получаем

 

 

 

Q(Уь У*) = У\ +

У\ (со + гпг) + 2у1у2т + с2.

(19.3.14)

В этом случае линии равного уровня не зависят от числа N и представляют собой эллипсы, параметры которых за­ висят от тпи а0. При малых тп и с0 эти эллипсы достаточно «округлы», что означает безовражную ситуацию. При большом б0, т. е. при значительном рассеивании замеров, что эквивалентно большому N для первого случая, nepèменная у2 (параметр х2) становится несущественной, а переменная ух — существенной. Это и означает овражную ситуацию.

Как видно, овраг в рассмотренной задаче является следствием определенной стратегии организации экспе­ римента, причем эта стратегия может встретиться весьма часто. Сказанное означает, что в задачах определения пара­ метров по экспериментальным данным овражная ситуация встречается весьма часто, и именно такие задачи породили метод оврагов [19.1] — поиск, позволяющий эффективно оптимизировать объекты с хорошо организованной овраж­ ной функцией качества.

Метод оврагов является, по сути дела, комбинацией случайного слепого поиска и одного из локальных мето­ дов оптимизации. Локальный поиск приводит ко дну оврага, где он перестает действовать эффективно. Делая локальные спуски из случайно выбранных исходных то­ чек, можно получить точки на дне оврага, количество ко­ торых равно числу спусков. Располагая точками на дне

h

Рис. 19.4.1. Траектория оптимизации при работе овражного метода на одномерном овраге.

оврага, можно построить поиск вдоль оврага. Таким об­ разом, процесс овражного поиска должен иметь по край­ ней мере два этапа. На первом — любым из локальных методов поиска определяются несколько точек на дне ов­ рага. На втором этапе делается «шаг по оврагу», т. е. на основе полученной информации принимается решение о движении вдоль оврага, т. е. определяется направление рабочего шага вдоль существенных переменных.

Такая стратегия поиска и позволяет производить ав­ томатическое разбиение переменных на существенные и несущественные. Действительно, при локальном спуске ко дну оврага изменяются несущественные переменные (изменяются и существенные, но это изменение носит не­ целенаправленный случайный характер и поэтому в сред­ нем может не приниматься в расчет, т. е. может считаться

равным нулю). При движении вдоль оврага

изменяются

* основном лишь существенные переменные

(дно овра*

га потому и названо «дном», что, двигаясь вдоль него, нельзя заметно изменить показатель качества, т. е. на дне нет несущественных переменных). Так и происходит автоматическое разбиение переменных на существенные

инесущественные.

А.Овражный поиск Гельфанда — Цетлина. Рассмот­ рим один из наиболее простых алгоритмов овражного

спуска,

который

был

предложен И. М. Гельфандом ж

М. Л. Цетлиным,

впервые обратившими внимание на ов­

ражные ситуации [19.1].

 

 

Сначала из произвольной точки Х0 производится

спуск любым из локальных ме­

 

тодов поиска

(например,

гра­

 

диентным образом). Этот спуск

 

продолжается до

тех пор,

по­

 

ка

относительное

уменьшение

 

показателя

качества

не станет

 

достаточно

малым

(например,

 

при

градиентном

спуске

ве­

 

личина

|AÇ|<^Ô,

где

ДQ

 

изменение

показателя

качест­

Рис. 19.4.2. Поведение по­

ва

за

один градиентный шаг,

казателя качества в процес­

a ô — некоторый

положитель­

се овражного поиска.

ный

порог).

Пусть

локаль­

Х г (рис. 19.4.1, где про­

ный

спуск

 

привел

к

точке

цесс локального спуска на дно обозначен волнистой стрелкой.

Далее из случайно выбранной точки Х2 также произво­ дится локальный спуск в точку Х8, расположенную также на дне оврага. Две точки, Х 1 и Х3, определяют направ­ ление оврага, и следовательно, направление шага по ов­ рагу. Этот шаг делается вдоль направления ХхХ3 в точку Х4. Эта точка может не оказаться на дне оврага. Действи­ тельно, при прямолинейном дне оврага точка Х 4 будет также находиться на дне. Однако в более общем случае, когда овраг имеет криволинейную форму, точка Х 4 ока­ жется на «склоне» оврага, т. е. возможно Q (Х4) ]> Q (Х8). Поэтому естественно из этой точки снова сделать спуск на дно оврага (дно оврага на рис. 19.4.1 обозначено пунк­ тиром) в точку Х5. Через точку Х8 и ХБделается шаг по оврагу в точку Х6, далее следует спуск на дно в точку Х7 и т. д.

Очевидно, что при такой стратегии поиска реализуется движение вдоль оврага. Показатель качества при этом изменяется так, как показано на рис. 19.4.2, т.е. зависимость Q (N) имеет ярко выраженный пилообразный характер.

Здесь показано движение вниз по оврагу. Однако точно таким образом реализуется движение вверх по ов­ рагу. Для этого первый овражный шаг следовало сделать в сторону, противоположную Х4.

Описанный алгоритм овражного поиска реализует дви­ жение вдоль оврага вообще, независимо от того, подни­ мается он или опускается. Двигаясь в соответствии с этим овражным алгоритмом поиска, мы проследим ов­ раги оптимизируемого объекта, т. е. те зоны, где скорее всего и расположен искомый экстремум. Если при этом

запоминать состояния X®, где функция качества была минимальна за предыдущие такты поиска, то по окончании такого сканирования оврагов можно уточнить положение

экстремума. Для этого достаточно в районе точек X? повторить овражный поиск, но с меньшим овражным ша­ гом, что дает возможность более подробно ознакомиться е поведением показателя качества на дне оврага в зоне, подозреваемой на экстремум.

Описанный алгоритм, как можно заметить, построен для движения вдоль одномерного оврага. Действительно, овражный шаг, т. е. шаг вдоль оврага, определялся только двумя точками на дне оврага, что возможно только для одномерного оврага, m-мерный овраг определяется не менее чем лг + 1 точками на его дне. Если запустить рас­ смотренный алгоритм овражного поиска на объект с многомерным оврагом, то будет реализоваться движение вдоль этого оврага в направлении, определяемом первыми двумя исходными точками Х0 и Х2. А так как эти точки случайны, то будет производиться одномерный разрез этого многомерного оврага в случайном направлении.

Поэтому целесообразно модифицировать рассмотрен­ ный овражный поиск.

Б. Градиентный овражный поиск. Суть этой модифи­ кации сводится к тому, чтобы овражный шаг делать в направлении антиградиента существенных переменных. Процедура такого градиентного овражного поиска заклю­ чается в следующем [19.3].

1.

Из

исходного состояния Х0 делается локальный

спуск

на

дно оврага Х 01.

2.

Из

случайно

выбранных в районе Х 0 точек Х г,

Ха, ...,'Xq, где g >

т, также делается q спусков на дно

оврага в точки Хи , Х21, •••» Х91. Если размерность ов­ рага т неизвестна, то можно определить число g, напри­

мер, так: g ;> п — 1.

(Действительно, размерность

овра­

га т не может быть больше чем п — 1. При т =

п ов­

рага нет, так как все переменные равноправны).

 

Эти

g + 1 точек

вместе с их показателями качества

Q (Х01),

Q (Хп), ...,<? (Xqi) образуют исходную информа­

цию для определения градиента на дне оврага.

 

3. Оценка направления градиента показателя каче­

ства на дне оврага производится по формуле

 

dirgrâ d<?(X„)=dir 2

IQ №,) - Q <x„)j, (19.4.1)

где значком dir обозначен единичный вектор направления

dir Y = pjrj-,

(19.4.2)

a grâd Q — оценка градиента на базе имеющихся наблю­ дений. В главе 17 показана оценка градиента

тп

 

dir grîdm Q (X) = dir 2 S. l<?(X + S,) - Q (X)]

(19.4.3)

1=1

 

по случайным точкам X + З г (i = 1, ..., т), равномерно распределенным по поверхности гиперсферы единичного радиуса с центром в точке X. Доказано, что эта оценка эффективна и состоятельна, т. е. при т -> оо получаем dirgrâdm Q {X) -*-dir grad Q (X).

Оценка (19.4.1) отлетается от (19.4.3) тем, что случай­ ные точки Х(1, где определяется показатель качества,

распределены

иным,

чем р {X + S),

образом. Если

это

распределение

симметрично

и поле

Q (X) линейно,

то

оценки (19.4.1)

и

(19.4.3)

совпадают.

Действительно,

в линейном поле, для которого доказана

эффективность

оценки (19,4.3),

можно положить

 

 

 

 

 

 

_

х а - *01

 

 

 

 

 

 

S i”

|* u -Z oi|

 

 

Рис. 19.4.3. Неправильность оценки направления дна оврага за счет не­ точности оценки его дна.

Тогда имеет место приближенное выражение:

Q ( ^ ) - 0 W

<?(ХИ + 3,)-< ?(Х И)

|* a -Z ° i|

 

и, учитывая симметричность распределения р (Ха —

— Xoi), нетрудно убедиться в идентичности указанных оце­ нок. Это обстоятельство и дает основание пользоваться формулой (19.4.1) для

правления на дне ов­ рага.

Шаг по оврагу дела­ ется теперь обычным образом:

= Х п -

a dir grâd Q (X0i), (19.4.5)

где а — величина овраж­ ного шага. Далее, из точки Zj производится аналогичная процедура {q + 1)-го

локального спуска на дно оврага и т. д.

Эффективность такого поиска в значительной мере зависит от точности попадания на дно оврага в процессе локальных спусков. Следует отметить, что незначитель­ ная ошибка в определении положения дна оврага может привести к большим ошибкам в оценке овражного шага. На рис. 19.4.3 это обстоятельство проиллюстрировано дву­ мя примерами. Здесь пунктиром обозначено дно оврага. Хорошо видно, что направление овражного шага может значительно отклоняться от дна оврага. Именно поэтому градиентный овражный поиск требует особой тщательно­ сти в определении положения дна оврага,

Г Л А 6 A 2Ô

ГЛОБАЛЬНЫЙ МНОГОПАРАМЕТРИЧЕСКИЙ ПОИСК

Задача отыскания глобального экстремума многоэкст­ ремальной функции многих переменных Q = Q (а^, х2, . ..

хп) является задачей значительно более сложной и трудоемкой, чем определение локального экстремума. Дело в том, что многоэкстремальный объект почти не дает возможности судить о поведении показателя качества по нескольким наблюдениям, что возможно при унимодаль­ ности или выпуклости. Число наблюдений при поиске гло­ бального экстремума должно быть поэтому значительно большим. Более разнообразен и класс многоэкстремаль­ ных объектов.

Однако в практических задачах, особенно в задачах оптимального проектирования, многоэкстремальные функ­ ции встречаются значительно чаще, чем этого хотелось бы. Именно поэтому проблема глобального поиска яв­ ляется в настоящее время наиболее острой проблемой тео­ рии и практики поисковой оптимизации.

§ 20.1. Постановка задачи глобального поиска многоэкстремальпой функции многих переменных

Суть задачи глобального поиска сводится к отыска­ нию положения глобального экстремума X** многоэкст­ ремальной функции качества и внешне не отличается от обычной задачи экстремального управления:

Q (X) —> min,

(20.1.1)

x<=s

 

где S — множество допустимых значений векторов X, удо­ влетворяющих всем заданным условиям. Это множество, например, может быть гиперпараллелепипедом:

at ^ Xi ^

(i — 1,

га),

(20.1.2)

где bi — заданные числа.

Можно задачу отыскания глобального экстремума пред­ ставить как сумму задач на локальный экстремум. Пусть

Х^, . Х*м — все локальные экстремумы функции Q (X). Тогда глобальный экстремум X** определяется как наи­ меньший из локальных:

Q(X**)= min {Q(Xl)}.

(20.1.3)

i=l....N

 

Как видно, в этом случае задача о глобальном экстремуме сводится к отысканию всех локальных с последующим их перебором.

Рис. 20.1.1. К определению зоны притяжения экстремума.

Для более строгой формулировки задачи на отыскание глобального экстремума введем некоторые необходимые понятия.

Зоной притяжения экстремума Х\ назовем ту часть пространства параметров S, где выполняются следующие условия (рис. 20.1.1):

1. Экстремум Xi принадлежит этой зоне, т. е. Xi ее

еS 0

2.Все антиградиентные линии этой зоны сходятся в

точку экстремума X*. Если функция Q (X) имеет разрывы частных производных, то это условие дополняется еще и линиями разрыва, движение вдоль которых определяется проекцией антиградиента в ближайшей неразрывной точ­ ке на линию разрыва (рис. 20.1.1, б). Очевидно, что внут­ ри зоны притяжения экстремума работают все локальные

методы поиска. Результатом будет отыскание экстремума X*, находящегося в этой зоне.

Зоной глобальности S** назовем такую часть зоны притяжения глобального экстремума X**, где значения по­ казателя качества меньше остальных локальных экстре­ мумов (рис. 20.1.2):

Q (X) < min О (Х-) (i = 1 ,..., N).

(20.1.4)

Величина этой зоны характеризует «остроту» глобаль­ ного экстремума. Если зона глобальности S** мала, то

Рис. 20.1.2. К определению зоны глобальности.

экстремум X** следует считать очень острым и поэтому слишком редким, «экзотичным» и труднодоступным. Ес­ ли же зона S** сравнительно велика относительно всей зоны поиска, то глобальный экстремум найти достаточно легко.

Эти зоны можно характеризовать их объемом:

Vi = V{St), V* = V (S*), V** = V (S**), (20.1.5)

где Vi — объем зоны

притяжения

£-го экстремума X*,

V* — объем зоны притяжения глобального экстремума,

F** — объем зоны

глобальности;

F(-) — зависимость

объема от зоны. Числа Flt

., Vн,

V*, F** характери­

зуют ситуацию, т. е. определяют степень сложности оты­ скания глобального экстремума в данной задаче.

Так, для одноэкстремального случая (N = 1) получаем