Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Растригин Л.А. Автоматная теория случайного поиска

.pdf
Скачиваний:
6
Добавлен:
23.10.2023
Размер:
8.71 Mб
Скачать

АКАДЕМИЯ НАУК ЛАТВИЙСКОЙ ССР ИНСТИТУТ ЭЛЕКТРОНИКИ И ВЫЧИСЛИТЕЛЬНОЙ ТЕХНИКИ

АКАДЕМИЯ НАУК ЛАТВИЙСКОЙ ССР ИНСТИТУТ ЭЛЕКТРОНИКИ

ИВЫЧИСЛИТЕЛЬНОЙ ТЕХНИКИ

Л. А. РАСТРИГИН,

К. К. РИПА

АВТОМАТНАЯ

ТЕОРИЯ

СЛУЧАЙНОГО

ПОИСКА

ИЗДАТЕЛЬСТВО «ЗИНАТНЕ» РИГА 1973

6S0.1. j Р245 h УДК 51:62-507

АВТОМАТНАЯ ТЕОРИЯ СЛУЧАЙНОГО ПОИСКА. Л. А. Р а с т р и г и н, К. К. Р и п а. Рига, «Зинатне», 1973. 344 стр.

Вмонографии разработаны основы автоматной

теории случайного поиска, которая дает возмож­ ность исследовать алгоритмы поиска с единой точки

зрения.

Алгоритмы

поиска

интерпретируются как

конечные

автоматы,

а объект оптимизации — как

случайная среда, в

которой

находится автомат. Ис­

следование процесса оптимизации сводится к иссле­ дованию некоторой цепи Маркова, соответствующей данному алгоритму поиска и данному объекту опти­ мизации. Исследованы некоторые классы случайных и детерминированных алгоритмов поиска, рассмот­ рены вопросы их эквивалентности. Построены опти­ мальные алгоритмы в отдельных классах стохастиче­ ских автоматов для различных объектов оптимизации.

Илл. 58, табл. 8, библ. 58 назв.

Печатается

по решению

Редакционно-издатель-

ского

совета

Академии наук

Латвийской ССР от

17 февраля 1972 года.

 

©

Издательство «Зинатне», 1973

3-3-14-113 11-73 М811(11)-73

П Р Е Д И С Л О В И Е

 

 

 

 

Эта

книга является

обобщением

 

работ

ав­

торов за

последние

 

несколько

лет. Идея

 

представления

случайного

поиска

 

в

виде

вероятностного

автомата

до­

вольно

естественна,

хотя

и была

сформулирована

 

только

в 1967

г. [/]. В этом же году

Ю. И. Неймарком

с соавт. [2]

была

 

высказана

мысль

о

возможности

 

 

использования

вероятностных

автоматов

для

решения

 

задачи

 

многопа­

раметрической

оптимизации.

Оба

направления

 

сначала

развивались

независимо,

пока

не

было

обнаружено,

что

они

представляют

 

собой

разные

ветви

одного

и

того же

дерева

автоматной

стохастической

 

оптимизации.

Пер­

вую из них, которую представляют

авторы,

можно

ус­

ловно

назвать

«Случайный

 

поиск

как

 

вероятностный

автомат»,

вторую

 

«Вероятностный

 

автомат

 

как

слу­

чайный

 

поиск».

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В

данной

книге

нашли

отражение

работы

и

 

идеология

первого

 

из

указанных

направлений

 

автоматной

оптими­

зации,

хотя в

ней

 

затронуты

работы

 

и

второго

направ­

ления.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Подобно

тому

как

детерминированные

 

автоматы

яв­

ляются

частным случаем

вероятностных,

так

регулярные

процедуры

поиска

 

могут

 

рассматриваться

 

как

частный

случай

 

процедур

 

случайного

 

поиска.

 

В

 

соответствии

с этим

в

книге

в

виде

частных

случаев

 

рассмотрены

из­

вестные

регулярные

методы поисковой

оптимизации

как

детерминированные

 

автоматы и исследована

 

работа

этих

автоматов

в случайной

среде,

т. е. при

оптимизации

объ­

екта с

помехами.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Монография

является

пятой

в

серии

книг

 

по

слу­

чайному поиску. В первой —

«Случайный

 

поиск

в

зада­

чах

оптимизации

 

многопараметрических

 

систем» (Рига,

«Зинатне»,

1965)

проблема

 

случайного

поиска

была

 

 

 

6

ПРЕДИСЛОВИЕ

 

 

 

 

 

 

 

 

 

 

 

 

только

поставлена.

 

Во

второй

 

«Статистические

 

ме­

тоды поиска»

(М.,

 

«Наука»,

1968)

были

 

исследованы

преимущественно

 

локальные

алгоритмы

случайного

 

по­

иска.

В

третьей —• «Случайный

 

поиск

с линейной

такти­

кой»

(Рига,

«Зинатне»,

 

1971)

рассмотрены

алгоритмы

случайного

спуска,

 

и

в

четвертой

•— «Случайный

 

поиск

в задачах

адаптации»

 

(Рига,

«Зинатне»,

1973) —

иссле­

дованы

процессы

сходимости

случайного

поиска

в точку

или

зону

экстремума.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В

настоящей

 

книге

работа

алгоритмов

случайного

 

по­

иска

анализируется

 

в терминах

вероятностных

автоматов.

Теория

вероятностных

автоматов дала

эффективный

язык,

удобный

для

анализа

 

и синтеза

алгоритмов

случайного

поиска.

Этот же язык

 

дал

возможность

убедительно

 

по­

казать,

что случайный

 

поиск

эффективно

обобщает

регу­

лярные

алгоритмы.

Открылась

 

возможность

оптималь­

ного

синтеза

алгоритмов

поиска

по

свойствам

объекта.

При

попытке

автоматного

представления

 

алгоритмов

случайного

поиска

 

с

непрерывным

распределением

 

слу­

чайного

шага

в

пространстве

параметров

 

 

обнаружилось

любопытное

обстоятельство:

 

эти

алгоритмы

породили

континуальные

 

вероятностные

автоматы.

 

 

 

 

 

 

Автоматное

представление

наряду

со всеми

своими

до­

стоинствами

обладает

одним

 

существенным

недостат­

ком

трудностью

анализа

при

 

большом

числе

перемен­

ных.

А

если

вспомнить,

что случайный

поиск

наиболее

эффективен

при

оптимизации

объектов с большим

числом

параметров

[3], то очевидна

необходимость

 

дальнейших

изысканий

подходящего

математического

аппарата

 

для

решения

таких

задач.

 

Следовательно,

методы,

рассмот­

ренные

в данной

книге,

нельзя

считать

 

универсальными.

Их

можно

рекомендовать

для

анализа

и

синтеза

алго­

ритмов

поиска

при

оптимизации

объектов

не

слишком

высокой

размерности.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В

заключение

 

авторы

пользуются

приятной

возмож­

ностью

высказать

 

свою

глубокую

признательность

 

ли­

цам,

которые

 

просмотрели

рукопись

и

высказали

 

свое

мнение

по

поводу

 

ее

удачных

 

и неудачных

 

мест,

в

ре­

зультате чего

последних

стало

значительно

 

меньше.

 

Л.Растригин

К.Puna

 

В В Е Д Е Н И Е

 

 

§ 0.1. З А Д А Ч А

 

 

П О И С К О В О Й О П Т И М И З А Ц И И

 

О б ъ е к т о м поисковой

оптимизации яв­

ляется (п+

1)-полюсник с п входами

и одним выходом

(см. рис. 0.1.1). Входы объекта хи.

п управляемы и

определяются вектором

 

\= (хи ...,

хп).

(0.1.1)

Эти входы обычно называются параметрами или коор­ динатами объекта (в литературе по планированию экс­ периментов их называют факторами). На рис. 0.1.1 показано схематическое изображение объекта в- скаляр­ ной (а) и векторной (б) форме.

Выход

объекта

Q является

всегда скалярным и

обычно

называется

показателем

качества

(или откли­

ком) объекта, а его зависимость

от входных

параметров

Q = Q ( я , , - . . , * « ) = Q ( X )

 

(0.1.2)

— функцией

качества

или функцией отклика (последний

термин

обычно

употреб­

а)

 

ляют в планировании экс-

 

периментов).

 

 

 

 

Зависимость (0.1.2)

мо­

Объект

Q

жет

иметь

недетермини­

рованный

 

характер.

В

 

 

этом

случае

используется

 

 

запись

 

 

 

 

 

5)

 

Q' = Q ( X , £ ) ,

(0.1.3)

 

 

 

где

Е

 

стационарный

Объект-

 

случайный

фактор. Пусть

 

 

 

ME[Q(X,

£)] = :Q(X),

 

Рис. 0.1.1. Представление

объекта

 

 

 

 

 

(0.1.4)

 

 

 

 

 

оптимизации.

 

ВВЕДЕНИЕ

8

где М — знак математического ожидания, а индекс Е обозначает, что осреднение производится по случайному фактору Е при X = const.

Теперь можно сформулировать з а д а ч у

о п т и м и з а ­

ц и и . Следует определить такое допустимое

состояние X,

при котором Q(X) достигает экстремума, т. е. решается

задача

 

Q(X)->-extr,

(0.1.5)

x e s

где 5 — заданное множество допустимых состояний объекта.

Как видно, постановка задачи оптимизации очень на­ поминает постановку задачи нелинейного программиро­ вания с той лишь разницей, что экстремизируемая функ­

ция Q(X) неизвестна и задается

своими реализациями,

которые могут быть случайными

(0.1.3). В последнем

случае процесс образования показателя Q' очень удобно

описывается аддитивной моделью

 

Q ' ( X ) = Q ( X ) + e ( 0 ) ,

(0.1.6)

где е(а) — случайное нормально

распределенное число

с нулевым математическим ожиданием и дисперсией о2 . Отдельные реализации предполагаются некоррелирован­ ными.

Ниже всюду, если это не оговорено особо, рассматри­

вается задача

минимизации

Q(X)-*-min,

(0.1.7)

где множество допустимых входов 5 определено заранее. Решением поставленной задачи является состояние X*,

удовлетворяющее условию

 

 

Q ( X * ) ^ Q ( X )

 

 

(0.1.8)

(X*, X e S )

 

 

 

или

 

 

 

X* = argmin Q(X).

 

 

(0.1.9)

Последнее выражение

означает, что искомое состояние

X* является аргументом, принадлежащим S и соответст­

вующим при этом минимуму

функции качества.

 

Очевидно, что при отсутствии аналитического

выраже­

ния для Q(X) решение поставленной задачи

(0.1.7)

может производиться

одним

из трех способов:

 

ВВЕДЕНИЕ

9

1)путем восстановления (идентификации) функции качества Q(X) с последующим решением соответствую­ щей задачи нелинейного программирования;

2)путем поиска, т. е. соответствующим образом по­

следовательно «запрашивая» значения показателя в со­ стояниях Xi, Х 2 , . . . с тем, чтобы постепенно прибли­ жаться к решению задачи X*;

3) комбинированным путем, т. е. последовательно пе­ ремежая процесс идентификации и поиска. Этот путь, называемый иногда экстраполяционным поиском, опи­ рается на простые модели функции качества Q(X), кото­ рые используются для получения оценок положения точки минимума, уточняемых на следующем этапе.

Четкого различия между этими тремя способами ука­ зать нельзя, т. к. понятия модели объекта и ее идентифика­ ции используются в разной мере, но во всех трех случаях.

В данной книге будем рассматривать лишь поиск, смысл которого сводится к следующему [1, 3—5]. Для сбора информации на N-u этапе (или шаге) поиска делаются пробные шаги, т. е. определяется показатель качества в точках

Хя о>,Х*<2>,...,Х*<™*>,

(0.1.10)

выбранных некоторым случайным образом вокруг точки Xjy—1 •

Выбор пробных шагов осуществляется

в соответствии

с заданным

я-мерным законом распределения

Р (XNWIV/N-u

Xiv( 1 >,..., Xf f «-i>),

(0.1.11)

который формируется в процессе поиска. (Для детерми­ нированных методов поиска это распределение вырож­ дается в б-функцию.)

Полученная информация о поведении функции каче­ ства в районе исходной точки XJV_I позволяет принять решение о переводе объекта в другую точку

XN = XN-l + AXN,

(0.1.12)

причем смещение AXN определяется

в соответствии с

выбранной функцией решения Ф:

 

A X w = O(Wtf_b Xw 0>,...,Xw <™*>).

(0.1.13)

Здесь вектор WJV_I называется вектором памяти. Он

ВВЕДЕНИЕ

ю

характеризует предысторию поиска и определяет влия­ ние предыдущих шагов поиска на выбор JV-ro шага.

Вектор памяти WJV-I с точки зрения информации, по­ лученной на (N— 1)-м этапе поиска, корректируется в соответствии с алгоритмом самообучения

W f f = 4 f ( W f f _ b X w _ b

Х*<1>, . . . , ХдЛ-л-)).

(0.1.1.4)

При \У^ = 0 имеет

место независимый поиск.

Приме­

ром такого независимого поиска является поиск по методу градиента.

Для исследования и оценки эффективности поисковых процедур, для сопоставления различных алгоритмов по­ иска и для определения сходимости процесса поиска не­ обходимо задать ситуацию, в которой эти алгоритмы действуют, т. е. иметь модели.

Приведем некоторые модели функции качества, на ко­ торых в дальнейшем будут исследованы и сопоставлены алгоритмы поиска.

1. Линейная модель объекта является наиболее прос­ той из всех возможных. Она характеризуется линейной зависимостью показателя качества объекта от его управ­

ляемых

параметров:

 

 

п

 

Q(xu

...,хп) = Q & + 2 ai(Xi-Xio),

(0.1.15)

или, в векторной форме,

 

Q ( A , X ) = Q 0 + [ ( X - X o ) , A ] ,

(0.1.16)

где квадратными скобками выделено скалярное произве­ дение. Вектор градиента функции качества равен

grad Q(Xo) = ( а ь . . . , а„) = А ,

(0.1.17)

т. е. он предполагается постоянным в зоне поиска. Это означает, что функция качества является линейной в пре­ делах, определяемых смещением АХ=Х—Х0 .

Эта модель хорошо отражает локальные свойства объ­ екта вдали от экстремума или при достаточно малых шагах поиска АХ. Поэтому она применима для локаль­

ного анализа работы алгоритмов поиска.

 

 

2.

Стохастическая

модель

объекта

характеризуется

тем,

что в ней вектор

ситуации объекта

А = и ...,

ап),

Соседние файлы в папке книги из ГПНТБ