книги из ГПНТБ / Растригин Л.А. Автоматная теория случайного поиска
.pdf
|
|
|
|
Замеченные ошибки |
|||
Стр [ |
Строка или № |
|
|
Напечатано |
|||
| |
|
формулы |
|
|
|
|
|
24 |
Форм. (0.3.29) |
Тх(Ух1х)В |
|
|
|
||
51 |
Форм. (0.3.11), |
|
|
|
|
|
|
63 |
4-я |
строка |
|
|
|
|
|
2-я |
строка |
= ( + 1,..., |
+ 1 , - 1 , - 1 ) ; |
||||
|
снизу |
|
|
|
|
|
|
71 |
Форм. (1.5.1), |
д у \ г ( 2 ) = _ а е 2 ; . . . |
|
||||
|
2-я |
строка |
.. . В3 |
Bt |
|
|
|
94 |
Матрица |
|
|
|
|||
|
(1.7.26) |
... 0 |
в3 |
|
|
|
|
|
|
|
|
|
|
||
111 |
Матрица |
.010...01. |
|
|
|||
|
(1.9.13) |
+ 2р<ф) |
|
||||
112 |
Форм. (1.9.14), |
тп+п |
|
|
|
||
|
2-я |
строка |
|
|
|
|
|
186 |
Табл. 2.2.2, |
1 |
|
|
|
|
|
|
2-я |
строка снизу |
— (1-/гб) |
|
|
||
|
|
|
4 |
|
|
|
|
191 |
Форм. (2.2.54), |
*°Р » |
= |
|
|
||
|
1-я |
строка |
2 - 1 |
|
|
|
|
294 |
1 -я строка снизу |
(0=1) |
|
|
|
||
334 |
2-я |
строка тек |
Тогда |
|
|
выражения |
|
340 |
ста |
снизу |
(3.5.11) |
и (3.5.12) |
|||
6-я и 7-я строки |
Случайный |
поиск в |
|||||
|
сверху |
многопараметриче- |
|||||
341 |
9-я |
и 10-я стро |
ских |
задачах. |
непре |
||
Сопоставление |
|||||||
|
ки |
снизу |
рывного и автоматного |
||||
|
|
|
случайного поиска. 118 |
||||
341 |
6—8-я строки |
Переходный процесс в |
|||||
снизу |
двумерной |
|
экстре |
||||
|
|
|
мальной |
системе при |
|||
|
|
|
наличии |
запрещенных |
|||
|
|
|
областей |
и случайном |
|||
|
|
|
методе поиска |
. 123 |
Должно быть
Т1(у/х)В
ДХ<т/2-Н)
= ( + 1,..., +1, - 1 , +1); дХ<"+2 >=-ое2 ; .. .
. . . ВгВ\
. . . 0 в2
. 000 .. . 01.
m + п
3 = m + 1
1
— (1 +Аб) 4
= Р2„ - 1 =
(6=1)
Тогда выражения (3.5.11) и (3.5.13) Проблемы случайного поиска, вып. 1.
Сопоставление непре рывного и автоматно го алгоритмов случай
ного поиска . . 113 Автоматная оптимиза
ция при наличии огра ничений . . . 123
Л. А. Растригин, К. К. Рапа. Автоматная теория случайного поиска.
ПОИСК С САМООБУЧЕНИЕМ
143
Здесь сумма
v
(2.1.27)
где Sj ( / = l , . . . , w ) определяется формулой (2.1.10), а qa — элементы матрицы (2.1.13), представляющие собой вероятность, с какой штрафуется автомат, если он на
ходится |
в состоянии W<*> (t = l , 2, . . . , m ) . Эта формула |
|||||||
аналогична формуле, рассмотренной в главе |
I I для |
слу |
||||||
чая, |
когда выход |
автомата совпадает |
с его |
состоянием. |
||||
2. |
Вероятностные |
автоматы со случайными |
выходами |
|||||
и детерминированными |
переходами. |
Функционирование |
||||||
этого |
автомата в случайной среде описывается частным |
|||||||
случаем |
цепи |
Маркова |
(2.1.25). Для |
этого |
случая |
мат |
||
рицы А0 |
и А\ |
являются |
стохастическими булевыми |
мат |
рицами, т. е. матрицами, у которых в каждой строке один элемент равен единице, а все другие равны нулю. Веро ятности штрафов для таких автоматов рассматриваются относительно его состояний и определяются формулой
(2.1.26). |
|
|
|
|
|
3. |
Вероятностные автоматы |
со |
случайными |
перехо |
|
дами |
и детерминированными |
выходами. |
Функциониро |
||
вание такого автомата в случайной |
среде |
(2.1.10) |
пред |
ставляет собой процесс оптимизации при помощи кол лектива независимых автоматов [12, 13]. Его полное функционирование описывается частным случаем цепи
Маркова |
(2.1.25). В этом случае матрицы А0 |
и Ах явля |
|||
ются |
стохастическими, а матрица Qij |
(формула |
|||
(2.1.13)) |
— булевой стохастической матрицей. Матрицы |
||||
Qi(i) |
(/= 1 , . . . , а) |
имеют вид |
|
||
|
|
0 • • 0 0 |
0 ••• 0 |
|
|
|
|
о •• 0 0 0 |
о |
(2.1.28) |
|
Qi(i) |
= |
о • • 0 1 0 |
о |
||
|
|
о •• 0 0 0 |
о |
|
m—ji
о •• о о о ••• о
ГЛАВА II
144
где номер /г- соответствует действию ДХ<->4>, которое про изводит автомат в состоянии W<'>. С учетом матрицы (2.1.28) и формулы (2.1.27) находим матрицу вероятнос тей штрафов
|
О |
|
О О |
о |
|
|
|
|
|
|
о |
о |
о |
|
|
S* = О |
0 |
0 |
••• s. |
о ••• о |
о |
(2.1.29) |
|
О |
0 |
0 |
••• 0 |
0 ••• 0 |
s |
|
где Sj( — ... ,v) — |
вероятность штрафа того дей |
ствия автомата ДХ( ^', |
которое соответствует состоя |
нию W<*>. |
|
Рассмотрим, как для автомата, заданного матрицами (2.1.11) и (2.1.12), определить выходную функцию
(2.1.2). Так как вектор ДХ принимает значение |
из конеч |
ного множества (2.1.6), то и координаты Axi |
(l—l,...,n) |
вектора ДХ принимают значения из конечных |
множеств |
Axle={lxlU),...,AxiW} |
(2.1.30) |
( / = 1 , 2 , . . . , / г ) , |
|
где vi — конечное число.
Выходную функцию автомата р^(ДХ), определенную формулой (2.1.2), задаем при помощи выходной функ
ции |
для |
каждой |
координаты |
Axt |
вектора ДХ, т. е. ис |
|||
пользуя п функций, не зависящих от номера |
шага N: |
|||||||
ptw |
(Axt) =*pi(AxiWrNN) |
|
|
|
(2.1.31) |
|||
|
|
|
|
( / = 1 , 2 , . . . |
n), |
|
|
|
где N — номер шага поиска. |
|
|
|
|
||||
Рассмотрим |
алгоритмы самообучения при поиске по |
|||||||
вершинам |
гиперкуба. Предположим, |
что |
координаты |
|||||
Axi |
(1 = 1,..., |
п) |
вектора ДХ |
могут |
принимать только |
|||
одно |
из |
двух |
значений: + 1 или |
— 1 . Тогда |
множество |
|||
действий |
автомата |
имеет |
|
|
|
|
||
v = 2n |
|
|
|
|
|
|
(2.1.32) |
ПОИСК С САМООБУЧЕНИЕМ
145
элементов, т. е. имеются 2п возможных смещений AX'J' в пространстве {X}. Предположим, что 1-я функция
(2.1.31) зависит только от 1-й координаты |
w\ вектора па |
|
мяти W. Тогда формулу (2.1.31) можно задать в виде |
||
следующих двух формул: |
|
|
Вер (Ax,m^i/WlW)=Fi(gi,Wi); |
|
(2.1.33) |
Вер (Дхг(*> = - 1 М < * > ) = l-Fi{qi,wi) |
(2.1.34) |
|
(/= 1, 2 , . . . , n; |
o; = const, 0<<7;< 1). |
|
Далее будем требовать, чтобы |
функции |
Fi(qi,wi) были |
монотонно возрастающими и чтобы они удовлетворяли условию
0^Fi(qi,Wi)^l |
|
|
(2.1.35) |
(1=1,... |
п). |
|
|
Функция Fi = Fi(qi,wi) |
может |
иметь следующий |
вид: |
1, |
если |
wi>q; |
|
Fi= • у ( 1 + - у ) , |
если |
\wt\^q; |
(2.1.36) |
. О, |
если |
wi<i — q. |
|
Вид этой функции показан на рис. 2.1.1. На изменение
10 — 2014
ГЛАВА II
146
координат Xi вектора W будем |
накладывать ограни |
|||
чение |
|
|
|
|
|
d, |
если |
Wi>d; |
,,Jv. |
wi= |
wi, |
если |
—d^.wi^.d\ |
(2.1.37) |
|
— d, если |
Wi<_ — d. |
|
Теперь рассмотрим, как, используя формулы (2.1.33) и (2.1.34), определить вероятность q^, т. е. вероятность по явления выхода АХ*-»' при условии, что автомат нахо дится в состоянии WW. По определению (2.1.9) поло жено
<7« = Вер (AX = AXU>/W=W<4'>).
Каждый выход AX(J> характеризуется набором своих ко ординат, т. е.
AX(J)=(Ax1 <i),...,Ax„<J)), |
|
|
(2.1.38) |
||||
где |
|
вероятностью Ft(qu |
|
||||
Дл:,0">= / |
+ 1 с |
шг<*>); |
|||||
\ |
—1 с вероятностью |
|
\~Fi(qi,Wi(i)). |
||||
Вероятности |
F^ |
= Fi(qt,Wi^) |
и |
1 — Fi(qt, w^) = 1 — F^ |
|||
зависят от состояния |
W ( |
i ) , в |
котором находится вектор |
||||
W, т. е. от координат |
Wi(i) |
вектора |
W^>. Эта зависимость |
||||
выражается |
формулами |
(2.1.33) |
и |
(2.1.34). Объединяя |
|||
формулы (2.1.33) и (2.1.34), имеем: |
|
||||||
Вер (Ax, = Ax,«>M = ^ ( i |
) ) = у [ 1 - 0 - |
||||||
~2F^)) |
signAx^J], |
|
|
(2.1.39) |
|||
где |
|
|
|
|
|
|
|
|
1, |
если |
г > 0 ; |
|
|
|
|
sign z = |
0, |
если |
г = 0; |
|
|
(2.1.40) |
— 1, если г-<0.
При Алтг<»> = 1 из этого соотношения получаем формулу (2.1.33), а при Ахг ('' = —1 — формулу (2.1.34). Следова тельно,
qij = Вер {Axi = Ax^i\ |
Ахп = Ax„(J)/W = W«>) = |
п
= ( Т У П П - |
sign Д*,и>], (2.1.41) |
ПОИСК С САМООБУЧЕНИЕМ
147
где
W<*>= ( ш ^ ) , . . . , wn^). |
(2.1.42) |
Теперь в общем виде определены все величины, необ ходимые для составления матрицы переходных вероят ностей (2.1.23). После нахождения вектора предельных вероятностей Р = (ри •. •, Рп) для этой цепи Маркова оп ределяется средний выход автомата, т. е. среднее смеще ние в пространстве X на одном шаге поиска:
|
т |
2п |
|
М[АХ}= |
£Pi(2 |
4iMU))- |
(2.1-43)' |
|
i=l |
j=l |
|
В этой формуле сумма |
|
||
M[AX/W«>] = J^ijAX") |
(2.1.44) |
||
является |
средним |
выходом |
автомата при его нахожде |
нии в состоянии W*'*, т. е. средним смещением в прост |
|||
ранстве |
X при значении вектора памяти W = W<*>. Сред |
нее смещение по направлению градиента определяется как скалярное произведение векторов Л1[АХ] и гради
ентного |
вектора |
а = ( а ь . . . , ап) |
оптимизируемой |
функ |
||||
ции Q (X). |
|
|
|
|
|
|
|
|
Далее |
рассмотрим |
несколько |
конкретных |
видов |
фор |
|||
мулы самообучения |
(2.1.3). Пусть функция |
4r = 4 R ( W N _ B |
||||||
A X J V - I , |
A Q V - i ) |
является |
д е т е р м и н и р о в а н н о й и |
|||||
имеет вид |
|
|
|
|
|
|
|
|
|
W N - I - 6 sign AQ'JV-I sign A X J V _ B |
|
|
|||||
|
|
|
|
|
|
если |
I I |
^d]/n; |
|
T~~~, |
|
|
|
если |
\VfN\>dyn, |
||
|
1 |
1 |
|
|
|
|
(2.1.45) |
|
где вектор sign A X определяется как |
|
|
||||||
sgn A X = (sgn |
Axu |
sgn |
Axn); |
|
(2.1.46) |
10*
ГЛАВА II
|
148 |
|
|
sgnz = Jf — 1, если 2 < 0 ; |
(2.1.47) |
||
Б |
\ + 1 , если 2 |
$гО. |
|
Постоянная б здесь определяется формулой
|
|
|
|
|
|
|
(2.1.48) |
|
где k — любое |
фиксированное натуральное |
число |
(k — |
|||||
= 1, 2, |
3,... ); |
d^O. |
Предполагается, |
что каждая ко |
||||
ордината |
wi (1=1,..., |
п) |
вектора памяти |
W=(wi,... |
||||
...,wn) |
может |
находиться в одном из следующих |
2k+1 |
|||||
состояний: |
|
|
|
|
|
|
|
|
wi = d, |
( £ - 1 ) 6 , (/г — 2)6, .... б, 0, - б , - 2 6 , . . . , - |
|
||||||
|
-(k-l)6,-d. |
|
|
|
(2.1.49) |
|||
Тогда вектор памяти W может находиться в одном из |
||||||||
(2k + 1) X (2k + 1) состояний, т. е. множество |
внутренних |
|||||||
состояний |
автомата |
(2.1.5) |
содержит |
(2k + 1) X |
(2k+1) |
элементов. Самообучение заключается в переходе век
тора W из одного состояния |
в другое W<J> в соот |
ветствии с формулой (2.1.45). |
|
Видно, что формула (2.1.45) определяет вероятност ный автомат, вероятности переходов которого зависят от его выходов. Переходы этого автомата определяются стохастическими матрицами (2.1.11) и (2.1.12). По строим эти матрицы. Для удобства перепишем формулу (2.1.45) в виде двух формул в отдельности для случая
нештрафа (AQ'JV<0) и для случая |
штрафа ( A Q ' J V ^ O ) : |
для AQ'JV <0 |
|
WJV-I + 6 sign Д Х Л ' _ Ь если |
| W A - | <d^n; |
|
(2.1.50) |
для A Q V ^ O имеем
Wjv_i — 6 sign A X J V - I , если |WA -| ^d^n;
(2.1.51)
если \WN\>d]ln.
|
ПОИСК С САМООБУЧЕНИЕМ |
149 |
— |
Первая из полученных формул (2.1.50) задает матрицы Ao(i) ( / = 1 . • • •, v), а в т о р а я — (2.1.51) — матрицы Ai(/)
(j=l,...,v).
На рис. 2.1.2 показаны пространства {X} и {W} для
Рис. 2.1.2. Пространство выходов ДХ(') и пространство состоя ний W<J'> автомата.
AQ'<0
4X = 4 X W |
АХ-АХЮ |
Рис. 2.1.3. Переходы автомата при нештрафе (AQ'<0).
ГЛАВА II
|
|
150 |
|
|
|
|
|
|
|
|
|
|
|
•случая, |
когда |
п = 2 и когда |
количество состояний W ( i ) |
||||||||||
вектора W равно |
количеству |
возможных |
смещений Д Х ^ |
||||||||||
в пространстве |
{X}, т. е. когда |
m = 2 n = 4. |
Там же по |
||||||||||
казана |
нумерация |
векторов |
ДХ<-<) и W ( ! ) . На рис. 2.1.3 |
||||||||||
представлены |
полученные по формуле |
(2.1.50) переходы |
|||||||||||
автомата из состояния W<*>> в состояние |
W'i2> при не |
||||||||||||
штрафе |
(AQ'<0) |
|
для различных |
значений |
выхода ДХ( ^ |
||||||||
( / = 1 , 2, 3, 4) |
автомата. Исходя |
из данного |
на рис. 2.1.3 |
||||||||||
графа |
переходов |
при b^d |
|
можно написать |
следующие |
||||||||
матрицы Л 0 (/) переходных вероятностей: |
|
|
|
||||||||||
|
|
1 0 |
0 |
0 |
|
|
|
0 |
1 0 |
0 |
|
||
Л0 (1) |
= |
1 0 |
0 |
0 |
А0{2) |
= |
0 |
1 0 |
0 |
|
|||
1 0 |
0 |
0 |
0 |
1 0 |
0 |
|
|||||||
|
|
|
|
|
|
||||||||
|
|
1 0 |
0 |
0 |
|
|
|
0 |
1 0 |
0 |
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
(2.1.52) |
|
|
0 |
0 |
1 0 |
|
|
|
0 |
0 |
0 |
1 |
|
|
Л ( 3 ) = |
0 |
0 |
1 |
0 |
Л0 |
(4) |
= |
0 |
0 |
0 |
1 |
|
|
0 |
0 |
1 0 |
0 |
0 |
0 |
1 |
|
||||||
|
|
|
|
|
|
||||||||
|
|
0 |
0 |
1 0 |
|
|
|
0 |
0 |
0 |
1 |
|
На рис. 2.1.4 показаны полученные по формуле (2.1.51) переходы автомата из одного состояния в другое при штрафе (AQ'^O) для различных ДХ^'>. Исходя из дан ного на рисунке графа имеем следующие матрицы пере ходных вероятностей A j (/) (/=1,2,3,4) :
|
|
0 |
0 |
0 |
|
|
0 |
0 |
1 0 |
|
Al(l) |
= |
0 |
0 |
0 |
|
Л, (2) |
0 |
0 |
1 0 |
|
0 |
0 |
0 |
|
0 0 |
1 0 |
|||||
|
|
|
|
|||||||
|
|
0 |
0 |
0 |
|
|
0 0 |
1 0 |
||
|
|
|
|
|
|
|
|
|
(2.1.53) |
|
|
|
0 |
1 0 |
0 |
|
1 0 |
0 0 |
|||
Л,(3) |
= |
0 |
1 0 |
0 |
Л.(4) |
1 0 |
0 0 |
|||
0 |
1 0 |
0 |
1 0 |
0 0 |
||||||
|
|
|
||||||||
|
|
0 |
1 0 |
0 |
|
1 0 |
0 0 |
ПОИСК С САМООБУЧЕНИЕМ
151
Рис. 2.1.4. Переходы автомата при штрафе (AQ'SsO).
Матрицы Л0 (/) |
и А\(1) удовлетворяют равенствам |
|||
Л 1 ( 1 ) = Л 0 ( 4 ) ; Л 1 ( 2 ) = Л 0 ( 3 ) ; |
|
4 ) |
||
Л , ( 3 ) = Л 0 ( 2 ) ; Л 1 ( 4 ) = Л 0 ( 1 ) . |
|
|
||
Определим вид следующей |
матрицы: |
|
||
Л (/) = Qi (/) [ (/ - 5 (/)) Л 0 |
(/) + S (/) Л, (/) ] |
(2.1.55) |
||
|
|
|
(/=1,2,3,4) . |
|
Учитывая равенства (2.1.54), имеем: |
|
|||
^(1) =С2*(1)[(/ - 5(1))Л 0 (1) |
+ 5 ( 1 ) Л 0 ( 4 ) ] ; |
|
||
Л (2) =Qi(2)[(I |
— S(2))Л0(2) |
+ 5 ( 2 ) Л 0 ( 3 ) ] ; |
|
|
4 ( 3 ) = Q , ( 3 ) [ ( / - S ( 3 ) M o ( 3 ) + S ( 3 M o ( 2 ) ] ; |
( 2 ' L 5 6 > |
|||
Л (4) = Q j ( 4 ) [ ( / —S(4))Л0 (4) |
+ 5 ( 4 ) Л 0 ( 1 ) ] . |
|