книги из ГПНТБ / Растригин Л.А. Автоматная теория случайного поиска
.pdfПОИСК БЕЗ САМООБУЧЕНИЯ
51
Ъ\ — ах |
— 1 |
S i |
|
|
|
P m = T |
|
|
ГР1=—ри |
|
|
ит |
dm |
I |
Sm |
|
|
После нормировки pi ( i = l |
m) |
имеем |
|||
Pi^~S* |
|
|
|
|
(1.3.7) |
Si |
|
|
|
|
|
( i = l , . . . , m ) , |
|
|
|
||
где |
m |
|
|
|
|
|
|
|
|
|
|
s * - ( 2 t ) ~ 1 - |
|
|
( L 3 - 8 ) |
||
|
3=1 |
' |
|
|
|
Предельный средний штраф |
равен |
||||
P c p = mS*. |
|
|
|
(1.3.9) |
|
Можно |
показать, что имеет место |
неравенство |
|||
0<Pcv<~ |
. |
|
|
|
(1-3.10) |
причем при сг->-оо рС р->-^- и при а->0 рС р->0. Следова тельно, рассмотренный автомат, соответствующий ли нейному алгоритму случайного поиска, обладает целе сообразным поведением в процессе оптимизации при на личии помехи с ограниченной дисперсией.
Пронумеруем направления смещения ДХ( г ) в прост ранстве X следующим образом:
ДХ<1>=( + 1, ... ,+1) ; |
Д Х ( 2 ) = ( + 1 , . . . , |
+ 1 |
, - 1 ) ; ДХ<з> = |
|
= ( + 1 , . . , , + 1 , - 1 , + 1 ) ; |
ДХ<«>=(+1, ... , + 1 , |
|||
- 1 , - 1 ) ; . . . ; |
ДХ<™/2-» = |
( + 1, |
- 1 , |
. . . , - 1 , +1) ; |
\ дх<"^)= ( + 1 , - 1 , . . . , - 1 ) ; |
ДХ<™/2+» = -ДХ(*> |
|||
|
|
|
|
(1.3.11) |
|
( ' |
• ' |
т ) |
- |
Тогда средний вектор смещения в пространстве X будет равен
4*
ГЛАВА I
52
Л * [ Д Х ] = [(
Sm — Sm/2 ^
SmSjn'2 '
Sm/4+2 Sm/4
Srn/4s m/4+m/2
S m — S m / 2 \ С И
^ |
S i + m / 2 — S i |
X |
S i S i 4 - m / 2 |
S m /4+n - m / 2 Sm/4+1 S T O , 4 + i S m / 4 + i - ) - m / 2
!/ S i + m / 2 — S i
|
Sm.Sw.r2 |
' |
N |
SiSi+m/2 |
|
|
S2 +m/2 — S 2 |
|
S 3 + m / 2 — S3 |
|
|
||
S2S2 +m/2 |
|
s 3 S 3 + m / 2 |
|
|
||
S4+m/2 S4 |
|
S m |
S m / 2 |
) S*] , |
(1.3.12) |
|
S4S4+TO/2 |
|
|
Smr&m |
|||
|
|
|
|
|||
где 5* определяется |
формулой (1.3.8). Среднее измене |
|||||
ние показателя |
качества |
|
|
|
||
M[AQ] = S*\ S |
l + w / 2 ~ 5 |
' |
( a i + a 2 + - + a n ) + |
|
LSiSi+ T O /2
,S 2 + T O /2 — S 2
|
|
|
S2S2+m/2 - ( « 1 + |
+ a n - i — a n ) + |
|
|||
|
|
|
S3+m/2~S3 |
••• +an-2 — C t n - l + a n ) |
+ |
|||
|
|
|
S3S3+m /2 ( « 1 + |
|||||
|
|
S4+m/4 — S 4 |
( a H |
han-2 — a n - i — ctn) 4 Ь |
||||
|
|
|
S4S4+m/2 |
|||||
|
|
|
|
|
|
|
||
|
, |
Sm—1 |
STO/2—1 , |
|
. |
|
||
|
H |
|
|
|
(ai— ••• - a n - i + a n ) + |
|
||
|
|
|
Sm—lSm/2—1 |
|
|
|
||
|
. |
S m Sm/2 |
(a, |
a„)] , |
|
(1.3.13) |
||
|
|
|
SjnfeSn |
|
|
|
|
|
где |
a i 2 |
= l |
(напомним, что ai |
— направляющие |
||||
i=l |
|
|
|
|
|
|
|
|
косинусы |
градиента). |
|
|
|
||||
С л у ч а й |
б е з |
в о з д е й с т в и я |
п о м е х и |
необхо |
||||
димо |
рассмотреть |
отдельно. Предположим, что направ |
||||||
ление |
градиента |
функции |
Q(X) удовлетворяет |
условиям |
ПОИСК БЕЗ САМООБУЧЕНИЯ
|
53- |
|
|
|
|
a,i>a2> |
••• > a n > 0 ; |
|
a i > a 2 + ••• + сс„ |
(1.3.14) |
|
Тогда при о-»-0 имеем |
|
|
|
|
|
1 |
при 1 = 1 , . |
|
т |
|
|
' |
2 |
' |
|
||
|
|
(1.3.15) |
|||
|
|
|
|
|
|
О при i = ~ ^ + U |
• • •. |
т - |
|
||
Цепь Маркова является |
неэргодической |
^имеются т |
поглощающих состоянии ) с матрицей переходных веро
ятностей |
1 |
|
1 |
|
|
|
|
|
|
|
1 |
1 |
1 |
1 |
|
||
|
т |
|
т |
т |
т |
т |
т |
|
|
1 |
|
1 |
1 |
1 |
1 |
1 |
(1.3.16) |
|
m |
|
т |
|
m |
m |
т |
|
|
|
|
|
|||||
|
0- |
•0 |
1 |
0- |
•0 |
0 |
|
|
|
0 • •0 |
0 |
0- |
•0 |
1 |
|
||
|
|
|
|
|
|
m |
|
|
|
|
|
|
|
~2~ |
|
|
|
JV-Я степень |
этой матрицы |
будет |
иметь |
вид i4w (S) |
||||
1 |
|
|
1 |
2N- 1 2 W - 1 |
2N- -1 |
|||
2 № - ' m |
|
|
2 * - ' т 2N- m 2N-im |
|
2N- m |
|||
|
|
|
|
|
|
|
|
m |
|
|
|
|
|
|
|
|
T |
1 |
|
|
1 |
2N- |
1 |
2N-l |
|
2N- -1 |
|
|
|
|
2N- |
2N-lm |
|
2N- |
|
0 |
• |
• |
0 |
|
1 |
0 |
... |
о |
|
|
|
|
|
|
|
|
m |
|
|
|
|
|
|
|
|
T |
0 |
• |
• |
0 |
|
0 |
0 |
... |
l |
ГЛАВА I
54
По матрице (1.3.17) находим вектор |
вероятностей pw |
= |
||||||||||||
— |
( p i w |
, • • •, PmiN)) |
пребывания |
автомата |
в |
состоянии |
i |
|||||||
на |
N - м |
шаге: |
|
|
|
|
|
|
|
|
|
|
||
|
|
|
_ L _ ( P l ( 0 ) + . . . + p m / 2 ( 0 ) ) |
п |
р и |
1 = 1 , . . . / ^ ; |
|
|||||||
|
Р ,(N) — |
2N—\ |
|
|
+ / W 0 ) |
) + Р г ( |
|
при 1 = |
|
|||||
|
— |
— |
(Pl(0)+ |
- |
0 ) |
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
т |
|
|
|
|
|
|
|
|
|
|
|
|
|
= у + l , . . . , m , |
||
|
|
|
|
|
|
|
|
|
|
|
|
|
(1.3.18) |
|
где Р<°).= ( p i { 0 } , . . . , р т |
( 0 ) ) |
—• вектор начальных вероят |
||||||||||||
ностей. При |
предельном |
переходе N-+oo |
получаем век |
|||||||||||
тор предельных вероятностей: |
|
|
|
|
|
|
|
|||||||
|
|
|
О |
|
при |
i = l , . . . , |
т |
|
|
|
|
|
|
|
|
|
|
|
— ; |
|
|
|
|
|
|||||
|
Pi |
|
|
2 |
|
|
|
|
|
при |
|
ш |
|
|
|
|
|
P i ( 0 ) + — |
(Pim |
+ - + P m / 2 |
{ 0 ) ) |
i = — + l , . . . , m . |
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
(1.3.19) |
|
Средний |
штраф |
pCp = 0 |
и средний |
вектор |
смещения |
в |
||||||||
пространстве X |
(т / 4 + т / 2 |
|
|
|
|
|
|
|
||||||
|
М[&Х]-- |
|
|
|
т |
|
|
\ |
|
|||||
|
|
|
|
|
i = l + m / 2 |
i = m / 4 + l + m / 2 |
J |
|
||||||
|
|
|
(т / 8 + т / 2 |
|
|
|
|
|
|
|
Г ( 0 ) _ |
|||
|
|
|
|
|
+ т / 2 |
|
|
г=т/4+1+га/2 |
|
|||||
|
|
|
|
т / 4 + т / 8 |
|
|
|
|
|
|||||
|
|
|
|
^ |
|
Рг(0> I , - . . , |
- ( p l + m / 2 ( 0 ) - р 2 + т / 2 ( 0 > + |
|||||||
|
|
|
г ' = 3 / 8 т + 1 + т / 2 |
|
г ' = т / 8 + 1 + т |
|
|
|
|
|
||||
|
|
|
|
г = т / 2 + 1 |
|
|
|
|
|
|
||||
|
|
|
• + p 3 W 2 |
( 0 ) - P 4 + m / 2 ( 0 ) + |
- - Р т т ) |
|
(1.3.20) |
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
ПОИСК БЕЗ САМООБУЧЕНИЯ
55-
Среднее изменение показателя |
|
качества |
|
|
|
||||||||
|
|
|
|
т/2 |
|
|
|
|
|
|
|
|
|
M[AQ]=-ai |
|
|
/ 7 г ( 0 ) |
- P l + m / 2 ( 0 |
) ( « 1 + |
« 2 |
+ |
|
|
||||
|
|
|
|
г=1 |
|
|
|
|
|
|
|
|
|
|
|
••• +ап) |
— Р2+т/2( 0 ) ( a i + |
••• + a n - i — а п ) |
— |
|
|||||||
|
|
— Рз+т/2( 0 ) |
( а |
1 + |
+ а п - 2 —ап _1 + а г а ) — |
|
|
||||||
|
|
— Р4+т/2( 0 ) ( a i + |
••• + а „ - 2 — a n - i —а«) — ••• |
|
|||||||||
|
|
-•• |
—/7m_i<°> (cci — ••• — а п - 1 + |
OCn) — |
|
|
|||||||
|
|
- Р т ( 0 ) ( с ч |
|
|
а п ) . |
|
|
|
|
(1.3.21> |
|||
Рассмотрим |
д в у м е р н ы й |
с л у ч а й |
при наличии по |
||||||||||
мехи |
(я = 2; |
/п = 4). Векторы ДХ<*> пронумеруем в |
следу |
||||||||||
ющем порядке: |
|
|
|
|
|
|
|
|
|
|
|||
дх<1> = (1,1); |
|
|
дх<2) = |
( - 1 , 1 ) ; |
|
|
|
(1.3.22). |
|||||
Д Х ( 3 ) = ( - 1 , - 1 ) ; |
ДХ<«>=(1,-1). |
|
|
|
|||||||||
|
|
|
|
||||||||||
Матрица A (S) |
имеет вид |
|
|
|
|
|
|
||||||
|
|
|
6] |
a] |
ai |
ai |
|
|
|
|
|
|
|
A(S) |
= |
й2 |
b2 |
а2 |
а2 |
|
|
|
|
|
(1.3.23). |
||
а3 |
аъ |
Ъг |
а 3 |
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|||||
|
|
|
Й4 |
G4 |
#4 |
&4 |
|
|
|
|
|
|
|
где |
|
|
|
4-3s< |
|
|
|
|
|
|
|||
а» |
|
|
|
|
|
|
|
|
(1.3.24)) |
||||
|
4 |
|
|
|
4 |
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
||
Si' |
|
|
|
И + |
0С2 |
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
2 1 " |
" \ |
2о |
/J* |
||
|
|
|
|
|
|
|
|
|
|||||
- - 5 [ ' - » ( - а |
й 2 1 |
) ] = |
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
(1.3.25> |
( а ь |
а 2 |
— |
направляющие косинусы |
вектора |
градиента; |
||||||||
a i 2 + a 2 |
2 = l ) . |
(1.3.23) |
следует, что |
цепь Маркова при |
|||||||||
Из |
матрицы |
||||||||||||
постоянных Sj однородная и при офО |
эргодическая. |
ГЛАВА I
56
Вектор |
предельных |
вероятностей P=(pi, |
р2, Рз, Р4) |
|||||
находим, решая систему |
уравнений |
|
|
|||||
P = 4'(S)P, |
|
|
|
|
(1.3.26) |
|||
где A'(S) |
—транспонированная |
матрица |
(1.3.23): |
|||||
Pi- |
1 |
S\S2s3Si |
Р2 = |
1 |
S1S2S3S4 |
|
||
S\ |
S1S3 +S2S4 |
S2 |
S1S3 + |
S2S4 |
||||
|
|
|||||||
|
1 |
S1S2S3S4 |
Pi-- |
1 |
S1S2S3S4 |
|
||
|
s 3 |
SiS3 + S2Si |
Si |
S1S3 + |
S2S4 |
|||
|
|
|||||||
|
|
|
|
|
|
|
(1.3.27) |
|
Средний штраф, подсчитанный по формуле |
(1.2.23), ра |
|||||||
вен |
|
|
|
|
|
|
|
|
|
|
S1S2S3S4 |
|
1 |
|
|
|
S1S3 + S2S4
+ |
1 |
(1.3.28) |
|
||
|
|
Легко заметить, что имеет место неравенство
1
(1.3.29)
Отсюда следует, что соответствующий этому алгоритму вероятностный автомат обладает целесообразным пове дением. Средний вектор смещения в пространстве X
М[АХ]= |
(pi-p2-Pz |
+ Pi, |
Pi + P2-Ps-Pi) |
= |
|
_ |
Г (Sl+S4)S2S3- |
(Sz+S^SjSj |
|
||
|
*• |
S1S3 + |
S2S4 |
|
|
|
(si+s2)s3s4-(s3 |
+ Si)s1s2 |
1 |
(1.3.30) |
|
|
|
|
|
|
s l s 3 + 52s 4
ПОИСК БЕЗ САМООБУЧЕНИЯ
57-
Среднее приращение показателя качества
M[AQ}-- |
+ |
|
2 - Ф 2 |
Ф (sizsjf^a+s)]
|
|
|
_ ф 2 |
( - ± - ) ^ ( ^ ) |
(1.3.31) |
||
|
|
2 |
|
||||
|
предельном |
переходе |
2а |
(если, |
|||
При |
<Х1-»-У2/2, аг->У2/2 |
||||||
+ |
|
|
|
|
|
|
|
выполнено условие о=й=0) находим: |
|
||||||
|
|
|
Ф (Л) |
|
|
||
M [ A Q] = |
|
\ |
2о |
/ |
|
(1.3.32) |
|
Рассмотрим |
случай, |
когда |
ai = l ; а2 = 0. Тогда |
из фор |
|||
мулы |
(1.3.25) |
следует |
|
|
|
||
|
|
|
|
|
|
|
(1.3.33) |
Матрица A(S) |
имеет вид |
|
|
||||
|
|
bi |
й\ |
Ci |
d\ |
|
|
A(S) |
= |
а2 |
Ь2 |
а2 |
а2 |
|
(1.3.34) |
а2 |
а2 |
Ь2 |
а2 |
|
|||
|
|
|
|
||||
|
|
ах |
й\ |
а.\ |
Ь\ |
|
|
В силу симметрии матрица (1.3.34) распадается и по лучаем pi=Pi\ Р2 = Рг- Окончательное уравнение для оп ределения вектора Р приобретает вид
Pi= (bl+ai)pi + 2a2p2; |
(1.3.35) |
|
p 2 = 2 a 1 p I + (b2 + a2)p2 . |
||
|
ГЛАВА I
58
Решая эту систему уравнений, находим:
|
1 |
l — b2 — a2 |
|
Р1=Р4 |
= — |
\-Ь2~а2 |
+ 2аГ |
|
2 |
||
|
1 |
|
2а: |
Р 2 Р г |
2 ' \-b2-a2 |
+ 2al ' |
Подставляя формулы (1.3.24) в выражение учитывая равенства (1.3.33), имеем:
(L3-36>
(1.3.6) и
P l = p 4 = ± S 2 = ± [ l - o ( - L ) ] ;
(1.3.37)
p 2 = P 3 = l S l = l [ l + o ( l b ) ] .
По формуле (1.2.23)
p c p = 2 S l s 2 = - i - y02(^ - ) . |
(1.3.38) |
Из формулы (1.3.38) следует, что автомат, соответствую щий этому алгоритму, обладает целесообразным поведе нием. Среднее приращение показателя качества за один шаг поиска равно
M[AQ] = s 2 - S l = - o ( ^ - ) . |
(1.3.39) |
В пределе при о->0 (а=^=0) получаем:
P l =Pi-^0; |
р 2 = р 3 - ^ - 1 ; р с р - > 0 ; |
M [ A Q ] - ^ - l . |
|
|
(1.3.40) |
При а-^-оо имеем:
(1.3.41)
В случае, когда о = 0, цепь Маркова, описывающая ли нейный алгоритм случайного поиска, является неэргодической, в силу чего этот случай требует отдельного ана лиза.
ПОИСК БЕЗ САМООБУЧЕНИЯ
|
59 |
|
|
|
|
|
|
|
|
Из формул (1.3.25) |
при а = 0 получаем: s i = l; s 2 |
= s 3 = |
|||||||
= 0; s4 = 1. |
|
|
|
|
|
|
|
|
|
Матрица (1.2.23) для д в у м е р н о г о |
с л у ч а я |
б е з |
|||||||
в о з д е й с т в и я |
п о м е х и |
при условии (1.3.14) имеет вид |
|||||||
|
4 |
4 |
4 |
Т |
|
|
|
|
|
A(S) = |
0 |
1 |
0 |
о |
|
|
|
(1.3.42> |
|
0 |
0 |
1 |
о |
|
|
|
|||
|
|
|
|
|
|
||||
|
_1_ _1_ |
|
|
|
|
|
|
||
|
т |
т |
Т |
Т |
|
|
|
|
|
Л^-я степень этой |
матрицы |
|
|
|
|
|
|||
|
|
1 |
2 j Y - l 2 N - l |
1 |
|
|
|||
|
2iv+i |
2n+i |
2N~*1 |
2N+\ |
|
|
|||
|
|
О |
|
1 |
|
О |
О |
(1.3.43), |
|
|
|
О |
|
О |
|
1 |
О |
||
|
|
|
|
|
|
||||
|
|
1 |
2 * - 1 |
2 W - 1 |
1 |
|
|
||
|
2iv+i |
2 l V + 1 |
2 J V + 1 |
2^+' |
|
|
|||
По этой матрице получаем вектор вероятностей на N-щ |
|||||||||
шаге |
|
|
|
|
|
|
|
|
|
|
1 |
|
( P l ( 0 |
) + P 4 ( 0 > ) |
|
при |
i = 1, 4; |
|
|
|
2Л-+1 |
|
|
||||||
|
2 N - l |
|
|
|
|
|
(1.3.44). |
||
|
( P l ( 0 |
) + P 4 ( 0 ) ) |
+ Р г ( 0 ) |
При 1 = 2, 3. |
|
||||
|
2N+l |
|
|
||||||
|
|
|
|
|
|
|
|
|
|
Вектор предельных вероятностей равен |
|
|
|||||||
О |
|
|
|
|
при i= 1, 4; |
(1.3.45) |
|||
|
|
|
|
|
|
|
|
||
р.(о>+ i_ (р 1 (0)+ р4 ( о )) |
П р И |
i = 2,3. |
|
||||||
Средний вектор смещения в пространстве X |
|
||||||||
М [ Д Х ] = ( - 1 , |
- ( Р з ( |
0 ) - р 2 |
( 0 ) ) ) . |
|
(1.3.46) |
ГЛАВА I
60
Д л я среднего приращения функции качества имеем
М[А Q] = - |
а, - |
(р3 |
(0) - р 2 |
(О) y i - а , 2 . |
(1.3.47) |
|
Особо следует рассмотреть случай а\ = а2 |
= ^2\2. Тогда |
|||||
в соответствии |
с определением алгоритма |
(1.2.24) |
||||
|
1 |
1 |
1 |
1 |
|
|
|
4 |
4 |
Т Т |
|
|
|
A(S) = |
0 |
1 |
0 |
0 |
|
(1.3.48) |
|
0 |
0 |
1 |
0 |
|
|
|
0 |
0 |
0 |
1 |
|
|
Вектор предельных вероятностей равен |
|
|||||
0, |
|
|
|
если |
/ = 1 ; |
(1.3.49) |
Рг-- |
|
|
|
|
|
|
+ |
~ P i { 0 |
\ если |
/ = 2,3,4. |
|
||
Р г т |
|
Дл я среднего приращения показателя качества в этом случае имеем
M [ A Q ] = - (4/>1( 0 ) + Р з ( 0 ) ) у 2 . |
(1.3.50) |
§ 1.4. Н Е Л И Н Е Й Н Ы Й А Л Г О Р И Т М С Л У Ч А Й Н О Г О П О И С К А
Для нелинейного алгоритма характерно то, что после удачного шага (AQ'^O) выбирается новое случайное направление шага, а после неудачного шага (AQ'>0) делается возврат в предыдущее состояние. В этом па раграфе исследуем нелинейный алгоритм случайного поиска, определенный формулой (1.2.3) в § 1.1.
Для этого алгоритма матрицы переходных вероятнос тей имеют вид [43]: