книги из ГПНТБ / Растригин Л.А. Автоматная теория случайного поиска
.pdfПОИСК БЕЗ САМООБУЧЕНИЯ
|
91 |
|
|
|
|
при штрафе |
|
(AQ'^O) |
|||
0 |
1 |
0 |
'0 |
0 |
0 |
0 |
0 |
0 |
'1 |
0 |
0 |
0 |
0 |
0 |
' 1 |
0 |
0 |
|
|
|
|
|
(1.7.15> |
0 |
0 |
0 |
'о |
1 0 |
|
1 0 |
0 |
^0 |
0 |
0 |
|
1 |
0 |
0 |
.0 |
0 |
0 |
Функционирование автомата описывается цепью Мар кова
> Si |
1 - 5 ! •о 0 |
0 |
|||
) |
0 |
0 |
• 1 0 |
0 |
|
) |
0 |
0 |
• 1 0 |
0 |
|
|
|
|
|
|
(1.7.16); |
) 0 |
0 |
'0 |
5 4 |
1 — Si |
|
|
0 |
0 |
'о |
0 |
0 |
|
0 |
0 |
^0 |
0 |
0 |
где
s, - s, = y [ l + ® ( - g - ) ] ; |
(1.7.17) |
- • H ' - t e ) ] .
а; — направляющие косинусы вектора-градиента функ ции
Q(X) = a i * i + a2X2; a i 2 + a 2 2 = l . |
(1.7.18) |
ГЛАВА I
92
Предельные вероятности цепи Маркова равны
Pi=P*=-£\ |
P2=—sr, |
pa= — |
(l-Si); |
(1.7.19)
Рис. 1.7.3. Графы переходов автомата для случая п>2.
ПОИСК БЕЗ САМООБУЧЕНИЯ
93
Средний штраф рабочих шагов
|
|
|
|
|
|
|
|
(1.7.20) |
а среднее приращение показателя качества |
|
|
||||||
M [ A Q ] = | - [ ( l - 2 s 1 ) a , + |
(l-2s4)a2]=—У[ ф(~) |
а , + |
||||||
|
|
|
|
|
|
|
|
(1.7.21) |
При a-Я) имеем |
|
|
|
|
|
|
||
Рср.р->0; |
M |
[ |
A |
Q ] ( |
a |
i + a2 ), |
|
(1.7.22) |
а при а - > о о |
|
|
|
|
|
|
|
|
Р с Р . р - > | - ; |
|
MAQ1 — 0. |
|
|
(1.7.23) |
|||
|
|
|
|
|||||
3. Многомерный |
случай |
( я > 2 ) . |
|
|
||||
Q ( X ) = ^ й Л ; |
|
^ а г |
2 |
= 1 . |
|
(1.7.24) |
||
г=1 |
|
|
г=1 |
|
|
|
|
|
Графы переходов |
автомата |
для этого случая |
показаны |
|||||
на рис. 1.7.3. Матрицы переходов имеют вид |
|
|
||||||
при нештрафе (AQ'<0) |
|
|
|
|
||||
в3 |
вх |
о |
о ••• о |
о |
|
|
||
0 В3ВХ |
о |
••• о |
о |
|
|
|||
Л 0 = |
|
|
|
|
вх |
|
(1.7.25) |
|
о |
о |
о |
о |
••• в 3 |
|
|
||
вх о |
о |
о |
••• о |
въ |
|
|
ГЛАВА I
34 |
|
|
|
|
|
|
при штрафе |
(AQ'^O) |
|
|
|||
В2 |
Bi |
О О ••• О О |
|
|||
О В2 Bi О |
О |
о |
|
|||
|
|
|
|
|
|
(1.7.26) |
0 |
0 |
0 |
0 |
В3 |
Bi |
|
в , |
о |
о |
о |
О |
£ 3 |
|
где |
|
|
|
|
|
|
О О О |
|
|
О 1 О |
О 0 1 |
||
1 0 |
0 |
|
В 2 = |
О О О |
В 3 = ,0 О О (1.7.27) |
|
1 О О |
|
|
;0 О О |
О О О |
Функционирование автомата в случайной среде, задан ной функцией (1.7.24), описывается цепью Маркова
|
В(s^ |
Bi |
О |
О- |
О |
О |
|
|
|
О |
B(s2) |
Bi |
0 - |
0 |
О |
A{S) |
= |
|
|
|
|
|
(1.7.28) |
|
|
О |
о |
О 0-B(sn-i) |
В{ |
||
|
|
Bi |
о |
О |
0 - |
0 |
B(sn) |
Здесь |
|
|
|
|
|
|
|
|
О |
Si |
l—Si |
|
|
|
|
|
0 |
0 |
О |
|
|
|
(1.7.29) |
|
О О О |
|
|
|
|
||
|
|
|
|
|
|
|
(1.7.30) |
где Ф |
— интеграл |
Лапласа. |
Обозначим через Р* = |
=(Рзг-2, рзг-и Рг%) вектор предельных вероятностей, со
ответствующий i-й переменной функции (1.7.24). Для определения этих векторов по матрице (1.7.28) составим систему векторных уравнений:
|
|
|
ПОИСК БЕЗ САМООБУЧЕНИЯ |
|
||
|
|
95 |
|
|
• |
|
P, = P 1 B ( s , ) + P « B 1 ; |
|
|
|
|||
P2 |
= P1Bi |
+ |
P2B(s2); |
|
|
|
Рз = Р 2 5 , + Р 8 Я ( 5 8 ) ; |
|
|
|
|||
Pi |
= Pi _1 51 |
+ P i 5(s i ); |
|
|
|
|
P n = P„ _ 1 B 1 + P n 5 ( s „ ) . |
|
|
||||
Из i-го векторного уравнения этой системы |
следует |
|||||
|
1 —Si |
— 1+Sj |
|
О О О |
|
|
Pi |
О |
1 |
О |
= Рг-I ! |
1 О О |
(1.7.32) |
|
О |
0 |
1 |
I |
i 1 о о |
|
Отсюда для |
координат |
векторов Р; и Рг -1 получаем со |
||||
отношения |
|
|
|
|
|
|
P3i-2 = Рз(г—1)—1 + Рз(г-1) = Рзг-4 + |
Рзг'-3 = РЗг-5'. |
|
||||
Р з г - 1 = Р з г - 2 5 г ; |
|
|
(1.7.33) |
P 3 i = P 3 i - 2 ( l - S j ) .
Из первого уравнения системы (1.7.31) имеем:
Р1 = Рзп-1 + Рз«;
p2 = s.p.; |
(1.7.34) |
Р з = (1 —Si)/?i- |
|
После нормировки величин pj (/ = 1, 2, . . . , 3 я ) находим
Р з г - 1 = - | ^ |
( i = l , . . . . п); |
(1.7.35) |
ГЛАВА I
96- |
|
|
|
|
Средний штраф рабочих шагов равен |
|
|
||
V f l - s t |
, |
( l - S i ) S i ] |
V |
{l-st)st |
|
|
|
|
(1.7.36) |
а среднее смещение по направлению |
градиента |
|
||
M[AQ]= J£ {pzi-P3i-i)ca= |
^ l - 2 s i |
|
—h2 |
»(•%)«• |
с - 7 - 3 7 » |
i |
= l |
|
Для случая отсутствия помех (a=0) имеем |
|
|
|
п |
|
Pcp.p=0; A f [ A Q ] = - - ^ - J ^ a * , |
(1.7.38) |
|
|
г=1 |
|
а при 0->-оо |
|
|
Р с Р . р - ^ | - ; M[AQ]->0. |
(1.7.39) |
§1.8. А Л Г О Р И Т М П А Р А Л Л Е Л Ь Н О Г О
ГР А Д И Е Н Т А
Рассмотрим параллельную модификацию метода. Этот алгоритм представляет собой поиск по вер шинам гиперкуба. По всем координатам делаются проб ные шаги и определяется полярное направление гради ента. Это полярное направление соответствует направле нию на вершину гиперкуба, которая наиболее близка к направлению градиента. Схема алгоритма параллель ного градиента показана на рис. 1.8.1. Алгоритм в тер минах теории автоматов представляется в виде двух
автоматов |
— а в т о м а т а |
п р о б н ы х |
ш а г о в |
Л< П ) , |
имеющего |
п + 1 внутренних |
состояний, и |
а в т о м а т а |
|
р а б о ч и х |
ш а г о в Л<Р>, имеющего т+l |
(т = 2п) |
внут |
ренних состояний.
Пронумеруем возможные рабочие шаги АХ<'> в сле дующем порядке:
ПОИСК БЕЗ САМООБУЧЕНИЯ
97
Рис. 1.8.1. Схема оптимизации методом параллельного градиента.
ДХО)= (1, . .. , I ) ; А Х ( 2 ) = ( 1 , . . . , 1, - 1 ) ; |
ДХ(з> = |
|
= ( 1 , . . . , 1, - 1 , 1 ) ; Д Х « > = ( 1 , . . . , 1, - 1 , - 1 ) ; . . . |
||
. . , ; д х < ™ / 2 - 1 > = ( 1 , - 1 , . . . , - 1 , 1); |
• • • ; |
ДХ'»/2= |
= ( 1 , - 1 , . . . , - 1 ) ; ДХ<«+*> = -ДХ<*> |
(1.8.1) |
( / = 1 , 2 , . . . . f ) .
У автомата пробных являются пробные шаги фиктивное состояние — томата рабочих шагов
шагов внутренними состояниями g^i (их число равно п) и одно автомат рабочих шагов. У ав внутренними состояниями явля-
7 — 2014
ГЛАВА I
98 |
|
ются рабочие шаги A X ( i ) |
(их число равно m = 2n ) и одно |
фиктивное состояние — автомат пробных шагов. |
|
Определим множество |
входов автоматов. Пусть вхо |
дом автомата пробных шагов Л ( П ) является знак при ращения функции качества. Входы автомата рабочих шагов Л ( Р ' определим следующим образом. Пусть в со стояниях от 1 до т автомат принимает на вход только
числа |
с = 0 и с = 1 , а в состоянии т + 1 |
(фиктивное состоя |
ние) |
— только векторы С = (си ..., |
сп), координаты с* |
которых могут иметь значения 0 или 1. При этом i-я ко ордината вектора С равна нулю, если автомат пробных
шагов Л ( П > в 1-м |
состоянии не получил |
штрафа |
(с = 0), и |
||||||
равна единице, если получил штраф |
( с = 1 ) . |
Следова |
|||||||
тельно, вектор С=(си...,сп) |
при |
представляет собой набор |
|||||||
величин |
с, |
полученных |
пробных |
шагах. |
Векторы |
||||
Cj-= (сх^\ |
,.., |
cn(i)), |
количество |
которых |
равно |
2™, про |
|||
нумеруем в том же порядке, как рабочие |
шаги АХ'»', т.е. |
||||||||
d = ( 0 , |
. . . , 0 ) ; С 2 = ( 0 , |
. . . , 0 , |
1); С 3 = ( 0 , . . . , 0 , |
1,0); . . . |
|||||
|
|
Cm /2-i=(0, |
1, 1 , . . . , |
1,0); |
C m / 2 = ( 0 , |
1 , . . . |
|||
|
|
\);...;Ст-,= |
(1, 1 , . . . , 1,0); |
C m = (1, . . . , 1). |
|||||
|
|
|
|
|
|
|
|
|
(1.8.2) |
Нетрудно заметить, что векторы Сг (i= 1 , . . . , 2") об разуются некоторым неоднородным а в т о м а т о м «па м я т и » со следующими, зависящими от номера шага N матрицами переходов:
I ' |
|
0 |
I 2^-1 |
0 |
|
/ |
|
2iv-i |
2n |
|
J.2n_2N-i |
—2N"1 |
|||
|
|
|
(1.8.3) |
0 |
1 |
0 |
|
О О О |
^ 2n —2w-' |
||
2JV-I 2w-i |
|
2n—2N |
|
где / — единичная |
матрица порядка 2^ 1 (Л/ = |
||
= 1 , 2 , . . . , л ) . |
|
|
|
ПОИСК БЕЗ САМООБУЧЕНИЯ
|
|
99 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Таким образом, автомат рабочих шагов A( P> пред |
|
||||||||||||||||||
ставляет |
собой |
а в т о м а т |
|
с о г р а н и ч е н и я м и |
|
н а |
|
||||||||||||
в х о д е . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
На рис. 1.8.2 показаны графы переходов из |
одного со |
|
|||||||||||||||||
стояния в другое для автомата пробных шагов Л ( П ) и для |
|
||||||||||||||||||
автомата |
|
рабочих |
|
шагов |
Л<Р> |
при |
|
с = 0; |
с = 1 ; |
Cj |
|
= |
|
||||||
= (ci<J>,..., cn{i)) |
• Из |
|
этого |
рисунка |
получаем следую |
|
|||||||||||||
щие матрицы переходных |
вероятностей: |
|
|
|
|
|
|
||||||||||||
1) для |
|
автомата |
|
пробных |
|
шагов |
(переходные |
мат |
|
||||||||||
рицы штрафа и нештрафа |
совпадают) |
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
0 |
1 0 |
0 ••• 0 |
0 |
|
|
|
|
|
|
|
|
|
|||
л , |
л |
, |
, |
О 0 |
1 |
0 ••• 0 |
0 |
I . |
|
|
|
/ f |
. |
|
. ч |
|
|||
Л,(п)=Л0 |
(п ) = : |
|
_ |
0 |
0 |
0 |
л |
|
\ \ п + 1 |
|
(1.8.4) |
|
' |
||||||
|
|
|
• |
i 0 |
••• 0 |
1 |
' ' |
|
|
v |
|
|
|
||||||
|
|
|
|
1 |
о |
о |
о ••• о |
о |
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
п+1 |
|
|
|
|
|
|
|
|
|
|
|
|
2) для автомата |
рабочих шагов |
|
|
|
|
|
|
|
|
||||||||||
|
10 |
0 ••• 0 |
0 ••• 0 |
1 |
|
|
|
|
|
|
|
|
|
|
|||||
|
|
0 |
0 ••• 0 |
0 - |
0 |
1 |
|
|
|
|
|
(1.8.5) |
|
||||||
Л ; ( р > = |
|
|
|
|
|
|
|
|
|
тп+1 |
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
m+l —j |
|
|
|
|
|
|
|
|
|
|
|
||
а) |
о- |
|
|
|
|
|
|
|
|
|
|
|
|
с-0 |
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
П+1 |
с-1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(р) |
|
|
|
|
Рис. |
1.8.2. Графы |
переходов |
автомата |
пробных |
тагов |
|
|
|
|
||||||||||
(а) |
и автомата рабочих |
шагов |
(б). |
|
|
|
|
|
|
|
|
7*
ГЛАВА I
100
Здесь индекс у обозначает состояние рабочего авто мата, на которое он переходит из фиктивного состояния. При этом у совпадает с номером вектора штрафа Cj =
= ( с 1 0 ) , . . . , с „ « ) ) .
Объединяя автомат пробных и автомат рабочих ша
гов, получаем |
автомат, количество |
состояний которого |
|||
равно п + т и переходные матрицы |
имеют вид |
||||
0 • • 0 0 • • 1 0 0 • • 0 |
|
||||
0 • • 0 0 • • 1 |
0 |
0 • • 0 |
|
||
0 • • 0 |
0 • • 1 |
0 |
0 • • 0 |
(1.8.6) |
|
0 • • 0 0 • • 0 1 0 • • 0 |
|||||
|
|||||
0 • • 0 |
0 • • 0 |
0 |
0 • • 1 |
|
|
0 • • 1 |
0 • • 0 0 0 • • 0 |
|
j |
п |
т |
|
Среда задается |
вероятностями появления векторов |
C j = ( c i ^ , . . . , c„(i>), |
т. е. вероятностями qj выбора у'-го |
рабочего шага после окончания пробных шагов. Вектор
вероятностей |
Q = (q\,..., |
q2n), |
согласно |
нумерации век |
торов ДХ<э"> (1.8.1) и переходных матриц |
(1.8.3), опреде |
|||
ляется формулой |
|
|
|
|
п |
|
|
|
|
Q = Q0)JJ |
[SNA, (N) + |
(1 - sN) |
Л 0 (N) ]. |
(1.8.7) |
Л'=1 |
|
|
|
|
Здесь Q< 0 ) — 2п -мерный начальный вектор состояний автомата «памяти» (1.8.3); Q ( 0 , = (1, 0,...
. . . . 0);
s,v — вероятность штрафа iV-ro пробного шага;
sN=Bep |
( A Q V ^ 0 ) = у [ 1 + Ф ( ^ ) ] ' |
( 1 ' 8 - 8 ) |
где <xN (N=\,...,n) — направляющие косинусы гради ента функции Q(X).