Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Растригин Л.А. Автоматная теория случайного поиска

.pdf
Скачиваний:
9
Добавлен:
23.10.2023
Размер:
8.71 Mб
Скачать

ПОИСК БЕЗ САМООБУЧЕНИЯ

 

91

 

 

 

 

при штрафе

 

(AQ'^O)

0

1

0

'0

0

0

0

0

0

'1

0

0

0

0

0

' 1

0

0

 

 

 

 

 

(1.7.15>

0

0

0

1 0

1 0

0

^0

0

0

1

0

0

.0

0

0

Функционирование автомата описывается цепью Мар­ кова

> Si

1 - 5 ! •о 0

0

)

0

0

• 1 0

0

)

0

0

• 1 0

0

 

 

 

 

 

(1.7.16);

) 0

0

'0

5 4

1 — Si

 

0

0

0

0

 

0

0

^0

0

0

где

s, - s, = y [ l + ® ( - g - ) ] ;

(1.7.17)

- • H ' - t e ) ] .

а; — направляющие косинусы вектора-градиента функ­ ции

Q(X) = a i * i + a2X2; a i 2 + a 2 2 = l .

(1.7.18)

ГЛАВА I

92

Предельные вероятности цепи Маркова равны

Pi=P*=-£\

P2=—sr,

pa= —

(l-Si);

(1.7.19)

Рис. 1.7.3. Графы переходов автомата для случая п>2.

ПОИСК БЕЗ САМООБУЧЕНИЯ

93

Средний штраф рабочих шагов

 

 

 

 

 

 

 

 

(1.7.20)

а среднее приращение показателя качества

 

 

M [ A Q ] = | - [ ( l - 2 s 1 ) a , +

(l-2s4)a2]=—У[ ф(~)

а , +

 

 

 

 

 

 

 

 

(1.7.21)

При a-Я) имеем

 

 

 

 

 

 

Рср.р->0;

M

[

A

Q ] (

a

i + a2 ),

 

(1.7.22)

а при а - > о о

 

 

 

 

 

 

 

 

Р с Р . р - > | - ;

 

MAQ1 — 0.

 

 

(1.7.23)

 

 

 

 

3. Многомерный

случай

( я > 2 ) .

 

 

Q ( X ) = ^ й Л ;

 

^ а г

2

= 1 .

 

(1.7.24)

г=1

 

 

г=1

 

 

 

 

Графы переходов

автомата

для этого случая

показаны

на рис. 1.7.3. Матрицы переходов имеют вид

 

 

при нештрафе (AQ'<0)

 

 

 

 

в3

вх

о

о ••• о

о

 

 

0 В3ВХ

о

••• о

о

 

 

Л 0 =

 

 

 

 

вх

 

(1.7.25)

о

о

о

о

••• в 3

 

 

вх о

о

о

••• о

въ

 

 

ГЛАВА I

34

 

 

 

 

 

при штрафе

(AQ'^O)

 

 

В2

Bi

О О ••• О О

 

О В2 Bi О

О

о

 

 

 

 

 

 

 

(1.7.26)

0

0

0

0

В3

Bi

 

в ,

о

о

о

О

£ 3

 

где

 

 

 

 

 

 

О О О

 

 

О 1 О

О 0 1

1 0

0

 

В 2 =

О О О

В 3 = ,0 О О (1.7.27)

1 О О

 

 

;0 О О

О О О

Функционирование автомата в случайной среде, задан­ ной функцией (1.7.24), описывается цепью Маркова

 

В(s^

Bi

О

О-

О

О

 

 

О

B(s2)

Bi

0 -

0

О

A{S)

=

 

 

 

 

 

(1.7.28)

 

 

О

о

О 0-B(sn-i)

В{

 

 

Bi

о

О

0 -

0

B(sn)

Здесь

 

 

 

 

 

 

 

 

О

Si

l—Si

 

 

 

 

 

0

0

О

 

 

 

(1.7.29)

 

О О О

 

 

 

 

 

 

 

 

 

 

 

(1.7.30)

где Ф

— интеграл

Лапласа.

Обозначим через Р* =

=(Рзг-2, рзг-и Рг%) вектор предельных вероятностей, со­

ответствующий i-й переменной функции (1.7.24). Для определения этих векторов по матрице (1.7.28) составим систему векторных уравнений:

 

 

 

ПОИСК БЕЗ САМООБУЧЕНИЯ

 

 

 

95

 

 

P, = P 1 B ( s , ) + P « B 1 ;

 

 

 

P2

= P1Bi

+

P2B(s2);

 

 

 

Рз = Р 2 5 , + Р 8 Я ( 5 8 ) ;

 

 

 

Pi

= Pi _1 51

+ P i 5(s i );

 

 

 

P n = P„ _ 1 B 1 + P n 5 ( s „ ) .

 

 

Из i-го векторного уравнения этой системы

следует

 

1 —Si

1+Sj

 

О О О

 

Pi

О

1

О

= Рг-I !

1 О О

(1.7.32)

 

О

0

1

I

i 1 о о

 

Отсюда для

координат

векторов Р; и Рг -1 получаем со­

отношения

 

 

 

 

 

P3i-2 = Рз(г—1)—1 + Рз(г-1) = Рзг-4 +

Рзг'-3 = РЗг-5'.

 

Р з г - 1 = Р з г - 2 5 г ;

 

 

(1.7.33)

P 3 i = P 3 i - 2 ( l - S j ) .

Из первого уравнения системы (1.7.31) имеем:

Р1 = Рзп-1 + Рз«;

p2 = s.p.;

(1.7.34)

Р з = (1 —Si)/?i-

 

После нормировки величин pj (/ = 1, 2, . . . , 3 я ) находим

Р з г - 1 = - | ^

( i = l , . . . . п);

(1.7.35)

ГЛАВА I

96-

 

 

 

 

Средний штраф рабочих шагов равен

 

 

V f l - s t

,

( l - S i ) S i ]

V

{l-st)st

 

 

 

 

(1.7.36)

а среднее смещение по направлению

градиента

 

M[AQ]= J£ {pzi-P3i-i)ca=

^ l - 2 s i

 

—h2

»(•%)«•

с - 7 - 3 7 »

i

= l

 

Для случая отсутствия помех (a=0) имеем

 

 

п

 

Pcp.p=0; A f [ A Q ] = - - ^ - J ^ a * ,

(1.7.38)

 

г=1

 

а при 0->-оо

 

 

Р с Р . р - ^ | - ; M[AQ]->0.

(1.7.39)

§1.8. А Л Г О Р И Т М П А Р А Л Л Е Л Ь Н О Г О

ГР А Д И Е Н Т А

Рассмотрим параллельную модификацию метода. Этот алгоритм представляет собой поиск по вер­ шинам гиперкуба. По всем координатам делаются проб­ ные шаги и определяется полярное направление гради­ ента. Это полярное направление соответствует направле­ нию на вершину гиперкуба, которая наиболее близка к направлению градиента. Схема алгоритма параллель­ ного градиента показана на рис. 1.8.1. Алгоритм в тер­ минах теории автоматов представляется в виде двух

автоматов

— а в т о м а т а

п р о б н ы х

ш а г о в

Л< П ) ,

имеющего

п + 1 внутренних

состояний, и

а в т о м а т а

р а б о ч и х

ш а г о в Л<Р>, имеющего т+l

(т = 2п)

внут­

ренних состояний.

Пронумеруем возможные рабочие шаги АХ<'> в сле­ дующем порядке:

ПОИСК БЕЗ САМООБУЧЕНИЯ

97

Рис. 1.8.1. Схема оптимизации методом параллельного градиента.

ДХО)= (1, . .. , I ) ; А Х ( 2 ) = ( 1 , . . . , 1, - 1 ) ;

ДХ(з> =

= ( 1 , . . . , 1, - 1 , 1 ) ; Д Х « > = ( 1 , . . . , 1, - 1 , - 1 ) ; . . .

. . , ; д х < ™ / 2 - 1 > = ( 1 , - 1 , . . . , - 1 , 1);

• • • ;

ДХ'»/2=

= ( 1 , - 1 , . . . , - 1 ) ; ДХ<«+*> = -ДХ<*>

(1.8.1)

( / = 1 , 2 , . . . . f ) .

У автомата пробных являются пробные шаги фиктивное состояние — томата рабочих шагов

шагов внутренними состояниями g^i (их число равно п) и одно автомат рабочих шагов. У ав­ внутренними состояниями явля-

7 — 2014

ГЛАВА I

98

 

ются рабочие шаги A X ( i )

(их число равно m = 2n ) и одно

фиктивное состояние — автомат пробных шагов.

Определим множество

входов автоматов. Пусть вхо­

дом автомата пробных шагов Л ( П ) является знак при­ ращения функции качества. Входы автомата рабочих шагов Л ( Р ' определим следующим образом. Пусть в со­ стояниях от 1 до т автомат принимает на вход только

числа

с = 0 и с = 1 , а в состоянии т + 1

(фиктивное состоя­

ние)

— только векторы С = и ...,

сп), координаты с*

которых могут иметь значения 0 или 1. При этом i-я ко­ ордината вектора С равна нулю, если автомат пробных

шагов Л ( П > в 1-м

состоянии не получил

штрафа

(с = 0), и

равна единице, если получил штраф

( с = 1 ) .

Следова­

тельно, вектор С=(си...,сп)

при

представляет собой набор

величин

с,

полученных

пробных

шагах.

Векторы

Cj-= х^\

,..,

cn(i)),

количество

которых

равно

2™, про­

нумеруем в том же порядке, как рабочие

шаги АХ'»', т.е.

d = ( 0 ,

. . . , 0 ) ; С 2 = ( 0 ,

. . . , 0 ,

1); С 3 = ( 0 , . . . , 0 ,

1,0); . . .

 

 

Cm /2-i=(0,

1, 1 , . . . ,

1,0);

C m / 2 = ( 0 ,

1 , . . .

 

 

\);...;Ст-,=

(1, 1 , . . . , 1,0);

C m = (1, . . . , 1).

 

 

 

 

 

 

 

 

 

(1.8.2)

Нетрудно заметить, что векторы Сг (i= 1 , . . . , 2") об­ разуются некоторым неоднородным а в т о м а т о м «па­ м я т и » со следующими, зависящими от номера шага N матрицами переходов:

I '

 

0

I 2^-1

0

 

/

2iv-i

2n

 

J.2n_2N-i

—2N"1

 

 

 

(1.8.3)

0

1

0

 

О О О

^ 2n 2w-'

2JV-I 2w-i

 

2n—2N

 

где / — единичная

матрица порядка 2^ 1 (Л/ =

= 1 , 2 , . . . , л ) .

 

 

 

ПОИСК БЕЗ САМООБУЧЕНИЯ

 

 

99

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таким образом, автомат рабочих шагов A( P> пред­

 

ставляет

собой

а в т о м а т

 

с о г р а н и ч е н и я м и

 

н а

 

в х о д е .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

На рис. 1.8.2 показаны графы переходов из

одного со­

 

стояния в другое для автомата пробных шагов Л ( П ) и для

 

автомата

 

рабочих

 

шагов

Л<Р>

при

 

с = 0;

с = 1 ;

Cj

 

=

 

= (ci<J>,..., cn{i))

Из

 

этого

рисунка

получаем следую­

 

щие матрицы переходных

вероятностей:

 

 

 

 

 

 

1) для

 

автомата

 

пробных

 

шагов

(переходные

мат­

 

рицы штрафа и нештрафа

совпадают)

 

 

 

 

 

 

 

 

 

 

 

0

1 0

0 ••• 0

0

 

 

 

 

 

 

 

 

 

л ,

л

,

,

О 0

1

0 ••• 0

0

I .

 

 

 

/ f

.

 

. ч

 

Л,(п)=Л0

(п ) = :

 

_

0

0

0

л

 

\ \ п + 1

 

(1.8.4)

 

'

 

 

 

i 0

••• 0

1

' '

 

 

v

 

 

 

 

 

 

 

1

о

о

о ••• о

о

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

п+1

 

 

 

 

 

 

 

 

 

 

 

2) для автомата

рабочих шагов

 

 

 

 

 

 

 

 

 

10

0 ••• 0

0 ••• 0

1

 

 

 

 

 

 

 

 

 

 

 

 

0

0 ••• 0

0 -

0

1

 

 

 

 

 

(1.8.5)

 

Л ; ( р > =

 

 

 

 

 

 

 

 

 

тп+1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m+l —j

 

 

 

 

 

 

 

 

 

 

 

а)

о-

 

 

 

 

 

 

 

 

 

 

 

 

с-0

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

П+1

с-1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(р)

 

 

 

 

Рис.

1.8.2. Графы

переходов

автомата

пробных

тагов

 

 

 

 

(а)

и автомата рабочих

шагов

(б).

 

 

 

 

 

 

 

 

7*

ГЛАВА I

100

Здесь индекс у обозначает состояние рабочего авто­ мата, на которое он переходит из фиктивного состояния. При этом у совпадает с номером вектора штрафа Cj =

= ( с 1 0 ) , . . . , с „ « ) ) .

Объединяя автомат пробных и автомат рабочих ша­

гов, получаем

автомат, количество

состояний которого

равно п + т и переходные матрицы

имеют вид

0 • • 0 0 • • 1 0 0 • • 0

 

0 • • 0 0 • • 1

0

0 • • 0

 

0 • • 0

0 • • 1

0

0 • • 0

(1.8.6)

0 • • 0 0 • • 0 1 0 • • 0

 

0 • • 0

0 • • 0

0

0 • • 1

 

0 • • 1

0 • • 0 0 0 • • 0

 

j

п

т

 

Среда задается

вероятностями появления векторов

C j = ( c i ^ , . . . , c„(i>),

т. е. вероятностями qj выбора у'-го

рабочего шага после окончания пробных шагов. Вектор

вероятностей

Q = (q\,...,

q2n),

согласно

нумерации век­

торов ДХ<э"> (1.8.1) и переходных матриц

(1.8.3), опреде­

ляется формулой

 

 

 

п

 

 

 

 

Q = Q0)JJ

[SNA, (N) +

(1 - sN)

Л 0 (N) ].

(1.8.7)

Л'=1

 

 

 

 

Здесь Q< 0 ) — 2п -мерный начальный вектор состояний автомата «памяти» (1.8.3); Q ( 0 , = (1, 0,...

. . . . 0);

s,v вероятность штрафа iV-ro пробного шага;

sN=Bep

( A Q V ^ 0 ) = у [ 1 + Ф ( ^ ) ] '

( 1 ' 8 - 8 )

где <xN (N=\,...,n) — направляющие косинусы гради­ ента функции Q(X).

Соседние файлы в папке книги из ГПНТБ