Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Растригин Л.А. Автоматная теория случайного поиска

.pdf
Скачиваний:
7
Добавлен:
23.10.2023
Размер:
8.71 Mб
Скачать

ПОИСК БЕЗ САМООБУЧЕНИЯ

51

Ъ\ — ах

1

S i

 

 

P m = T

 

 

ГР1=ри

 

ит

dm

I

Sm

 

 

После нормировки pi ( i = l

m)

имеем

Pi^~S*

 

 

 

 

(1.3.7)

Si

 

 

 

 

 

( i = l , . . . , m ) ,

 

 

 

где

m

 

 

 

 

 

 

 

 

 

s * - ( 2 t ) ~ 1 -

 

 

( L 3 - 8 )

 

3=1

'

 

 

 

Предельный средний штраф

равен

P c p = mS*.

 

 

 

(1.3.9)

Можно

показать, что имеет место

неравенство

0<Pcv<~

.

 

 

 

(1-3.10)

причем при сг->-оо рС р->-^- и при а->0 рС р->0. Следова­ тельно, рассмотренный автомат, соответствующий ли­ нейному алгоритму случайного поиска, обладает целе­ сообразным поведением в процессе оптимизации при на­ личии помехи с ограниченной дисперсией.

Пронумеруем направления смещения ДХ( г ) в прост­ ранстве X следующим образом:

ДХ<1>=( + 1, ... ,+1) ;

Д Х ( 2 ) = ( + 1 , . . . ,

+ 1

, - 1 ) ; ДХ<з> =

= ( + 1 , . . , , + 1 , - 1 , + 1 ) ;

ДХ<«>=(+1, ... , + 1 ,

- 1 , - 1 ) ; . . . ;

ДХ<™/2-» =

( + 1,

- 1 ,

. . . , - 1 , +1) ;

\ дх<"^)= ( + 1 , - 1 , . . . , - 1 ) ;

ДХ<™/2+» = -ДХ(*>

 

 

 

 

(1.3.11)

 

( '

• '

т )

-

Тогда средний вектор смещения в пространстве X будет равен

4*

ГЛАВА I

52

Л * [ Д Х ] = [(

Sm Sm/2 ^

SmSjn'2 '

Sm/4+2 Sm/4

Srn/4s m/4+m/2

S m — S m / 2 \ С И

^

S i + m / 2 — S i

X

S i S i 4 - m / 2

S m /4+n - m / 2 Sm/4+1 S T O , 4 + i S m / 4 + i - ) - m / 2

!/ S i + m / 2 — S i

 

Sm.Sw.r2

'

N

SiSi+m/2

 

S2 +m/2 S 2

 

S 3 + m / 2 — S3

 

 

S2S2 +m/2

 

s 3 S 3 + m / 2

 

 

S4+m/2 S4

 

S m

S m / 2

) S*] ,

(1.3.12)

S4S4+TO/2

 

 

Smr&m

 

 

 

 

где 5* определяется

формулой (1.3.8). Среднее измене­

ние показателя

качества

 

 

 

M[AQ] = S*\ S

l + w / 2 ~ 5

'

( a i + a 2 + - + a n ) +

 

LSiSi+ T O /2

,S 2 + T O /2 — S 2

 

 

 

S2S2+m/2 - ( « 1 +

+ a n - i — a n ) +

 

 

 

 

S3+m/2~S3

••• +an-2 C t n - l + a n )

+

 

 

 

S3S3+m /2 ( « 1 +

 

 

S4+m/4 S 4

( a H

han-2 — a n - i — ctn) 4 Ь

 

 

 

S4S4+m/2

 

 

 

 

 

 

 

 

,

Sm1

STO/2—1 ,

 

.

 

 

H

 

 

 

(ai— ••• - a n - i + a n ) +

 

 

 

 

Sm—lSm/2—1

 

 

 

 

.

S m Sm/2

(a,

a„)] ,

 

(1.3.13)

 

 

 

SjnfeSn

 

 

 

 

где

a i 2

= l

(напомним, что ai

направляющие

i=l

 

 

 

 

 

 

 

косинусы

градиента).

 

 

 

С л у ч а й

б е з

в о з д е й с т в и я

п о м е х и

необхо­

димо

рассмотреть

отдельно. Предположим, что направ­

ление

градиента

функции

Q(X) удовлетворяет

условиям

ПОИСК БЕЗ САМООБУЧЕНИЯ

 

53-

 

 

 

 

a,i>a2>

••• > a n > 0 ;

 

a i > a 2 + ••• + сс„

(1.3.14)

Тогда при о-»-0 имеем

 

 

 

 

1

при 1 = 1 , .

 

т

 

 

'

2

'

 

 

 

(1.3.15)

 

 

 

 

 

О при i = ~ ^ + U

• • •.

т -

 

Цепь Маркова является

неэргодической

^имеются т

поглощающих состоянии ) с матрицей переходных веро­

ятностей

1

 

1

 

 

 

 

 

 

 

1

1

1

1

 

 

т

 

т

т

т

т

т

 

 

1

 

1

1

1

1

1

(1.3.16)

 

m

 

т

 

m

m

т

 

 

 

 

 

0-

•0

1

0-

•0

0

 

 

0 • •0

0

0-

•0

1

 

 

 

 

 

 

 

m

 

 

 

 

 

 

 

~2~

 

 

JV-Я степень

этой матрицы

будет

иметь

вид i4w (S)

1

 

 

1

2N- 1 2 W - 1

2N- -1

2 - ' m

 

 

2 * - ' т 2N- m 2N-im

 

2N- m

 

 

 

 

 

 

 

 

m

 

 

 

 

 

 

 

 

T

1

 

 

1

2N-

1

2N-l

 

2N- -1

 

 

 

 

2N-

2N-lm

 

2N-

0

0

 

1

0

...

о

 

 

 

 

 

 

 

 

m

 

 

 

 

 

 

 

 

T

0

0

 

0

0

...

l

ГЛАВА I

54

По матрице (1.3.17) находим вектор

вероятностей pw

=

( p i w

, • • •, PmiN))

пребывания

автомата

в

состоянии

i

на

N - м

шаге:

 

 

 

 

 

 

 

 

 

 

 

 

 

_ L _ ( P l ( 0 ) + . . . + p m / 2 ( 0 ) )

п

р и

1 = 1 , . . . / ^ ;

 

 

Р ,(N) —

2N—\

 

 

+ / W 0 )

) + Р г (

 

при 1 =

 

 

(Pl(0)+

-

0 )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

т

 

 

 

 

 

 

 

 

 

 

 

 

 

= у + l , . . . , m ,

 

 

 

 

 

 

 

 

 

 

 

 

 

(1.3.18)

где Р<°).= ( p i { 0 } , . . . , р т

( 0 ) )

—• вектор начальных вероят­

ностей. При

предельном

переходе N-+oo

получаем век­

тор предельных вероятностей:

 

 

 

 

 

 

 

 

 

 

О

 

при

i = l , . . . ,

т

 

 

 

 

 

 

 

 

 

 

— ;

 

 

 

 

 

 

Pi

 

 

2

 

 

 

 

 

при

 

ш

 

 

 

 

 

P i ( 0 ) + —

(Pim

+ - + P m / 2

{ 0 ) )

i = — + l , . . . , m .

 

 

 

 

 

 

 

 

 

 

 

 

 

(1.3.19)

Средний

штраф

pCp = 0

и средний

вектор

смещения

в

пространстве X

(т / 4 + т / 2

 

 

 

 

 

 

 

 

М[&Х]--

 

 

 

т

 

 

\

 

 

 

 

 

 

i = l + m / 2

i = m / 4 + l + m / 2

J

 

 

 

 

(т / 8 + т / 2

 

 

 

 

 

 

 

Г ( 0 ) _

 

 

 

 

 

+ т / 2

 

 

г=т/4+1+га/2

 

 

 

 

 

т / 4 + т / 8

 

 

 

 

 

 

 

 

 

^

 

Рг(0> I , - . . ,

- ( p l + m / 2 ( 0 ) - р 2 + т / 2 ( 0 > +

 

 

 

г ' = 3 / 8 т + 1 + т / 2

 

г ' = т / 8 + 1 + т

 

 

 

 

 

 

 

 

 

г = т / 2 + 1

 

 

 

 

 

 

 

 

 

• + p 3 W 2

( 0 ) - P 4 + m / 2 ( 0 ) +

- - Р т т )

 

(1.3.20)

 

 

 

 

 

 

 

 

 

 

 

 

 

ПОИСК БЕЗ САМООБУЧЕНИЯ

55-

Среднее изменение показателя

 

качества

 

 

 

 

 

 

 

т/2

 

 

 

 

 

 

 

 

 

M[AQ]=-ai

 

 

/ 7 г ( 0 )

- P l + m / 2 ( 0

) ( « 1 +

« 2

+

 

 

 

 

 

 

г=1

 

 

 

 

 

 

 

 

 

 

 

••• +ап)

Р2/2( 0 ) ( a i +

••• + a n - i — а п )

 

 

 

— Рз+т/2( 0 )

( а

1 +

+ а п - 2 —ап _1 + а г а ) —

 

 

 

 

— Р4+т/2( 0 ) ( a i +

••• + а „ - 2 — a n - i —а«) — •••

 

 

 

-••

—/7m_i<°> (cci — ••• — а п - 1 +

OCn) —

 

 

 

 

- Р т ( 0 ) ( с ч

 

 

а п ) .

 

 

 

 

(1.3.21>

Рассмотрим

д в у м е р н ы й

с л у ч а й

при наличии по­

мехи

(я = 2;

/п = 4). Векторы ДХ<*> пронумеруем в

следу­

ющем порядке:

 

 

 

 

 

 

 

 

 

 

дх<1> = (1,1);

 

 

дх<2) =

( - 1 , 1 ) ;

 

 

 

(1.3.22).

Д Х ( 3 ) = ( - 1 , - 1 ) ;

ДХ<«>=(1,-1).

 

 

 

 

 

 

 

Матрица A (S)

имеет вид

 

 

 

 

 

 

 

 

 

6]

a]

ai

ai

 

 

 

 

 

 

A(S)

=

й2

b2

а2

а2

 

 

 

 

 

(1.3.23).

а3

аъ

Ъг

а 3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Й4

G4

#4

&4

 

 

 

 

 

 

где

 

 

 

4-3s<

 

 

 

 

 

 

а»

 

 

 

 

 

 

 

 

(1.3.24))

 

4

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Si'

 

 

 

И +

0С2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 1 "

" \

/J*

 

 

 

 

 

 

 

 

 

- - 5 [ ' - » ( - а

й 2 1

) ] =

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(1.3.25>

( а ь

а 2

направляющие косинусы

вектора

градиента;

a i 2 + a 2

2 = l ) .

(1.3.23)

следует, что

цепь Маркова при

Из

матрицы

постоянных Sj однородная и при офО

эргодическая.

ГЛАВА I

56

Вектор

предельных

вероятностей P=(pi,

р2, Рз, Р4)

находим, решая систему

уравнений

 

 

P = 4'(S)P,

 

 

 

 

(1.3.26)

где A'(S)

—транспонированная

матрица

(1.3.23):

Pi-

1

S\S2s3Si

Р2 =

1

S1S2S3S4

 

S\

S1S3 +S2S4

S2

S1S3 +

S2S4

 

 

 

1

S1S2S3S4

Pi--

1

S1S2S3S4

 

 

s 3

SiS3 + S2Si

Si

S1S3 +

S2S4

 

 

 

 

 

 

 

 

 

(1.3.27)

Средний штраф, подсчитанный по формуле

(1.2.23), ра­

вен

 

 

 

 

 

 

 

 

 

S1S2S3S4

 

1

 

 

 

S1S3 + S2S4

+

1

(1.3.28)

 

 

 

Легко заметить, что имеет место неравенство

1

(1.3.29)

Отсюда следует, что соответствующий этому алгоритму вероятностный автомат обладает целесообразным пове­ дением. Средний вектор смещения в пространстве X

М[АХ]=

(pi-p2-Pz

+ Pi,

Pi + P2-Ps-Pi)

=

_

Г (Sl+S4)S2S3-

(Sz+S^SjSj

 

 

*•

S1S3 +

S2S4

 

 

 

(si+s2)s3s4-(s3

+ Si)s1s2

1

(1.3.30)

 

 

 

 

 

s l s 3 + 52s 4

ПОИСК БЕЗ САМООБУЧЕНИЯ

57-

Среднее приращение показателя качества

M[AQ}--

+

 

2 - Ф 2

Ф (sizsjf^a+s)]

 

 

 

_ ф 2

( - ± - ) ^ ( ^ )

(1.3.31)

 

 

2

 

 

предельном

переходе

(если,

При

<Х1-»-У2/2, аг->У2/2

+

 

 

 

 

 

 

выполнено условие о=й=0) находим:

 

 

 

 

Ф (Л)

 

 

M [ A Q] =

 

\

/

 

(1.3.32)

Рассмотрим

случай,

когда

ai = l ; а2 = 0. Тогда

из фор­

мулы

(1.3.25)

следует

 

 

 

 

 

 

 

 

 

 

(1.3.33)

Матрица A(S)

имеет вид

 

 

 

 

bi

й\

Ci

d\

 

 

A(S)

=

а2

Ь2

а2

а2

 

(1.3.34)

а2

а2

Ь2

а2

 

 

 

 

 

 

 

ах

й\

а.\

Ь\

 

 

В силу симметрии матрица (1.3.34) распадается и по­ лучаем pi=Pi\ Р2 = Рг- Окончательное уравнение для оп­ ределения вектора Р приобретает вид

Pi= (bl+ai)pi + 2a2p2;

(1.3.35)

p 2 = 2 a 1 p I + (b2 + a2)p2 .

 

ГЛАВА I

58

Решая эту систему уравнений, находим:

 

1

l — b2 — a2

Р1=Р4

= —

\-Ь22

+ 2аГ

 

2

 

1

 

2а:

Р 2 Р г

2 ' \-b2-a2

+ 2al '

Подставляя формулы (1.3.24) в выражение учитывая равенства (1.3.33), имеем:

(L3-36>

(1.3.6) и

P l = p 4 = ± S 2 = ± [ l - o ( - L ) ] ;

(1.3.37)

p 2 = P 3 = l S l = l [ l + o ( l b ) ] .

По формуле (1.2.23)

p c p = 2 S l s 2 = - i - y02(^ - ) .

(1.3.38)

Из формулы (1.3.38) следует, что автомат, соответствую­ щий этому алгоритму, обладает целесообразным поведе­ нием. Среднее приращение показателя качества за один шаг поиска равно

M[AQ] = s 2 - S l = - o ( ^ - ) .

(1.3.39)

В пределе при о->0 (а=^=0) получаем:

P l =Pi-^0;

р 2 = р 3 - ^ - 1 ; р с р - > 0 ;

M [ A Q ] - ^ - l .

 

 

(1.3.40)

При а-^-оо имеем:

(1.3.41)

В случае, когда о = 0, цепь Маркова, описывающая ли­ нейный алгоритм случайного поиска, является неэргодической, в силу чего этот случай требует отдельного ана­ лиза.

ПОИСК БЕЗ САМООБУЧЕНИЯ

 

59

 

 

 

 

 

 

 

 

Из формул (1.3.25)

при а = 0 получаем: s i = l; s 2

= s 3 =

= 0; s4 = 1.

 

 

 

 

 

 

 

 

 

Матрица (1.2.23) для д в у м е р н о г о

с л у ч а я

б е з

в о з д е й с т в и я

п о м е х и

при условии (1.3.14) имеет вид

 

4

4

4

Т

 

 

 

 

 

A(S) =

0

1

0

о

 

 

 

(1.3.42>

0

0

1

о

 

 

 

 

 

 

 

 

 

 

_1_ _1_

 

 

 

 

 

 

 

т

т

Т

Т

 

 

 

 

 

Л^-я степень этой

матрицы

 

 

 

 

 

 

 

1

2 j Y - l 2 N - l

1

 

 

 

2iv+i

2n+i

2N~*1

2N+\

 

 

 

 

О

 

1

 

О

О

(1.3.43),

 

 

О

 

О

 

1

О

 

 

 

 

 

 

 

 

1

2 * - 1

2 W - 1

1

 

 

 

2iv+i

2 l V + 1

2 J V + 1

2^+'

 

 

По этой матрице получаем вектор вероятностей на N-щ

шаге

 

 

 

 

 

 

 

 

 

 

1

 

( P l ( 0

) + P 4 ( 0 > )

 

при

i = 1, 4;

 

 

-+1

 

 

 

2 N - l

 

 

 

 

 

(1.3.44).

 

( P l ( 0

) + P 4 ( 0 ) )

+ Р г ( 0 )

При 1 = 2, 3.

 

 

2N+l

 

 

 

 

 

 

 

 

 

 

 

Вектор предельных вероятностей равен

 

 

О

 

 

 

 

при i= 1, 4;

(1.3.45)

 

 

 

 

 

 

 

 

р.(о>+ i_ (р 1 (0)+ р4 ( о ))

П р И

i = 2,3.

 

Средний вектор смещения в пространстве X

 

М [ Д Х ] = ( - 1 ,

- ( Р з (

0 ) - р 2

( 0 ) ) ) .

 

(1.3.46)

ГЛАВА I

60

Д л я среднего приращения функции качества имеем

М[А Q] = -

а, -

3

(0) - р 2

) y i - а , 2 .

(1.3.47)

Особо следует рассмотреть случай а\ = а2

= ^2\2. Тогда

в соответствии

с определением алгоритма

(1.2.24)

 

1

1

1

1

 

 

 

4

4

Т Т

 

 

A(S) =

0

1

0

0

 

(1.3.48)

 

0

0

1

0

 

 

 

0

0

0

1

 

 

Вектор предельных вероятностей равен

 

0,

 

 

 

если

/ = 1 ;

(1.3.49)

Рг--

 

 

 

 

 

+

~ P i { 0

\ если

/ = 2,3,4.

 

Р г т

 

Дл я среднего приращения показателя качества в этом случае имеем

M [ A Q ] = - (4/>1( 0 ) + Р з ( 0 ) ) у 2 .

(1.3.50)

§ 1.4. Н Е Л И Н Е Й Н Ы Й А Л Г О Р И Т М С Л У Ч А Й Н О Г О П О И С К А

Для нелинейного алгоритма характерно то, что после удачного шага (AQ'^O) выбирается новое случайное направление шага, а после неудачного шага (AQ'>0) делается возврат в предыдущее состояние. В этом па­ раграфе исследуем нелинейный алгоритм случайного поиска, определенный формулой (1.2.3) в § 1.1.

Для этого алгоритма матрицы переходных вероятнос­ тей имеют вид [43]:

Соседние файлы в папке книги из ГПНТБ