Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Растригин Л.А. Автоматная теория случайного поиска

.pdf
Скачиваний:
9
Добавлен:
23.10.2023
Размер:
8.71 Mб
Скачать

ПОИСК БЕЗ САМООБУЧЕНИЯ

 

81

 

 

 

 

 

 

 

 

 

 

 

A(S)

=

 

 

 

 

 

 

 

 

 

 

 

 

О

а{

0 0 •••

О

О Ь,

О

О

0 •••

О

О

I

О

0

а 2 0 - - -

О

О

О

Ь2

О

О---

О

О

I

О

О

О О -

О

On—1

О

О

О

 

О-

ьп-iO

 

О О О о -

О

О ап

О 0 0 - • 0

 

 

bn+i

о

О 0 •••

О

О

О

 

0

 

0 - •

0

0

 

О

Ь п + 2 О О - О

О О О ап+20

" • 0 0

 

О

О О О ••• Ь 2 п - \

О

О

О

0 0 " -

0 а 2 п .

 

а2п

О О О •••

0

Ь2п

О

О

О

0 •••

О О

 

где

 

 

 

 

 

 

 

 

 

 

 

(1.6.3)

 

 

 

 

 

 

 

 

 

 

(1.6.4)

(H=\—Si\

bt

= Si.

 

 

 

 

 

 

 

Учитывая

линейность

функции качества и

используя

выражение

(1.5.4), имеем

 

 

 

 

 

(1.6.5)

a n + i =

bi\

b n + i = ai

 

 

 

 

 

 

 

 

 

( t ' = l , . . . ,

п).

 

 

 

 

 

 

 

 

Поэтому матрица (1.6.3) принимает вид

 

 

 

 

 

A(S)

=

 

 

 

 

 

 

 

 

 

 

 

 

0

 

0 0 - • 0

0 Ьг 0 0 0 • • 0

0

 

 

0 0 а2

0 ••• 0

0 0

ь2

0 0 • •• 0

0

 

 

0 0 0 0 ••• 0 On- lO

0 0 0 -

Ьп-\

0

 

 

0 0 0 0 -

0

0 ап

0 0 0 - • 0

 

 

 

ах

0

0

0 •••

0

0 0

ft.0

о.- •

0

0

 

 

0 «2 0 О - • 0

0 0

0 ь2

0 - • 0

0

 

 

0 0 0 0 • • я п _

0 0

0 0 0 - • 0 Ьп-1

 

 

Ьп 0 0 0 ••• 0

ап 0

0 0 0 " • 0

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(1.6.6)

6—2014

ГЛАВА I

82

 

 

В случае, когда афО (щфО;

Ьгф\),

эта цепь Маркова

эргодическая. По матрице (1.6.6) для нахождения пре­ дельных вероятностей получаем следующую систему ал­

гебраических

уравнений:

 

pi = aipn+i

+

bnp2n

 

p2 = alp1

+

 

d2pn+2

 

Рз = а2р2

+

 

а3рп+3

 

Pi^di-ipi-i+dipn+i

 

рп = CLn-lPn—l + CLnPln

(1.6.7)

 

 

 

 

Рп+2 = Ь2р2

+

Ь]Рп+1

 

Pn+i — bipi-\-

bi-ipn+i-

 

P2n — bnpn +

Ьп-{р2п-\

 

Введем обозначения

 

kx = bnp2n;

 

k2=anpn.

(1.6.8)

Тогда из первого и (п+1) - го уравнений этой системы находим

Pv

axk2+kx

g\2k2+gxxkx

.

 

l dxbx

U\

'

 

 

 

Pn+l=

k2+bXki

f\2k2

+

f\\k\

 

\—axbx

 

 

 

 

 

 

 

 

 

где

 

 

 

 

 

gi2 = ai; gu = U

b = l ;

fn = bx;

ux = l-axbx.

Из i-го и (п-И)-го уравнений получаем

Pi

gi2k2 + gi\k\

 

 

fi2h +

fi\k\

 

S pn+i — -

 

(1.6.9)

(1.6.10)

(1.6.11)

ПОИСК БЕЗ САМООБУЧЕНИЯ

83

 

Здесь Vi = UiU2.. .щ; щ Х—аФг,

(1.6.12)

g«; gn', fi2', fn определяются по рекуррентным формулам

gi2—^i-]gi-l,2

+ агЬ <—l/i—1,2;

 

 

= Я г - l g i - l . l +

,

(1.6.13)

gil

dibi-lfi-UU

 

fi2

= biai-\gi-\t2

+

bi-lfi-\,2,

^ g

/ tl = M f - l f f i - M + 6 i - l / i - U

 

 

 

 

( i = 2 , 3 , . . . , n ) .

 

Сравнивая формулы (1.6.10), (1.6.13) и (1.6.14), нетрудно заметить, что выражение для f i 2 получается из формулы для g n , а для fu — из формулы для gi2 при замене а* на

bi

и

bi

— на Ci (i= 1,2,..., п ) . При

i n из

формул

(1.6.11)

получаем

 

 

 

 

 

 

 

Рга =

gn2^2 +

gnl&l

 

fn2&2 +

fnl&l

 

„ « . г ,

 

 

 

'•

Р2п=

 

(1.6.15)

Из

равенств

(1.6.8)

и

(1.6.15) находим

соотношение kx

и кг-

 

 

 

 

 

 

 

 

 

 

 

k2=Gku

k{ = Fk2>

 

 

 

 

 

(1.6.16)

где

 

 

 

 

 

 

 

 

 

 

 

 

п

 

 

 

Qngnl

с

 

bnfП2

 

 

..

_

0 =

 

 

 

;

/*=

т - т - ;

 

 

 

( l . b . l / )

F=

 

~.

 

 

 

 

 

 

 

(1.6.18)

Отсюда видно, что функция F симметрична G относи­ тельно <Xi и bi, т. е. F получается из G, если щ заменить

2га

 

на bi. Из условия нормирования 2 pi—l

находим

H2k2 + Hxk{=\,

(1.6.19)

где

 

н

У§г2±Ы

н

y g U + h

 

'2

 

 

( 1 6 2 0 )

<-1

<-1

6*

ГЛАВА I

 

84-

 

 

Из формул (1.6.16)

и (1.6.19)

получаем

 

1

F

(1.6.21)

 

H2G + Hl

H2 + HXF '

 

 

k2 =

1

G

(1.6.22)

H2 + HXF

H2G+HX

Следовательно, формулы для определения предельных вероятностей имеют вид

P i

Vi\H2

+ HxF +

 

H2G + HXI

 

ы

- - 1 /

^

Ux

\ _

ЫО+Пх

Pn+i~Vi\H7+H7+

 

 

h2g+hx

i

vi

h

йь

 

 

 

 

(1.6.23)

Поскольку H2 и Hi

симметричны по отношению к а ; и bi,

то

pi и pi+n

также

симметричны, т. е. Рг+п

определяется

из

формул

для Pi

подстановкой а,- и bi на

место bi и а*

соответственно.

Среднее приращение функции качества на одном шаге равно

71

M[AQ]

= 2 0 > 1 - Р » - И ) « « = 2^ ( h2+hxf

 

 

 

 

 

 

 

 

 

 

 

 

 

 

+

 

 

 

, gii-fn

 

\

(1.6.24)

 

 

 

H2G

+ i

 

 

 

 

 

 

Далее

рассмотрим д в у м е р н ы й с л у ч а й (п = 2). Для

этого случая матрица (1.6.3) принимает вид

 

 

 

 

О ах

bi

О

 

A(S)

=

О 0

а2

Ь2

(1.6.25)

ах

0

0

bi

 

 

 

 

 

 

 

Ъ2

а2

О О

 

Исходя из этой матрицы имеем следующую систему ал-

ПОИСК БЕЗ САМООБУЧЕНИЯ

85

гебраических уравнений для определения предельных ве­ роятностей:

p[ = a[p3

+ b2pi;

 

P2=alPl

+ a2p<;

{ { 6 Щ

p3 = b[pi + a2p2\

pi = b2p2 + bxp3.

Решая систему уравнений с учетом формул

(1.6.5), на­

ходим:

 

 

 

 

 

 

 

 

 

 

 

 

 

Ь2 + аха22

 

 

 

ах + а2Ьх2

 

 

P i =

2 + b2-axbx

+ a2

' Р 2 = 2 + b2-axbx

+ a22'

 

_

 

a2 + bxb22

 

_ _

bx + ax2b2

 

Р з =

2 + b2-a{bx

+ a22

' P i ~ 2 + b2-axbx

+ a22

'

 

 

 

 

 

 

 

 

 

 

 

(1.6.27)

Подставляя

вместо

щ и

Ь\

величины

Si из формул

(1.6.4),

получаем:

 

 

 

 

 

 

 

Pi=

 

-3 S2 + S3S42

 

;

р 2 =

 

S3+S4S1 2

2+

^

SjSj+^+SjSj2

 

 

2+

SjSj+f+SjS

 

 

S4 +

S1S22

 

 

 

 

sx +

s2s32

 

Р з =

 

-ъ

 

 

 

;

р 4 =

 

 

 

 

2 +

SjSj+i'

+

StSi*

 

2 + ^ S j

S J + 1 2 + S4S12

 

 

3=1

 

 

 

 

 

j - l

 

(1.6.28)

 

 

 

 

 

 

 

 

 

 

 

Среднее приращение функции качества равно

M[AQ]=

 

 

 

 

 

 

 

 

 

 

 

 

( S 2

- S 4

+ S 3 S42 - SiS 2 2 )ai+

(S3 - S i + 5 4 S i 2 - S 2 S3 2 ) « 2

 

_

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

2 + ^ , s j s i + 1

2 + s 4 s 1 2

 

 

 

 

 

 

 

 

 

 

 

 

(1.6.29)

 

 

 

ГЛАВА I

 

 

 

 

 

Рассмотрим с л у ч а й б е з

в о з д е й с т в и я п о м е х и ,

т. е. когда

а = 0 . Тогда

по формулам

(1.5.4) имеем:

 

Г

1 при

i— 1 , . . . , п;

 

(1.6.30)

'

I

0

при

i = n+1,...,

 

2п.

 

 

По формулам (1.6.4)

находим:

 

_

Г

1

при

i = l

,

. . . . я;

 

г _

I

0

при

г' = п + 1 , . . . ,

2п;

(1.6.31)

 

 

 

 

 

 

 

 

 

 

Г 0

при

i = 1 , . . . , /г;

 

 

й ' ~

I

1 при

t' = n +

1 , . . . ,

2п.

 

Матрица

(1.6.6) при условии

(1.3.14)

имеет вид

 

 

 

00

1000

 

00

 

 

 

 

 

00

0100

 

00

 

 

A(S)

=

 

00

• 0000 -

10

 

(1.6.32)

 

00

• 0010 -

00

 

 

 

 

 

 

00 • 0000 ••• 01

10 • 0000 ••• 00

Из

матрицы

видно, что состояния от

2

до я этой

цепи

Маркова

являются невозвратными,

а

состояние 1

исостояния от п+1 до 2п — циклическими с пе­

риодом п + 1.

Следовательно,

предельные вероятности

равны

 

 

 

 

 

Pl~Pn+l=

•••

 

1

 

 

=Р2п:

'

 

 

 

 

П + 1

(1.6.33)

Р2 = РЗ=

••• =Рп = 0.

 

 

 

Среднее приращение функции

качества

M[AQ]=-

 

1

V «г

 

(1.6.34)

 

п+ 1

г=2

 

 

ПОИСК БЕЗ САМООБУЧЕНИЯ

 

87

 

Д ля двумерного

случая (п = 2) по

формулам (1.6.33)

и (1.6.34) имеем

 

 

Pi=P3 = P 4 = - j ;

р2 = 0\

(1.6.35)

M [ A Q ] = - 4 - « 2 .

 

(1.6.36)

О

 

 

§ 1.7. А Л Г О Р И Т М П О С Л Е Д О В А Т Е Л Ь Н О Г О Г Р А Д И Е Н Т А

В данном параграфе рассмотрим одну моди­ фикацию метода градиента. Эта модификация характе­ ризуется тем, что после пробного шага gi>0 рабочий шаг, имеющий величину

AXi = — at sign AQig

(1-7.1)

(гд-е AQig — приращение функции качества в результате пробного шага gi), делается в t'-м направлении. Такая процедура производится по всем координатам. Строгоговоря, этот метод нельзя назвать градиентным. Это,, скорее, полярный метод. Представим алгоритм как веро­ ятностный автомат.

1. Одномерный случай

( п = 1 ) . Состояния

автомата

пронумеруем в следующем

порядке:

 

AXW = g ; Д Х < 2 ) = - а ; АХ& = + а.

(1.7.2)

Здесь g — пробный шаг, а ±а — рабочие шаги поиска. Пусть вход автомата, как обычно, определяется величи­ ной штрафа

f 1, если

A Q ' ^ O ;

ч ч

c = s g n A Q ' = 1

л л / ^ - п

(1-7-3)

10, если

AQ < 0 .

 

Выход автомата совпадает с его состоянием и образует трехбуквенный алфавит (1.7.2).

Далее предположим, что a=g=\. Графы переходов автомата показаны на рис. 1.7.1, а его матрицы перехо­ дов имеют вид

ГЛАВА I

88

 

 

AG<0

Рис. 1.7.1. Графы переходов автомата для

случая

« = 1.

при нештрафе

(AQ'<0)

00 1

 

100

(1.7.4)

100

 

лри штрафе ( A Q ' ^ 0 )

0

1 0

 

1

0 О

(1.7.5)

1 О О

 

Случайная среда задается через вероятности штрафов действия автомата, которые в предположении о линей­ ности функции качества (grad Q(X) = const) и нормиро­

ванное™ его градиента

= 1 I равны

 

89 ПОИСК БЕЗ САМООБУЧЕНИЯ

(1.7.6)

Функционирование автомата поиска в случайной среде (1.7.6) описывается цепью Маркова с циклической мат­ рицей переходных вероятностей

 

! 0

Si

1 — S i

 

 

 

 

 

 

A(S)

= I

1

О

О

 

 

 

 

 

(1.7.7>

 

 

1 0

о

 

 

 

 

 

 

Предельные

вероятности

для

этой

цепи Маркова

равны

 

1

 

 

1

 

1

п

^

 

(1.7.8Х

Pi=~2'

Pa=YSl>

Р з = у

О -

^

-

 

Средний штраф рабочих

шагов

 

 

 

Pcv.v=slS2=±[l-<&(-±)],

 

 

 

 

(1.7.9),

а среднее смещение по направлению градиента

 

M [ A Q ] = p 3 - p 2 = - j С1 ~ 2 s i ) = - 4 Ф

( 27 ) *

( 1 - 7 Л 0 ) '

При а->-0 имеем

 

 

 

 

 

 

 

Рср.р-^О;

 

M[AQ]-»

 

2 '

 

 

 

(1J.11)>

 

 

 

 

 

 

 

 

 

 

а при

а->-оо

 

 

 

 

 

 

 

 

 

Р с р . р ^ - ^ ;

M[AQ]->0.

(1.7.12).,

 

2. Двумерный

случай

(п = 2). Состояния автомата про­

нумеруем в следующем

порядке:

 

ГЛАВА I

99

AQzO

UQ'<0

Рис. 1.7.2. Графы переходов автомата для случая п=2.

AXW=gei;

ДХ<2 > =

- а е , ;

Д Х ( 3 ) = с е , ;

 

 

 

(1.7.13)

Д Х < 4 > = £ е 2 ;

ДХ<5 > =

- а е 2 ;

Д Х ( 6 > = а е 2 .

Графы переходов автомата показаны на рис. 1.7.2. Имеем следующие матрицы переходов автомата:

при нештрафе (AQ'<0)

0 0 1 О О О

ОО О 1 О о

ОО О 1 О о

А0 =

 

(1.7.14)

О О О О 0 1

 

1

О ОО О О

 

1

О ОО О О

 

Соседние файлы в папке книги из ГПНТБ