Добавил:

ivanov666 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Башкирский Государственный Аграрный Университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

книги из ГПНТБ / Растригин Л.А. Автоматная теория случайного поиска

.pdf

Скачиваний:

Добавлен:

23.10.2023

Размер:

8.71 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 910 / 3410 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

ПОИСК БЕЗ САМООБУЧЕНИЯ

	91
при штрафе			(AQ'^O)
0	1	0	'0	0	0
0	0	0	'1	0	0
0	0	0	' 1	0	0
					(1.7.15>
0	0	0	'о	1 0
1 0		0	^0	0	0
1	0	0	.0	0	0

Функционирование автомата описывается цепью Мар кова

> Si		1 - 5 ! •о 0			0
)	0	0	• 1 0		0
)	0	0	• 1 0		0
					(1.7.16);
) 0		0	'0	5 4	1 — Si
	0	0	'о	0	0
	0	0	^0	0	0

где

s, - s, = y [ l + ® ( - g - ) ] ;

(1.7.17)

- • H ' - t e ) ] .

а; — направляющие косинусы вектора-градиента функ ции

Q(X) = a i * i + a2X2; a i 2 + a 2 2 = l .

(1.7.18)

ГЛАВА I

Предельные вероятности цепи Маркова равны

Pi=P*=-£\

P2=—sr,

pa= —

(l-Si);

(1.7.19)

Рис. 1.7.3. Графы переходов автомата для случая п>2.

ПОИСК БЕЗ САМООБУЧЕНИЯ

Средний штраф рабочих шагов

								(1.7.20)
а среднее приращение показателя качества
M [ A Q ] = \| - [ ( l - 2 s 1 ) a , +					(l-2s4)a2]=—У[ ф(~)			а , +
								(1.7.21)
При a-Я) имеем
Рср.р->0;	M	[	A	Q ] (	a	i + a2 ),		(1.7.22)
а при а - > о о
Р с Р . р - > \| - ;		MAQ1 — 0.						(1.7.23)
Р с Р . р - > \| - ;		MAQ1 — 0.
3. Многомерный			случай		( я > 2 ) .
Q ( X ) = ^ й Л ;				^ а г	2	= 1 .		(1.7.24)
г=1				г=1
Графы переходов			автомата			для этого случая	показаны
на рис. 1.7.3. Матрицы переходов имеют вид
при нештрафе (AQ'<0)
в3	вх		о	о ••• о		о
0 В3ВХ			о	••• о	о
Л 0 =					вх			(1.7.25)
о	о	о	о	••• в 3	вх
вх о		о	о	••• о	въ

ГЛАВА I

34
при штрафе		(AQ'^O)
В2	Bi	О О ••• О О
О В2 Bi О				О	о
						(1.7.26)
0	0	0	0	В3	Bi
в ,	о	о	о	О	£ 3
где
О О О				О 1 О		О 0 1
1 0	0		В 2 =	О О О		В 3 = ,0 О О (1.7.27)
1 О О				;0 О О		О О О

Функционирование автомата в случайной среде, задан ной функцией (1.7.24), описывается цепью Маркова

	В(s^		Bi	О	О-	О	О
		О	B(s2)	Bi	0 -	0	О
A{S)	=						(1.7.28)
		О	о	О 0-B(sn-i)			В{
		Bi	о	О	0 -	0	B(sn)
Здесь
	О	Si	l—Si
	0	0	О				(1.7.29)
	О О О
							(1.7.30)
где Ф	— интеграл			Лапласа.		Обозначим через Р* =

=(Рзг-2, рзг-и Рг%) вектор предельных вероятностей, со

ответствующий i-й переменной функции (1.7.24). Для определения этих векторов по матрице (1.7.28) составим систему векторных уравнений:

			ПОИСК БЕЗ САМООБУЧЕНИЯ
		95				•
P, = P 1 B ( s , ) + P « B 1 ;
P2	= P1Bi	+	P2B(s2);
Рз = Р 2 5 , + Р 8 Я ( 5 8 ) ;
Pi	= Pi _1 51		+ P i 5(s i );
P n = P„ _ 1 B 1 + P n 5 ( s „ ) .
Из i-го векторного уравнения этой системы						следует
	1 —Si		— 1+Sj		О О О
Pi	О	1	О	= Рг-I !	1 О О	(1.7.32)
	О	0	1	I	i 1 о о
Отсюда для			координат	векторов Р; и Рг -1 получаем со
отношения
P3i-2 = Рз(г—1)—1 + Рз(г-1) = Рзг-4 +					Рзг'-3 = РЗг-5'.
Р з г - 1 = Р з г - 2 5 г ;						(1.7.33)

P 3 i = P 3 i - 2 ( l - S j ) .

Из первого уравнения системы (1.7.31) имеем:

Р1 = Рзп-1 + Рз«;

p2 = s.p.;	(1.7.34)
Р з = (1 —Si)/?i-

После нормировки величин pj (/ = 1, 2, . . . , 3 я ) находим

Р з г - 1 = - | ^

( i = l , . . . . п);

(1.7.35)

ГЛАВА I

96-
Средний штраф рабочих шагов равен
V f l - s t	,	( l - S i ) S i ]	V	{l-st)st
				(1.7.36)
а среднее смещение по направлению			градиента
M[AQ]= J£ {pzi-P3i-i)ca=		^ l - 2 s i

—h2	»(•%)«•	с - 7 - 3 7 »
i	= l
Для случая отсутствия помех (a=0) имеем
	п
Pcp.p=0; A f [ A Q ] = - - ^ - J ^ a * ,		(1.7.38)
	г=1
а при 0->-оо
Р с Р . р - ^ \| - ; M[AQ]->0.		(1.7.39)

§1.8. А Л Г О Р И Т М П А Р А Л Л Е Л Ь Н О Г О

ГР А Д И Е Н Т А

Рассмотрим параллельную модификацию метода. Этот алгоритм представляет собой поиск по вер шинам гиперкуба. По всем координатам делаются проб ные шаги и определяется полярное направление гради ента. Это полярное направление соответствует направле нию на вершину гиперкуба, которая наиболее близка к направлению градиента. Схема алгоритма параллель ного градиента показана на рис. 1.8.1. Алгоритм в тер минах теории автоматов представляется в виде двух

автоматов	— а в т о м а т а	п р о б н ы х	ш а г о в	Л< П ) ,
имеющего	п + 1 внутренних	состояний, и	а в т о м а т а
р а б о ч и х	ш а г о в Л<Р>, имеющего т+l		(т = 2п)	внут

ренних состояний.

Пронумеруем возможные рабочие шаги АХ<'> в сле дующем порядке:

ПОИСК БЕЗ САМООБУЧЕНИЯ

Рис. 1.8.1. Схема оптимизации методом параллельного градиента.

ДХО)= (1, . .. , I ) ; А Х ( 2 ) = ( 1 , . . . , 1, - 1 ) ;	ДХ(з> =
= ( 1 , . . . , 1, - 1 , 1 ) ; Д Х « > = ( 1 , . . . , 1, - 1 , - 1 ) ; . . .
. . , ; д х < ™ / 2 - 1 > = ( 1 , - 1 , . . . , - 1 , 1);	• • • ;	ДХ'»/2=
= ( 1 , - 1 , . . . , - 1 ) ; ДХ<«+> = -ДХ<>		(1.8.1)

( / = 1 , 2 , . . . . f ) .

У автомата пробных являются пробные шаги фиктивное состояние — томата рабочих шагов

шагов внутренними состояниями g^i (их число равно п) и одно автомат рабочих шагов. У ав внутренними состояниями явля-

7 — 2014

ГЛАВА I

98
ются рабочие шаги A X ( i )	(их число равно m = 2n ) и одно
фиктивное состояние — автомат пробных шагов.
Определим множество	входов автоматов. Пусть вхо

дом автомата пробных шагов Л ( П ) является знак при ращения функции качества. Входы автомата рабочих шагов Л ( Р ' определим следующим образом. Пусть в со стояниях от 1 до т автомат принимает на вход только

числа	с = 0 и с = 1 , а в состоянии т + 1	(фиктивное состоя
ние)	— только векторы С = (си ...,	сп), координаты с*

которых могут иметь значения 0 или 1. При этом i-я ко ордината вектора С равна нулю, если автомат пробных

шагов Л ( П > в 1-м			состоянии не получил				штрафа		(с = 0), и
равна единице, если получил штраф							( с = 1 ) .		Следова
тельно, вектор С=(си...,сп)				при	представляет собой набор
величин	с,	полученных			пробных		шагах.		Векторы
Cj-= (сх^\	,..,	cn(i)),	количество			которых		равно	2™, про
нумеруем в том же порядке, как рабочие								шаги АХ'»', т.е.
d = ( 0 ,	. . . , 0 ) ; С 2 = ( 0 ,			. . . , 0 ,	1); С 3 = ( 0 , . . . , 0 ,				1,0); . . .
		Cm /2-i=(0,		1, 1 , . . . ,		1,0);	C m / 2 = ( 0 ,		1 , . . .
		\);...;Ст-,=		(1, 1 , . . . , 1,0);				C m = (1, . . . , 1).
									(1.8.2)

Нетрудно заметить, что векторы Сг (i= 1 , . . . , 2") об разуются некоторым неоднородным а в т о м а т о м «па м я т и » со следующими, зависящими от номера шага N матрицами переходов:

I '		0	I 2^-1
0		/	I 2^-1
2iv-i	2n		J.2n_2N-i
2iv-i	2n	—2N"1
			(1.8.3)
0	1	0
О О О			^ 2n —2w-'
2JV-I 2w-i		2n—2N
где / — единичная			матрица порядка 2^ 1 (Л/ =
= 1 , 2 , . . . , л ) .

ПОИСК БЕЗ САМООБУЧЕНИЯ

Таким образом, автомат рабочих шагов A( P> пред

ставляет

собой

а в т о м а т

с о г р а н и ч е н и я м и

н а

в х о д е .

На рис. 1.8.2 показаны графы переходов из

одного со

стояния в другое для автомата пробных шагов Л ( П ) и для

автомата

рабочих

шагов

Л<Р>

при

с = 0;

с = 1 ;

= (ci<J>,..., cn{i))

• Из

этого

рисунка

получаем следую

щие матрицы переходных

вероятностей:

1) для

автомата

пробных

шагов

(переходные

мат

рицы штрафа и нештрафа

совпадают)

1 0

0 ••• 0

л ,

О 0

0 ••• 0

I .

/ f

. ч

Л,(п)=Л0

(п ) = :

\ \ п + 1

(1.8.4)

•

i 0

••• 0

' '

о ••• о

п+1

2) для автомата

рабочих шагов

0 ••• 0

0 -

(1.8.5)

Л ; ( р > =

тп+1

m+l —j

а)

о-

с-0

П+1

с-1

(р)

Рис.

1.8.2. Графы

переходов

автомата

пробных

тагов

(а)

и автомата рабочих

шагов

(б).

ГЛАВА I

100

Здесь индекс у обозначает состояние рабочего авто мата, на которое он переходит из фиктивного состояния. При этом у совпадает с номером вектора штрафа Cj =

= ( с 1 0 ) , . . . , с „ « ) ) .

Объединяя автомат пробных и автомат рабочих ша

гов, получаем	автомат, количество			состояний которого
равно п + т и переходные матрицы				имеют вид
0 • • 0 0 • • 1 0 0 • • 0
0 • • 0 0 • • 1		0	0 • • 0
0 • • 0	0 • • 1	0	0 • • 0	(1.8.6)
0 • • 0 0 • • 0 1 0 • • 0				(1.8.6)
0 • • 0 0 • • 0 1 0 • • 0
0 • • 0	0 • • 0	0	0 • • 1
0 • • 1	0 • • 0 0 0 • • 0

j	п
т
Среда задается	вероятностями появления векторов
C j = ( c i ^ , . . . , c„(i>),	т. е. вероятностями qj выбора у'-го

рабочего шага после окончания пробных шагов. Вектор

вероятностей	Q = (q\,...,	q2n),	согласно	нумерации век
торов ДХ<э"> (1.8.1) и переходных матриц				(1.8.3), опреде
ляется формулой
п
Q = Q0)JJ	[SNA, (N) +	(1 - sN)	Л 0 (N) ].	(1.8.7)
Л'=1

Здесь Q< 0 ) — 2п -мерный начальный вектор состояний автомата «памяти» (1.8.3); Q ( 0 , = (1, 0,...

. . . . 0);

s,v — вероятность штрафа iV-ro пробного шага;

sN=Bep

( A Q V ^ 0 ) = у [ 1 + Ф ( ^ ) ] '

( 1 ' 8 - 8 )

где <xN (N=\,...,n) — направляющие косинусы гради ента функции Q(X).

<<< < Предыдущая 1 2 3 4 5 6 7 8 910 / 3410 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в папке книги из ГПНТБ

#
19.10.20236.93 Mб4Раскин, Н. М. Федор Петрович Моисеенко - минералог XVIII века. 1754-1781.pdf
#
29.10.20231.76 Mб7Рассохин В.В. Неполные изображения в ортогональных проекциях пособие для учителей.pdf
#
19.10.20234.76 Mб8Рассохин, В. П. Изобретательское право для изобретателей.pdf
#
19.10.20233.96 Mб5Рассудов, В. М. Некоторые задачи термоупругости пластинок и пологих оболочек.pdf
#
25.10.202312.42 Mб10Растворы флотационных реагентов. Физико-химические свойства и методы исследования [монография].pdf
#
23.10.20238.71 Mб9Растригин Л.А. Автоматная теория случайного поиска.pdf
#
21.10.20238.97 Mб1Расчет железобетонных конструкций при сложных деформациях..pdf
#
19.10.20236.42 Mб38Расчет конструкций убежищ..pdf
#
21.10.20239.08 Mб10Расчеты и анализ режимов работы сетей учеб. пособие.pdf
#
29.10.20232.07 Mб8Рауд Э.П. Опыт изготовления сложных прессформ.pdf
#
23.10.202325.18 Mб8Раушенбах, Б. В. Управление ориентацией космических аппаратов.pdf