Добавил:

ivanov666 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Башкирский Государственный Аграрный Университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

книги из ГПНТБ / Растригин Л.А. Автоматная теория случайного поиска

.pdf

Скачиваний:

Добавлен:

23.10.2023

Размер:

8.71 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 89 / 349 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

ПОИСК БЕЗ САМООБУЧЕНИЯ

A(S)

а{

0 0 •••

О Ь,

0 •••

а 2 0 - - -

Ь2

О---

О О -

On—1

О- •

ьп-iO

О О О о -

О ап

О 0 0 - • 0

bn+i

О 0 •••

0 - •

Ь п + 2 О О - О

О О О ап+20

" • 0 0

О О О ••• Ь 2 п - \

0 0 " -

0 а 2 п .

а2п

О О О •••

Ь2п

0 •••

О О

где

(1.6.3)

(1.6.4)

(H=\—Si\

= Si.

Учитывая

линейность

функции качества и

используя

выражение

(1.5.4), имеем

(1.6.5)

a n + i =

bi\

b n + i = ai

( t ' = l , . . . ,

п).

Поэтому матрица (1.6.3) принимает вид

A(S)

0 0 - • 0

0 Ьг 0 0 0 • • 0

0 0 а2

0 ••• 0

0 0

ь2

0 0 • •• 0

0 0 0 0 ••• 0 On- lO

0 0 0 - •

Ьп-\

0 0 0 0 -

0 ап

0 0 0 - • 0

ах

0 •••

0 0

ft.0

о.- •

0 «2 0 О - • 0

0 0

0 ь2

0 - • 0

0 0 0 0 • • я п _

0 0

0 0 0 - • 0 Ьп-1

Ьп 0 0 0 ••• 0

ап 0

0 0 0 " • 0

(1.6.6)

6—2014

ГЛАВА I

82
В случае, когда афО (щфО;	Ьгф\),	эта цепь Маркова

эргодическая. По матрице (1.6.6) для нахождения пре дельных вероятностей получаем следующую систему ал

гебраических			уравнений:
pi = aipn+i		+	bnp2n
p2 = alp1	+		d2pn+2
Рз = а2р2	+		а3рп+3
Pi^di-ipi-i+dipn+i
рп = CLn-lPn—l + CLnPln				(1.6.7)
				(1.6.7)
Рп+2 = Ь2р2		+	Ь]Рп+1
Pn+i — bipi-\-			bi-ipn+i-
P2n — bnpn +			Ьп-{р2п-\
Введем обозначения
kx = bnp2n;			k2=anpn.	(1.6.8)

Тогда из первого и (п+1) - го уравнений этой системы находим

Pv	axk2+kx	g\2k2+gxxkx		.
Pv	l — dxbx	U\		'
	l — dxbx	U\		'
Pn+l=	k2+bXki	f\2k2	+	f\\k\
Pn+l=	\—axbx
	\—axbx
где
gi2 = ai; gu = U		b = l ;	fn = bx;		ux = l-axbx.
Из i-го и (п-И)-го уравнений получаем
Pi	gi2k2 + gi\k\			fi2h +	fi\k\
Pi		S pn+i — -

(1.6.9)

(1.6.10)

(1.6.11)

ПОИСК БЕЗ САМООБУЧЕНИЯ

83
Здесь Vi = UiU2.. .щ; щ — Х—аФг,	(1.6.12)

g«; gn', fi2', fn определяются по рекуррентным формулам

gi2—^i-]gi-l,2		+ агЬ <—l/i—1,2;
	= Я г - l g i - l . l +		,	(1.6.13)
gil	= Я г - l g i - l . l +		dibi-lfi-UU
fi2	= biai-\gi-\t2	+	bi-lfi-\,2,	^ g
/ tl = M f - l f f i - M + 6 i - l / i - U
			( i = 2 , 3 , . . . , n ) .

Сравнивая формулы (1.6.10), (1.6.13) и (1.6.14), нетрудно заметить, что выражение для f i 2 получается из формулы для g n , а для fu — из формулы для gi2 при замене а* на

— на Ci (i= 1,2,..., п ) . При

i — n из

формул

(1.6.11)

получаем

Рга =

gn2^2 +

gnl&l

fn2&2 +

fnl&l

•

„ « . г ,

'•

Р2п=

(1.6.15)

Из

равенств

(1.6.8)

(1.6.15) находим

соотношение kx

и кг-

k2=Gku

k{ = Fk2>

(1.6.16)

где

Qngnl

bnfП2

0 =

;

/*=

т - т - ;

( l . b . l / )

(1.6.18)

Отсюда видно, что функция F симметрична G относи тельно <Xi и bi, т. е. F получается из G, если щ заменить

2га
на bi. Из условия нормирования 2 pi—l	находим
H2k2 + Hxk{=\,	(1.6.19)
где

н	У§г2±Ы	н	y g U + h
	'2

( 1 6 2 0 )

<-1

ГЛАВА I

	84-
Из формул (1.6.16)		и (1.6.19)	получаем
	1	F	(1.6.21)
	H2G + Hl	H2 + HXF '	(1.6.21)
	H2G + Hl	H2 + HXF '
k2 =	1	G	(1.6.22)
k2 =	H2 + HXF	H2G+HX	(1.6.22)

Следовательно, формулы для определения предельных вероятностей имеют вид

P i	Vi\H2	+ HxF +		H2G + HXI		ы
„	- - 1 /	^	•	Ux	\ _	ЫО+Пх
Pn+i~Vi\H7+H7+				h2g+hx	i	vi

йь

				(1.6.23)
Поскольку H2 и Hi			симметричны по отношению к а ; и bi,
то	pi и pi+n	также	симметричны, т. е. Рг+п	определяется
из	формул	для Pi	подстановкой а,- и bi на	место bi и а*

соответственно.

Среднее приращение функции качества на одном шаге равно

M[AQ]		= 2 0 > 1 - Р » - И ) « « = 2^ ( h2+hxf
M[AQ]
							+
			, gii-fn			\	(1.6.24)
			H2G	+ i			(1.6.24)
			H2G	+ i
Далее	рассмотрим д в у м е р н ы й с л у ч а й (п = 2). Для
этого случая матрица (1.6.3) принимает вид
			О ах		bi	О
A(S)	=		О 0		а2	Ь2	(1.6.25)
A(S)	=		ах	0	0	bi	(1.6.25)
			ах	0	0	bi
			Ъ2	а2	О О

Исходя из этой матрицы имеем следующую систему ал-

ПОИСК БЕЗ САМООБУЧЕНИЯ

гебраических уравнений для определения предельных ве роятностей:

p[ = a[p3	+ b2pi;
P2=alPl	+ a2p<;	{ { 6 Щ

p3 = b[pi + a2p2\

pi = b2p2 + bxp3.

Решая систему уравнений с учетом формул											(1.6.5), на
ходим:
		Ь2 + аха22						ах + а2Ьх2
P i =	2 + b2-axbx			+ a2		' Р 2 = 2 + b2-axbx				+ a22'
_		a2 + bxb22				_ _		bx + ax2b2
Р з =	2 + b2-a{bx			+ a22		' P i ~ 2 + b2-axbx				+ a22	'
											(1.6.27)
Подставляя			вместо		щ и		Ь\	величины		Si из формул
(1.6.4),	получаем:
Pi=		-3 S2 + S3S42				;	р 2 =		S3+S4S1 2
2+		^	SjSj+^+SjSj2					2+		SjSj+f+SjS
		S4 +		S1S22					sx +	s2s32
Р з =		-ъ				;	р 4 =
2 +		J£	SjSj+i'		+	StSi*		2 + ^ S j		S J + 1 2 + S4S12
		3=1						j - l			(1.6.28)
											(1.6.28)
Среднее приращение функции качества равно
M[AQ]=
		( S 2	- S 4	+ S 3 S42 - SiS 2 2 )ai+					(S3 - S i + 5 4 S i 2 - S 2 S3 2 ) « 2
	_						3
						2 + ^ , s j s i + 1			2 + s 4 s 1 2
											(1.6.29)

			ГЛАВА I
Рассмотрим с л у ч а й б е з								в о з д е й с т в и я п о м е х и ,
т. е. когда			а = 0 . Тогда			по формулам			(1.5.4) имеем:
	Г	1 при		i— 1 , . . . , п;					(1.6.30)
'	I	0	при	i = n+1,...,				2п.

По формулам (1.6.4)					находим:
_	Г	1	при	i = l	,	. . . . я;
г _	I	0	при	г' = п + 1 , . . . ,				2п;	(1.6.31)

	Г 0		при	i = 1 , . . . , /г;
й ' ~	I	1 при		t' = n +		1 , . . . ,		2п.
Матрица		(1.6.6) при условии						(1.3.14)	имеет вид
			00	1000			00
			00	0100			00
A(S)	=		00	• 0000 -			10		(1.6.32)
			00	• 0010 -			00

00 • 0000 ••• 01

10 • 0000 ••• 00

Из	матрицы	видно, что состояния от	2	до я этой
цепи	Маркова	являются невозвратными,	а	состояние 1

исостояния от п+1 до 2п — циклическими с пе

риодом п + 1.		Следовательно,			предельные вероятности
равны
Pl~Pn+l=	•••		1
Pl~Pn+l=	•••	=Р2п:		'
			П + 1	'	(1.6.33)
Р2 = РЗ=	••• =Рп = 0.				(1.6.33)
Р2 = РЗ=	••• =Рп = 0.
Среднее приращение функции					качества
M[AQ]=-		1	V «г		(1.6.34)
	п+ 1		г=2

ПОИСК БЕЗ САМООБУЧЕНИЯ
87		•
Д ля двумерного	случая (п = 2) по	формулам (1.6.33)
и (1.6.34) имеем
Pi=P3 = P 4 = - j ;	р2 = 0\	(1.6.35)
M [ A Q ] = - 4 - « 2 .		(1.6.36)
О

§ 1.7. А Л Г О Р И Т М П О С Л Е Д О В А Т Е Л Ь Н О Г О Г Р А Д И Е Н Т А

В данном параграфе рассмотрим одну моди фикацию метода градиента. Эта модификация характе ризуется тем, что после пробного шага gi>0 рабочий шаг, имеющий величину

AXi = — at sign AQig

(1-7.1)

(гд-е AQig — приращение функции качества в результате пробного шага gi), делается в t'-м направлении. Такая процедура производится по всем координатам. Строгоговоря, этот метод нельзя назвать градиентным. Это,, скорее, полярный метод. Представим алгоритм как веро ятностный автомат.

1. Одномерный случай	( п = 1 ) . Состояния	автомата
пронумеруем в следующем	порядке:
AXW = g ; Д Х < 2 ) = - а ; АХ& = + а.		(1.7.2)

Здесь g — пробный шаг, а ±а — рабочие шаги поиска. Пусть вход автомата, как обычно, определяется величи ной штрафа

f 1, если	A Q ' ^ O ;	ч ч
c = s g n A Q ' = 1	л л / ^ - п	(1-7-3)
10, если	AQ < 0 .

Выход автомата совпадает с его состоянием и образует трехбуквенный алфавит (1.7.2).

Далее предположим, что a=g=\. Графы переходов автомата показаны на рис. 1.7.1, а его матрицы перехо дов имеют вид

ГЛАВА I

		AG<0
Рис. 1.7.1. Графы переходов автомата для
случая		« = 1.
при нештрафе		(AQ'<0)
00 1
100		(1.7.4)
100
лри штрафе ( A Q ' ^ 0 )
0	1 0
1	0 О	(1.7.5)
1 О О

Случайная среда задается через вероятности штрафов действия автомата, которые в предположении о линей ности функции качества (grad Q(X) = const) и нормиро

ванное™ его градиента	= 1 I равны

89 ПОИСК БЕЗ САМООБУЧЕНИЯ

(1.7.6)

Функционирование автомата поиска в случайной среде (1.7.6) описывается цепью Маркова с циклической мат рицей переходных вероятностей

	! 0		Si	1 — S i
A(S)	= I	1	О	О						(1.7.7>
		1 0		о
Предельные		вероятности				для	этой	цепи Маркова		равны
	1			1		1	п	^		(1.7.8Х
Pi=~2'		Pa=YSl>			Р з = у		О -	^	-	(1.7.8Х
Pi=~2'		Pa=YSl>			Р з = у		О -	^	-
Средний штраф рабочих						шагов
Pcv.v=slS2=±[l-<&(-±)],									(1.7.9),
а среднее смещение по направлению градиента
M [ A Q ] = p 3 - p 2 = - j С1 ~ 2 s i ) = - 4 Ф									( 27 ) *	( 1 - 7 Л 0 ) '
При а->-0 имеем
Рср.р-^О;			M[AQ]-»			2 '				(1J.11)>
						2 '
а при	а->-оо

Р с р . р ^ - ^ ;	M[AQ]->0.		(1.7.12).,

2. Двумерный	случай	(п = 2). Состояния автомата про
нумеруем в следующем		порядке:

ГЛАВА I

AQzO

UQ'<0

Рис. 1.7.2. Графы переходов автомата для случая п=2.

AXW=gei;	ДХ<2 > =	- а е , ;	Д Х ( 3 ) = с е , ;
			(1.7.13)
Д Х < 4 > = £ е 2 ;	ДХ<5 > =	- а е 2 ;	Д Х ( 6 > = а е 2 .

Графы переходов автомата показаны на рис. 1.7.2. Имеем следующие матрицы переходов автомата:

при нештрафе (AQ'<0)

0 0 1 О О О

ОО О 1 О о

А0 =		(1.7.14)
О О О О 0 1		(1.7.14)
О О О О 0 1
1	О ОО О О
1	О ОО О О

<<< < Предыдущая 1 2 3 4 5 6 7 89 / 349 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в папке книги из ГПНТБ

#
19.10.20236.93 Mб4Раскин, Н. М. Федор Петрович Моисеенко - минералог XVIII века. 1754-1781.pdf
#
29.10.20231.76 Mб7Рассохин В.В. Неполные изображения в ортогональных проекциях пособие для учителей.pdf
#
19.10.20234.76 Mб8Рассохин, В. П. Изобретательское право для изобретателей.pdf
#
19.10.20233.96 Mб5Рассудов, В. М. Некоторые задачи термоупругости пластинок и пологих оболочек.pdf
#
25.10.202312.42 Mб10Растворы флотационных реагентов. Физико-химические свойства и методы исследования [монография].pdf
#
23.10.20238.71 Mб9Растригин Л.А. Автоматная теория случайного поиска.pdf
#
21.10.20238.97 Mб1Расчет железобетонных конструкций при сложных деформациях..pdf
#
19.10.20236.42 Mб38Расчет конструкций убежищ..pdf
#
21.10.20239.08 Mб10Расчеты и анализ режимов работы сетей учеб. пособие.pdf
#
29.10.20232.07 Mб8Рауд Э.П. Опыт изготовления сложных прессформ.pdf
#
23.10.202325.18 Mб8Раушенбах, Б. В. Управление ориентацией космических аппаратов.pdf