Добавил:

ivanov666 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Башкирский Государственный Аграрный Университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

книги из ГПНТБ / Растригин Л.А. Автоматная теория случайного поиска

.pdf

Скачиваний:

Добавлен:

23.10.2023

Размер:

8.71 Mб

Скачать

☆

<<< < Предыдущая 10 11 12 13 14 15 16 17 18 19 20 21 2223 / 3423 24 25 26 27 28 29 30 31 32 33 34 > Следующая >>>

ПОИСК С САМООБУЧЕНИЕМ

		225
	1	0	0 .	.	0	0
	1	0	0 .	.	0	0
А =	0	1	0 .	.	0	0	(2.6.12)
	0	0	0 .	.	1	0

Предельные вероятности

равны

Pi = 1;

p2 = Ps= • • • = P 2 m = 0

(2.6.13)

среднее

приращение

функции

Q(xx)

на

одном

шаге

M[AQ] = pi-

( 1 - p i )

= 2pl-\=d.

(2.6.14)

Сопоставляя

формулы

(2.6.11)

(2.6.14),

видим,

что

выражению

(2.6.11)

соответствует

параметр

d в алго

ритме случайного поиска с покоординатным

самообуче

нием.

Формула

(2.6.10) дает

решение

для

функций, завися

щих от одного переменного Q(X) =

Q(xx).

т. е.

рассмотрим

д в у м е р н ы й

с л у ч а й ,

функции,

зависящие

от двух переменных Q = Q(xx,

х2).

Тогда в процедуре оптимизации участвуют два

автомата

Ах

и А2,

система которых

Л = { Л Ь

А2} образует

один бо

лее сложный автомат А. Внутренним состоянием ав

томата А является вектор W = (доь

Дог), где

W\ и w2

—

внутренние

состояния

автоматов

А\ и Л2 соответственно,

а его вы

ходом является вектор

Д Х = ( Д х ь

Ах2),

где Дх1 и Ах2

— выходы ав

томатов

Л,

и Л2

соответственно.

Входом

автомата

является

sign AQ.

Пусть

далее вектор

градиента

функции

Q(xu

х2)

находится

между

биссектрисами

первого

и четвертого

квадранта

плоскости

Рис.

2.6.4. Плоскость

не

Х ( х ь

х2)

(рис. 2.6.4)

и пусть

каж

дый

из

автоматов

Ах

и Л 2

имеет

зависимых

переменных

оптимизируемой функции

два

состояния

w2 (г)

Q{xu

хг).

15 — 2014

ГЛАВА II

226

Рис. 2.6.5. Граф переходов цепи Маркова,

описывающей переходы системы автома тов Л = {ЛЬ Л2 ) приОт1= т 2 = 1 .

( г = 1 , 2), т. е. mi = m 2 = l .	Тогда автомат А имеет пере
ходные матрицы А0 и А\	типа (2.1.107) и (2.1.108). По

формуле (2.1.25) находим, что переходы автомата А об разуют однородную цепь Маркова (рис. 2.6.5) со следу ющей матрицей переходных вероятностей:

Г12	Г\Г2	Г\Г2	г22
Г\Г2	г?		Г\Г2	(2.6.15)
		г,2	Г\Г2	(2.6.15)
Г\Г2		г,2	Г\Г2
Г , 2	Г\Г2	Г\Г2
Предельные	вероятности		этой цепи Маркова равны
1
Р1 = Р З = - ^ - > Ь
*				(2.6.16)
1

p2=Pi=Yr2-

ПОИСК С САМООБУЧЕНИЕМ

227

Среднее приращение функции Q(xu х2) на одном шаге

M[AQ]=-^(ri-r2)au

(2.6.17)

где ai = cos(xb gradQ).

Для алгоритма случайного поиска с покоординатным самообучением в § 2.2 было получено:

M [ A Q ] = ~ d a i .

(2.6.18)

Следовательно, параметр d соответствует разности ве роятностей Г\ — Г 2 .

Когда автомат А\ имеет 2т состояний, а автомат А2 — два состояния, тогда по матрице (2.1.25) находим, что переходы автомата Л = {ЛЬ А2) образуют цепь Маркова (рис. 2.6.6) со следующей матрицей переходных вероят ностей:

А =	т2	(2.6.19)
	т2	т{

где блоки Г, и Т2 — матрицы (2.6.20) и (2.6.21) типа Якоби.

15*

V\~	rxr2	О	О	О
г,2	О	г,г2	О	О
О	л,2	О	гхг2	О
О	О	О О	О
0	0	0	0	0
0	0	0	0	0
0	0	0	0	0
0	0	0	0	0

0	0 0		0	0 . . .	0	0	0	0
0	0 0		0	0 . . .	0	0	0	0
0	0	0	0	0 . . .	0	0	0	0
гI2	0 пг2		0	0 . . .	О	О	О	О
О гуг2		0	г2-	0 . . .	О	0		0 0
О	0	0	0	0 . . .	г,г2	0	г 2 2	О
О	0 0		0	0 . . .	О	гхг2	0	г 2 2
О О О			О 0 . . .		О	0	г{г2	г 2 2

(2.6.20)

Г\Г2	Г22	0	0	0 . .	0	0	0	0		0 .	.	0	0	0	0
Г\Г2	0	г2г	0	0 . .	0	0	0	0	-	0 .	.	0	0	0	0
0	Г\Г2	0	г22	0 . .	0	0	0	0		0 .	.	0	0	0	0
0	0	0	0 0 . •		гхг2	0	г22	0 0 .			. 0		0	0	0
0	0	0	0	0 . .	0	/-12	0	Г\Г2		0 .	.	0	0	0	0
0	0	0	0	0 . .	0	0	0	0		0 .	.	г.2	0	Г\Г2	0
0	0	0	0	0 . .	0	0	0	0		0 .	.	0	г.2	0	Г\Г2
0	0	0	0	0 . .	0	0	0	0		0 .	.	0	0	>-12	Г\Г2

(2.6.21)

ГЛАВА II

230-

Предельные	вероятности	для	этой	цепи Маркова
равны
Pi — Pi+2rnz l r	i 2 m - V - l	Г ' ~ Г	2	(2.6.22)
2		Г12т_Г22т
		( t = l		2 т ) ,

а среднее приращение функции Q(X) определяется по формуле

M[AQ]=-	1	rim	—	r2m
M[AQ]=-	У2	rxm	+	r2n

(2.6.23)

Следовательно,

lim М[Д<2] = | 2

(2.6.24)

Рис. 2.6.7. Граф переходов цепи Маркова, описываю щий переходы системы ав томатов A—{Ah А2] при OTi = I; m2 =2m.

Нетрудно заметить, что в рас смотренном случае увеличение памяти тх автомата А\ приво

дит	к	увеличению			среднего
приращения функции						Q(xi,x2).
Когда		автомат А\			имеет два
состояния,			а	автомат		А2	—
2т	состояний,			переходы			авто
мата	А — {Аи			А2}	образуют
цепь	Маркова			(рис. 2.6.7) с
матрицей			переходных			вероят
ностей
		Ti(rx)		Т2(г2)
		Т2	(г,)	Г, (г2 )
						(2.6.25)
где	блоки		Ti(r{) и		Ti(r2)		(i —
= 1,	2)	представляют				собой
матрицы типа				Якоби:

гг2	Г\Г2	0	0	0 .	.	0	0	0	0	0 . . .	0	0	0	0
	0	Г\Г2	0	0 .	.	0	0	0	0	0 . . .	0	0	0	0
0	г.2	0	Г\Г2	0 .	.	0	0	0	0	0 . . .	0	0	0	0
0	0	0	0	0 . .		/- . 2	0	Г\Г2	0	0 . . .	0	0	0	0
0	0	0	0	0 . .		0	Г\Г2	0	г,2	0 . . .	0	0	0	0
0	0	0	0	0 .	.	0	0	0	0	0 . • •	гхг2	0	гх2	0
0	0	0	0	0 . .		0	0	0	0	0 . . .	0	гхг2	0	гх2
0	0	0	0	0 .	.	0	0	0	0	0 . . .	0	0	гхг2	г{2

(2.6.26)

СП

5 m 3

t\r2	ГI2	0	0	0 . .	0	0	0	0	0 . . .	0	0	0	0
Г\Г2	0		0	0 .	0	0	0	0	0 . . .	0	0	0	0
0	Г\Г2	0	гГ-	0 . .	0	0	0	0	0 . . .	0	0	0	0
0	0	0	0	0 . •	гхг2	0		0	0 . . .	0	0	0	0
0	0	0	0	0 . .	0	г;1	0	Г\Г2	0 . . .	0	0	0	0
О	О	О О О . . .			О	0 0		О 0 . . .		/-[2 0 гхг2			о
О	О	0	0 0 . . .		О	0 0		О 0 . . .		О /-,2		0	гхг2
О	О	О О О . . .			О	0 0		О	0 . . .	О	0	rt 2	r , r 2 !
			т							пг

(2.6.27)

ПОИСК С САМООБУЧЕНИЕМ

	233
Т](г2)	можно	получить	из 7"i(гi) и Т2(г2) — из				Т2(г{),
если в этих матрицах поменять местами гх и г2.							Мар
Предельное		распределение			вероятностей цепи		Мар
кова	следующее:
		1	(а-Ь)ат~'Ь>-
	~-P2m+\-i— -Г" f 1		ат — Ьт
		2	ат — Ьт			(2.6.28)
						(2.6.28)
		1		(a-b)am~ibi~1
P2m+i — Pim+l—i — "7Г r2			a	m	— b	m
		2	a		— b	( i = l , 2 , . . . , m ) ,
						( i = l , 2 , . . . , m ) ,
где
a = /-!2 + r2 2 ; b = 2r1r2.
Среднее приращение			функции
M [ A Q ] = - ^		( п - ^ о , .				(2.6.29)
	У2

Полученная формула совпадает с формулой (2.6.17). Следовательно, увеличение памяти автомата Л 2 в рас смотренном случае не влияет на среднее приращение функции Q(xi,x2) при ее оптимизации.

Из изложенного в этом параграфе видно, что относи тельно среднего приращения функции Q(X) на одном шаге поиска оба алгоритма эквивалентны, т. е. для обоих можно указать такие значения их параметров, при которых средние приращения функции Q(X) совпадают.

§ 2.7. СТАТИСТИЧЕСКИЕ СВОЙСТВА КОЛЛЕКТИВА ВЕРОЯТНОСТНЫХ АВТОМАТОВ ПРИ ОПТИМИЗАЦИИ ФУНКЦИИ л ПЕРЕМЕННЫХ

В предыдущем параграфе были получены формулы для определения предельных вероятностей цепи Маркова и среднего приращения функции Q(X), если эта функция зависит от одного или двух перемен ных. В этом параграфе получим общие формулы для случая функции Q(X) п переменных при условии, что

р2п.

р \ , . . . ,

ГЛАВА II

234
каждый автомат коллектива	имеет два состояния [16],
т. е. память автоматов т\—\	(/= 1,...,п).

За состояние системы, как и раньше, примем элемент

множества возможных значений вектора		W = (wi, w 2 , . . .
..., wn),	которое обозначим через {W}. Общее число воз
можных	значений вектора W конечно и	равно

				(2.7.1)
Пусть	pij	(i,	/ e [ W } ) означает вероятность	перехода
вектора	W	из	состояния W ( i ) в состояние WW	за один

шаг. Переход вектора W из одного состояния в другое описывается цепью Маркова с матрицей переходных ве

роятностей (2.1.25), матрицы	Л 0	и А\	которой определя
ются формулами (2.1.107) и (2.1.108).
Предельные вероятности р	и ...,	р 2 п	этой цепи Маркова

в общем случае находятся как решение системы алгеб раических уравнений (2.1.20). В этом параграфе [16] по кажем другой, более простой прием нахождения пре дельных вероятностей

Разобьем множество состояний системы {W} на два


непересекающихся			подмножества		{W}+		и	{ W } - , при
чем W e { W } + ,		если AQ>0		при смещении АХ; в про
тивном случае, т. е. когда				AQ<0,		W e { W } - .			Случай,
когда AQ = 0,		который возможен			при совпадении				линии
уровня функции Q(xu...,xn)				с одним из поисковых дви
жений AXW (/ = 1 , . . . , 2"), не будем						рассматривать.
Пусть	глубина		памяти	всех	автоматов			коллектива
равна единице		( т г	= 1 ; 1=1,... ,п).		В этом		случае		вектор
состояний	системы		W = ( ш ь	. . . , да„)		имеет	2™ различных

значений. Перенумеруем эти значения следующим обра зом: номера от 1 до 2"-1 присваиваются состояниям сис темы, входящим в { W } - . Остальным состояниям, вхо дящим в (W}+, номера присваиваются по следующему

правилу:	если	состояние	W = (wu	...,	wn) имеет номер
г = 1 , 2,...,2п~х		(т. е. A Q ( i ) < 0 ) , то номер i + 2n~x присваи
вается такому		состоянию	из { W } + ,	для	которого
A Q ( l + 2	> = - A Q W

<<< < Предыдущая 10 11 12 13 14 15 16 17 18 19 20 21 2223 / 3423 24 25 26 27 28 29 30 31 32 33 34 > Следующая >>>

Соседние файлы в папке книги из ГПНТБ

#
19.10.20236.93 Mб4Раскин, Н. М. Федор Петрович Моисеенко - минералог XVIII века. 1754-1781.pdf
#
29.10.20231.76 Mб7Рассохин В.В. Неполные изображения в ортогональных проекциях пособие для учителей.pdf
#
19.10.20234.76 Mб8Рассохин, В. П. Изобретательское право для изобретателей.pdf
#
19.10.20233.96 Mб5Рассудов, В. М. Некоторые задачи термоупругости пластинок и пологих оболочек.pdf
#
25.10.202312.42 Mб10Растворы флотационных реагентов. Физико-химические свойства и методы исследования [монография].pdf
#
23.10.20238.71 Mб9Растригин Л.А. Автоматная теория случайного поиска.pdf
#
21.10.20238.97 Mб1Расчет железобетонных конструкций при сложных деформациях..pdf
#
19.10.20236.42 Mб38Расчет конструкций убежищ..pdf
#
21.10.20239.08 Mб10Расчеты и анализ режимов работы сетей учеб. пособие.pdf
#
29.10.20232.07 Mб8Рауд Э.П. Опыт изготовления сложных прессформ.pdf
#
23.10.202325.18 Mб8Раушенбах, Б. В. Управление ориентацией космических аппаратов.pdf