Добавил:

ivanov666 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Башкирский Государственный Аграрный Университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

книги из ГПНТБ / Галушкин, А. И. Синтез многослойных систем распознавания образов

.pdf

Скачиваний:

Добавлен:

22.10.2023

Размер:

12.65 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 1213 / 3713 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Обратная постановка задачи синтеза является практи чески менее пригодной, нежели прямая, так как задание ограничения на количество входных каналов в СР физи чески более оправдано, нежели несколько расплывчатое ограничение на число областей.

Пример 1. Покажем, что структура многослойной СР, оптималь ная по верхней оценке количества областей с ограничением на число элементов, будет в одномерном случае оптимальна по верхней оценке с ограничением по суммарному числу входов. Согласно ме тоду множителей Лагранжа и (4-31) при N = 1 оптимальные иЯц? являются решениями следующей системы уравнений:

w	г	w	Я	:0,	h = l ,	. . . , W\
П (Я /+	1) + >.	1+ 2	Я	:0,	h = l ,	. . . , W\
i=i	L	/= I
/*/.	L	/ w	\ 2			(4-33)
w	I	/ w	\ 2
Й я'+т (£			') - T g
Здесь	%— множитель Лагранжа.
Решением (4-33) являются:
		J / / =	1. / =	I...........W;		(4-34)
			K = ------------ .			(4-34)
			K = ------------ .
				W
Здесь	W — число слоев — есть				целая	часть положительного
корня уравнения			V	0.
корня уравнения		W2-(- W -----=		0.

Из (4-34) и следует исходное утверждение.

Пример 2. Рассмотрим синтез СР с учетом (4-32), где определяется выражением (4-17). Отметим, что при перенесении

ЛПЭ из /-го слоя в / — /2-слой	уменьшение числа входов элемента
для СР с полными перекрестными связями будет равно:
Д у ~ =	' у Я д,	(4-35)
	/>=/-!

а суммарное увеличение числа входов остальных элементов сети

будет	равно:		/—/i+1
			/—/i+1		(4'36)
			Ду+= 2	Яд.	(4'36)
			h=i
Из	(4-35),	(4-36) следует, что при перенесении ЛПЭ из /-го
в / —/ 2-й слой		число входных каналов в многослойной СР будет
уменьшаться,		если
		2*	"/ . >* £ +Ч .	ИЛИ Hi - h > Hr	(4-37)
		/.=/—1	/\|=/

120

Из (4-28) и (4-29) следует, что условиям оптимальности (4-32) отвечают две структуры с суммарным числом ЛПЭ в сети Н = = [log2 'F], где квадратные скобки означают округление до ближай шего целого в сторону увеличения:

	Нх = А; Я /= N, j = 2,					, Г ;
Hj = N; Hw =		A,	j =	1, . . . , W — 1.
Здесь A — остаток от деления Н на					N;
F =	Н — А	где	,	1	0	при А = О
	-------------б,		о =		1	при А Ф 0 .
	N			\|

Обеим этим структурам отвечает одинаковое число входов, определяемое (4-30).

Рассмотрим оптимизацию структуры СР, оптимальной по длине связей.

Припишем каждой связи, идущей из Д-го в /-й слой, не который вес U. .. Физическим смыслом такого веса наряду

с длиной в обычном понимании может быть, например, ве личина, обратная помехозащищенности. Через Uoj обозна чим длину связей входного вектора с /-м слоем.

Тогда суммарная длина .связей ЛПЭ в /-м слое будет:

/ - 1	(4-38)
v r H, u °iN + 2 " Л /	(4-38)
/.=1

Суммарная длина связей в W-слойной сети будет, оче видно, равна:

" / K * + : s 4 a / V

У=1 \ /i=i

Аналогично (4-32) запишем:

4rw m = nlfx	max
™ "i	. . • г* w

V > I , H l [ u w N + ,^ H i Ul .

	/= i	V
Vw		w
Vw	™}п ц m in0	2
	«г н г . . Hw /=1

/,= i

/ - 1

Hi U 0iN + 2 H L U U

/i=i

V,N I W ] > 4 .

<4-39)

(4-40)

(4-41)

В (4-40) и (4-41) ¥ , как и ранее, определяются выраже нием (4-17) или (4-18) в зависимости от вида оценки. От-

121

метим, что при U. , =	1	(]\ =	0,	1, . . . ,	W— 1;	/ =	1, . . .
•V	(4-39) совпадает с				(4-30),	а	(4-40) и
. . . , W) выражение	(4-39) совпадает с				(4-30),	а	(4-40) и
(4-41) соответственно	с	(4-31)	и	(4-32).

Естественно теперь рассмотреть наиболее общие огра ничения на структуру СР, включающие в себя как частные случаи все остальные вышеперечисленные ограничения. С этой целью назначим цену одного ЛПЭ |3Н, цену одного

входа ра и цену единицы длины связи р„. Тогда на основа нии (4-30) и (4-39) суммарная стоимость запишется следую щим образом:

S w — Ря	W
S w — Ря	2
	/'.=1
- v	9
- v	Я 2
—	/1

Н= 1

+ ft, N

/-!=/

W	,	/	W
V	Я. + — V		Я.	I'
~	/. 1 о		л	I'
/.=/	Z	\/,=1
Я .Я 0/.Я +		/ - 1	я . я . . . (4-42)
Я .Я 0/.Я +		у	я . я . . . (4-42)
		—	Ь	1,1
	/.=1

Аналогично (4-31) и (4-32) сформулируем задачи синтеза многослойной СР с ограничением по стоимости S ^ в сле дующем виде:

r N{W] = max			max	WN[W]-
	W		n^—rtyp			(4-43)
		s> V-				(4-43)
		s> V-
S*	= min		min	S	;
v	v					(4-44)
	4'		> 4r.			(4-44)
	4'		> 4r.
		Я [W7] ^		•
В выражениях (4-43) и			(4-44)	S r	определяется	выра
жением (4-42), а		— выражениями (4-17) и				(4-18)
в зависимости от вида оценки.						РнРа
Отметим, что вариацией коэффициентов стоимости						РнРа

и Ри в выражениях (4-43) и (4-44) могут быть получены все

рассмотренные выше формулировки задач синтеза струк туры СР.

4-8. Оптимизация структуры многослойных СР

сК р решениями

Вданном случае многослойная СР с полными перекрестными связями составлена из элементов, описываемых соотношением (4-2).

Каждый такой элемент реализует в своем пространстве признаков совокупность параллельных разделяющих гиперплоскостей. Оче видно, что максимальное число областей, выделяемых в исходном

122

пространстве признаков эквивалентной разделяющей поверхностью, в данном случае не превышает Кр, где Н — число ЛПЭ в сети.

Эта оценка достигается только для многослойных СР с полными перекрестными связями.

Оценим количество областей, на которое пространство призна ков размерности N может быть разбито Я х группами гиперплоско стей по (Кр — 1)-й гиперплоскости в каждой группе. Обозначим

максимальное количество			областей, выделяемых [Н1— 1 ]-й				груп
пой через Ч'	Р	. Тогда аналогично (§ 4-6) можно показать,					что
	N [ п — 1]		_TjfKP
		Ш К Р
		N [ Я , ] ~		я [ Я .- 1 'J + Z.
Оценим	величину z.		При	проведении	каждой	из (Кр — 1)-й
гиперплоскостей		количество выделяемых			областей	увеличивается

на число областей, образуемых на гиперплоскости линиями ее пере сечения с остальными гиперплоскостями пространства, т. е. на

шк р

Т Я — 1 [ Я ,— 1]-

Отсюда

z = [ /^p _ i ] ^ L 1

и окончательно
^ ][Ря ,]=		^ W	. ] + F p - 4 ^	1	[Я,-.]	(4-45)
с начальными	условиями
K	pl1] =	<	Ря,] =	1 )+	'•	(4‘46)
Исходя из (4-45)		и (4-46) доказывается следующее:
	т ^ Р[Я1] = ^ р 1 ПРИ					(4-47)
	^	P№ ]<	"Рч Hi > N-
Рассмотрим	hj-й ЛПЭ с Кр решениями,			расположенный		в /'-м

слое многослойной СР с полными перекрестными связями. Входные

сигналы hj-то ЛПЭ могут быть разбиты на две группы: х =	[х1г . . .
. . . , лсдг ] — вектор входных сигналов и у = (ух, . . . .	уК) —

вектор-строка выходных и промежуточных сигналов (/ — 1) -слой- ной СР. Пусть (/ — 1)-слойная СР выделяет в исходном простран-

стве признаков	_jj	областей. Тогда по каналу у на входы hj-го
ЛПЭ может поступить		различных вариантов вектора у.

Уравнение для выходного сигнала hj-го ЛПЭ с Кр решениями может быть записано в следующем виде:

Ah и A hx — векторы весовых коэффициентов соответственно для х и у.

123

Геометрически, как следует из (4-48), каждый из Hj ЛПЭ с Кр решениями реализует в пространстве входных сигналов CP (/С —

— 1) ЧгдГР|у_цпараллельных гиперплоскостей. Допуская, что сущест

вует метод настройки коэффициентов СР, при котором для каждого hj-го ЛПЭ каждые (Кр — 1) гиперплоскостей, порожденных вариан том вектора у, проходят через область исходного пространства признаков, соответствующую ему, запишем выражение для верхней оценки числа областей, на которое пространство X разбивается рассматриваемой /-слойной СР:

	ш^р	_	\ц^р	(4-49)
	* N ГЛ —		[i - lV NH:
Здесь	определяется		выражениями (4-45) и (4-46).	Если

считать (4-49) рекуррентным выражением и вспомнить, что первый

слой ЛПЭ с Кр решениями разбивает пространство X на Y ^			об
ластей, то (4-49) перепишется в следующем виде:
YKp	П YKP		(4-50)
NU]	til	NHi

Выражение (4-50) позволяет поставить и решить задачу син теза структуры СР, оптимальной по верхней оценке количества

областей при ограничении на суммарное число					Н ЛПЭ в СР. Из
(4-50) и (4-47)	следует,		что в U^-слойной СР
			w
			S " /
^	V	] =	< ‘	при Hj < N;
		w			(4-51)
¥ w V ]	<	1	при	Hi > N ( / = 1, • ■ •	- w )-

Следовательно, оптимальной по верхней оценке числа областей будет СР с полными перекрестными связями такая, что число ЛПЭ с Кр решениями в любом ее слое не превышает размерности исход ного пространства признаков.

Г л а в а п я т а я

АНАЛИЗ РАЗОМКНУТЫХ СР

5-1. Законы распределения аналоговой и дискретной ошибок СР

Исходным материалом для анализа разомкнутых СР являются заданная в общем виде плотность распределения входного сигнала и структура разомкнутой СР. Рассмат риваются такие структуры разомкнутых СР, как ЛПЭ

124

с двумя, Кр и континуум решений, нелинейные и много слойные СР из ЛПЭ. Варианты характеристик входного сигнала представлены случаями двух, К и континуума клас сов образов при произвольной квалификации учителя.

Целью анализа разомкнутых СР является вывод и ис следование выражений для распределений и моментов рас пределений промежуточных и выходных сигналов СР. В данной главе в основном производится анализ распреде лений и моментов распределений ошибок СР. На основании результатов анализа разомкнутых СР выбираются функ ционалы вторичной оптимизации.

Под функционалом вторичной оптимизации понимается функционал, выражаемый через параметры распределений текущих сигналов и ошибок СР и непосредственно миними зируемый в многослойных СР при настройке по замкнутому циклу. При этом основной является задача формирования функционала вторичной оптимизации, соответствующего заданному критерию первичной оптимизации; соответствие понимается в смысле совпадения параметров СР при обес печении минимума функционалов первичной и вторичной оптимизации.

Преобразование, осуществляемое разомкнутым ЛПЭ с двумя решениями, может быть представлено в следующем виде:

Ч (п) =	N	од, (л) =		sign g (я).	(5-1)
Ч (п) =	sign 2	од, (л) =		sign g (я).	(5-1)
	1= 0
Выражения для аналоговой и дискретной ошибок ЛПЭ
имеют вид:
ха (п) = г(п) —g(n); xg(л) = е (я)—хк(л).					(5-2)
Функция распределения входного сигнала при К = 2
равна (см. гл. 1):	A-iti (х)+44			(*) прие=1’
44	A-iti (х)+44			(*) прие=1’
/(*. е) =		+ 4		( х ) при е = — 1 .
4	л 1/ 1 ( х )	+ 4	в 2/ 2	( х ) при е = — 1 .
4		4
Здесь
= [2 + (с2—Cj) —bi (Ci + с2)] Pi,
А %= [2 -f- (ся —Ci) -f- b2(ca-f- Cj)] p2;
Bi = [2 -(- (c2—Ci)			bi (d -(- c2)] Pi,

B2 = [2 + (ся —Ci) — b2(ci-\- c2)} p2.

125

Распределение аналоговой ошибки рассматриваемой СР имеет вид:

		N — 1
М * ) =	1			A J J x ! , . . . , Xft—j , 1 Я(»
М * ) =	4а,
N—1		\								1-f a„— xa
		+								1-f a„— xa
		+						> Xh/-1>
i£=i		/								JV
i£=i		/
Л1-1										1+ a0 —
	"a7. l+ BiM *i’					■•	•	> **-1.		1+ a0 —
i=i	"a7. l+ BiM *i’					■•	•	> **-1.		N
										N

N — 1										— 1 + aо — xa
	i Xl a	)“1 ^2^2(Л'1’				• •	•	> Л'лг-1’		— 1 + aо — xa
i=l	i Xl a	)“1 ^2^2(Л'1’				• •	•	> Л'лг-1’
i=l		N - \
		N - \
		- Л				dxN_ v . .				dxv	(5-3)
		- Л
		i—\
а дискретной ошибки
		~	[В]. (1 — (Dj) +						5 а (1 — Ф2)!
		4			при xg= — 2,
					при xg= — 2,
fxe (xg)~		~ [ A i ( 1		Ф*)~ЬЗ1Ф1 -f- Л2 (1— Ф2) 4~							(5-4)
				+	З 2Ф2]			ПРИ хг —О,
			[Л1Ф1 + Л 2Ф2]						при	xg = 2.
Здесь
									l N — 1
	JV—1				N
	JV—1
\|	‘			\|		fk (-^1»			• • ■> % ) 6^1
	— DO		Л1-1
		I».		V I	ai
		7N	- V		UN
				1=1
			. . . dxN,				k = \ ,		2.

126

Выражения для моментов г-го порядка распределения аналоговой и дискретной ошибок рассматриваемой СР можно представить в виде

а.	= _!_ у	(. ■1)2г+тС		N	а(.
а.	= _!_ у	(. ■1)2г+тС		V	а(.
'	4
Х {[^I (ао+ 1)Г m+ 5 i(ao—					( 1)	+
Х {[^I (ао+ 1)Г m+ 5 i(ao—					У]	+
+	[ 'М а0 + 1Г m +		^2 (а0— 1 )Г "lj			. \ ; (5-5)
+	[ 'М а0 + 1Г m +		^2 (а0— 1 )Г "lj			•ml
		N
		ои
	С	j ■•	• J 4	• • •	xi J k w	dx'
arg = 2Г- 2 [(Л,Фх +			А2Ф2) + ( - 1 ) г(В1+			В2
		— В 1Ф 1- В г Ф 2)1				(5-6)

В частном случае при с1 = с2 '= 1 и br = b2 = Ь рас пределение аналоговой ошибки рассматриваемой СР имеет вид (5-3) с заменой

Лх = 2 (1 — Ь ) p i ,	Л8 = 2(1 + 6 )р 2;
Bl = 2{\ + b)Pl\	В2 — 2( \ — Ь) р2.

Распределение дискретной ошибки:

■ Y (Pi (1 + Ь ) (1- Ф 0 + р2 (1 - 6 ) (1 — Ф.2)], xg= - 2 ; .

^-[1 + 6 ( р 2— Pi) + 2/?i60i — 2р2М>2], хй = 0;

- i - [ ( l — 6 ) p 1O i + ( l + b) р2ф 2], x g = 2.

Выражение для моментов распределения дискретной ошибки СР в данном случае имеет следующий вид:

а ,й = 2{р1[1 + 6 (1 - 2 Ф 1)] + р2[ 1 - М 1 - 2 Ф 2)]},

и отдельно для совокупностей образов первого и второго класса:

a ,le = 2 [Pl (1 + b) (1 - Ф г) + р2(1	- Ь) (1 - Ф 2)];
аг2я= 2 [Pl (1 - 6) Фх -1 р2 (1	-I- Ь) Ф2].

127

Преобразование, осуществляемое разомкнутым	ЛПЭ
с континуумом решений в режиме обучения, может	быть

представлено в следующем виде:

N		= F[g (л)].
xk (п) = F V CLX;		= F[g (л)].
1—0	1 1

В случае континуума классов образов на входе СР

/(х, е) = /' (хъ . . . , xN/e)fe(n).

Совместное распределение сигнала е (п) и аналогового выходного сигнала g (п) имеет следующий вид:

N —1

/gE(£. е) = ~	Р	g + До
		N —1’	°N. '
N
- 2 *<’^	/ eV e(e)d*jv- 1 ■■■ d X r

Распределение аналоговой ошибки СР

N — 1

00 -

Отсюда можно получить выражение для момента г-го порядка аналоговой ошибки в следующем виде

ла

N	у
■>j ailJi + е +	а 0 ] х
£--■1
х Г (у/е) /е (е) dyde.	(5 -7 )

Распределение дискретной ошибки СР

	N
	aN I • • 1 I ^ ( Xi’ ’ ' • ’ X N - 1>	F 1(e — *g) + a„
	aN I • • 1 I ^ ( Xi’ ’ ' • ’ X N - 1>	йЛ£
		йЛ£

128

dF 1(s — x g)

d (s — xg)

X dxN-1 . . dx^e.	(5-7a)
Отсюда
лг+i
N
2 a iVi —a 0 + e	X
i=l
X f ( y / E ) f e ( e) dyde.	(5-8)

В частном случае при обучении распознаванию двух

классов образов

N — 1

		00			1
		d F	\ —	\ — X g)	1
		d( — 1 — xg)			\|
				N - \
X / , [	F	1( — 1— xg) + a0
X / , [	. . . ,XN _ ^ ,			-	2 1 4		*
		aN		-	2 1 4		*
		N —1
		00		(1 — xg)
X d	x ^ . . . <&, + -£*- j . . .		J*	(1 — xg)			X
X d	x ^ . . . <&, + -£*- j . . .		J*	d (1 —Xg)			X
				d (1 —Xg)
	X f2 ( x y, . . . ,	F	1(* — Xg) -f- a0
	X f2 ( x y, . . . ,	* д , _ ! ,		N
	N —1			N
	N —1
	/ i^i	j JV}^XN—1 ' ' •		^Xl’			(5-8a)
	/ i^i	j JV}^XN—1 ' ' •		^Xl’
	i=l
	N
a rg ~ P i \ • • •		■F \ 2 У Л — а0 ] — 1				X
	-oo	i=1
	-oo
	N
x f i ( y ) d y + p 2 . .		N				/2 (y) dy
x f i ( y ) d y + p 2 . .		—^ ( 2		ao] + 1		/2 (y) dy
							(5-9)

5 З а к а з № 975

129

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 1213 / 3713 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в папке книги из ГПНТБ