Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Галушкин, А. И. Синтез многослойных систем распознавания образов

.pdf
Скачиваний:
11
Добавлен:
22.10.2023
Размер:
12.65 Mб
Скачать

Обратная постановка задачи синтеза является практи­ чески менее пригодной, нежели прямая, так как задание ограничения на количество входных каналов в СР физи­ чески более оправдано, нежели несколько расплывчатое ограничение на число областей.

Пример 1. Покажем, что структура многослойной СР, оптималь­ ная по верхней оценке количества областей с ограничением на число элементов, будет в одномерном случае оптимальна по верхней оценке с ограничением по суммарному числу входов. Согласно ме­ тоду множителей Лагранжа и (4-31) при N = 1 оптимальные иЯц? являются решениями следующей системы уравнений:

w

г

w

Я

:0,

h = l ,

. . . , W\

П (Я /+

1) + >.

1+ 2

i=i

L

/= I

 

 

 

/*/.

/ w

\ 2

 

 

(4-33)

w

I

 

 

 

Й я'+т (£

') - T g

 

 

Здесь

%— множитель Лагранжа.

 

Решением (4-33) являются:

 

 

 

 

 

J / / =

1. / =

I...........W;

(4-34)

 

 

 

K = ------------ .

 

 

 

 

 

 

 

 

W

 

 

Здесь

W — число слоев — есть

целая

часть положительного

корня уравнения

 

V

0.

 

 

W2-(- W -----=

 

 

Из (4-34) и следует исходное утверждение.

Пример 2. Рассмотрим синтез СР с учетом (4-32), где определяется выражением (4-17). Отметим, что при перенесении

ЛПЭ из /-го слоя в / — /2-слой

уменьшение числа входов элемента

для СР с полными перекрестными связями будет равно:

 

Д у ~ =

' у Я д,

(4-35)

 

/>=/-!

 

а суммарное увеличение числа входов остальных элементов сети

будет

равно:

 

/—/i+1

 

 

 

 

(4'36)

 

 

 

Ду+= 2

Яд.

 

 

 

h=i

 

 

Из

(4-35),

(4-36) следует, что при перенесении ЛПЭ из /-го

в / —/ 2-й слой

число входных каналов в многослойной СР будет

уменьшаться,

если

 

 

 

 

 

2*

"/ . >* £ +Ч .

ИЛИ Hi - h > Hr

(4-37)

 

 

/.=/—1

/|=/

 

 

120

Из (4-28) и (4-29) следует, что условиям оптимальности (4-32) отвечают две структуры с суммарным числом ЛПЭ в сети Н = = [log2 'F], где квадратные скобки означают округление до ближай­ шего целого в сторону увеличения:

 

Нх = А; Я /= N, j = 2,

 

, Г ;

Hj = N; Hw =

A,

j =

1, . . . , W — 1.

Здесь A — остаток от деления Н на

N;

F =

Н — А

где

,

1

0

при А = О

-------------б,

о =

1

при А Ф 0 .

 

N

 

 

|

Обеим этим структурам отвечает одинаковое число входов, определяемое (4-30).

Рассмотрим оптимизацию структуры СР, оптимальной по длине связей.

Припишем каждой связи, идущей из Д-го в /-й слой, не­ который вес U. .. Физическим смыслом такого веса наряду

с длиной в обычном понимании может быть, например, ве­ личина, обратная помехозащищенности. Через Uoj обозна­ чим длину связей входного вектора с /-м слоем.

Тогда суммарная длина .связей ЛПЭ в /-м слое будет:

/ - 1

(4-38)

v r H, u °iN + 2 " Л /

/.=1

 

Суммарная длина связей в W-слойной сети будет, оче­ видно, равна:

" / K * + : s 4 a / V

У=1 \ /i=i

Аналогично (4-32) запишем:

4rw m = nlfx

max

"i

. . • г* w

V > I , H l [ u w N + ,^ H i Ul .

 

/= i

V

Vw

 

w

™}п ц m in0

2

 

«г н г . . Hw /=1

/,= i

/ - 1

Hi U 0iN + 2 H L U U

/i=i

V,N I W ] > 4 .

<4-39)

(4-40)

(4-41)

В (4-40) и (4-41) ¥ , как и ранее, определяются выраже­ нием (4-17) или (4-18) в зависимости от вида оценки. От-

121

метим, что при U. , =

1

(]\ =

0,

1, . . . ,

W— 1;

/ =

1, . . .

•V

(4-39) совпадает с

(4-30),

а

(4-40) и

. . . , W) выражение

(4-41) соответственно

с

(4-31)

и

(4-32).

 

 

 

Естественно теперь рассмотреть наиболее общие огра­ ничения на структуру СР, включающие в себя как частные случаи все остальные вышеперечисленные ограничения. С этой целью назначим цену одного ЛПЭ |3Н, цену одного

входа ра и цену единицы длины связи р„. Тогда на основа­ нии (4-30) и (4-39) суммарная стоимость запишется следую­ щим образом:

S w — Ря

W

2

 

/'.=1

- v

9

Я 2

/1

Н= 1

+ ft, N

W

/-!=/

W

,

/

W

 

V

Я. + — V

Я.

I'

~

/. 1 о

 

л

/.=/

Z

\/,=1

 

Я .Я 0/.Я +

/ - 1

я . я . . . (4-42)

у

 

 

Ь

1,1

 

/.=1

 

 

Аналогично (4-31) и (4-32) сформулируем задачи синтеза многослойной СР с ограничением по стоимости S ^ в сле­ дующем виде:

r N{W] = max

max

WN[W]-

 

 

W

n^—rtyp

 

(4-43)

 

 

s> V-

 

 

 

 

 

 

 

S*

= min

min

S

;

 

v

v

 

 

 

 

(4-44)

 

4'

 

> 4r.

 

 

 

 

 

 

 

Я [W7] ^

 

 

В выражениях (4-43) и

(4-44)

S r

определяется

выра­

жением (4-42), а

 

— выражениями (4-17) и

(4-18)

в зависимости от вида оценки.

 

 

РнРа

Отметим, что вариацией коэффициентов стоимости

и Ри в выражениях (4-43) и (4-44) могут быть получены все

рассмотренные выше формулировки задач синтеза струк­ туры СР.

4-8. Оптимизация структуры многослойных СР

сК р решениями

Вданном случае многослойная СР с полными перекрестными связями составлена из элементов, описываемых соотношением (4-2).

Каждый такой элемент реализует в своем пространстве признаков совокупность параллельных разделяющих гиперплоскостей. Оче­ видно, что максимальное число областей, выделяемых в исходном

122

пространстве признаков эквивалентной разделяющей поверхностью, в данном случае не превышает Кр, где Н — число ЛПЭ в сети.

Эта оценка достигается только для многослойных СР с полными перекрестными связями.

Оценим количество областей, на которое пространство призна­ ков размерности N может быть разбито Я х группами гиперплоско­ стей по (Кр — 1)-й гиперплоскости в каждой группе. Обозначим

максимальное количество

областей, выделяемых 1— 1 ]-й

груп­

пой через Ч'

Р

. Тогда аналогично (§ 4-6) можно показать,

что

 

N [ п — 1]

_TjfKP

 

 

 

 

 

Ш К Р

 

 

 

 

 

N [ Я , ] ~

я [ Я .- 1 'J + Z.

 

 

Оценим

величину z.

При

проведении

каждой

из (Кр — 1)-й

гиперплоскостей

количество выделяемых

областей

увеличивается

на число областей, образуемых на гиперплоскости линиями ее пере­ сечения с остальными гиперплоскостями пространства, т. е. на

шк р

Т Я — 1 [ Я ,— 1]-

Отсюда

z = [ /^p _ i ] ^ L 1

и окончательно

 

 

 

 

 

 

^ ][Ря ,]=

^ W

. ] + F p - 4 ^

1

[Я,-.]

(4-45)

с начальными

условиями

 

 

 

 

K

pl1] =

<

Ря,] =

1 )+

'•

(4‘46)

Исходя из (4-45)

и (4-46) доказывается следующее:

 

 

т ^ Р[Я1] = ^ р 1 ПРИ

 

 

(4-47)

 

^

P№ ]<

"Рч Hi > N-

 

 

Рассмотрим

hj-й ЛПЭ с Кр решениями,

расположенный

в /'-м

слое многослойной СР с полными перекрестными связями. Входные

сигналы hj-то ЛПЭ могут быть разбиты на две группы: х =

[х1г . . .

. . . , лсдг ] — вектор входных сигналов и у = (ух, . . . .

уК)

вектор-строка выходных и промежуточных сигналов (/ — 1) -слой- ной СР. Пусть (/ — 1)-слойная СР выделяет в исходном простран-

стве признаков

_jj

областей. Тогда по каналу у на входы hj-го

ЛПЭ может поступить

различных вариантов вектора у.

Уравнение для выходного сигнала hj-го ЛПЭ с Кр решениями может быть записано в следующем виде:

Ah и A hx — векторы весовых коэффициентов соответственно для х и у.

123

Геометрически, как следует из (4-48), каждый из Hj ЛПЭ с Кр решениями реализует в пространстве входных сигналов CP (/С —

— 1) ЧгдГР|у_цпараллельных гиперплоскостей. Допуская, что сущест­

вует метод настройки коэффициентов СР, при котором для каждого hj-го ЛПЭ каждые (Кр — 1) гиперплоскостей, порожденных вариан­ том вектора у, проходят через область исходного пространства признаков, соответствующую ему, запишем выражение для верхней оценки числа областей, на которое пространство X разбивается рассматриваемой /-слойной СР:

 

ш^р

_

\ц^р

(4-49)

 

* N ГЛ —

[i - lV NH:

 

Здесь

определяется

выражениями (4-45) и (4-46).

Если

считать (4-49) рекуррентным выражением и вспомнить, что первый

слой ЛПЭ с Кр решениями разбивает пространство X на Y ^

об­

ластей, то (4-49) перепишется в следующем виде:

 

YKp

П YKP

(4-50)

NU]

til

NHi

 

Выражение (4-50) позволяет поставить и решить задачу син­ теза структуры СР, оптимальной по верхней оценке количества

областей при ограничении на суммарное число

Н ЛПЭ в СР. Из

(4-50) и (4-47)

следует,

что в U^-слойной СР

 

 

 

 

w

 

 

 

 

 

S " /

 

 

^

V

] =

< ‘

при Hj < N;

 

 

 

w

 

 

(4-51)

¥ w V ]

<

1

при

Hi > N ( / = 1, • ■ •

- w )-

Следовательно, оптимальной по верхней оценке числа областей будет СР с полными перекрестными связями такая, что число ЛПЭ с Кр решениями в любом ее слое не превышает размерности исход­ ного пространства признаков.

Г л а в а п я т а я

АНАЛИЗ РАЗОМКНУТЫХ СР

5-1. Законы распределения аналоговой и дискретной ошибок СР

Исходным материалом для анализа разомкнутых СР являются заданная в общем виде плотность распределения входного сигнала и структура разомкнутой СР. Рассмат­ риваются такие структуры разомкнутых СР, как ЛПЭ

124

с двумя, Кр и континуум решений, нелинейные и много­ слойные СР из ЛПЭ. Варианты характеристик входного сигнала представлены случаями двух, К и континуума клас­ сов образов при произвольной квалификации учителя.

Целью анализа разомкнутых СР является вывод и ис­ следование выражений для распределений и моментов рас­ пределений промежуточных и выходных сигналов СР. В данной главе в основном производится анализ распреде­ лений и моментов распределений ошибок СР. На основании результатов анализа разомкнутых СР выбираются функ­ ционалы вторичной оптимизации.

Под функционалом вторичной оптимизации понимается функционал, выражаемый через параметры распределений текущих сигналов и ошибок СР и непосредственно миними­ зируемый в многослойных СР при настройке по замкнутому циклу. При этом основной является задача формирования функционала вторичной оптимизации, соответствующего заданному критерию первичной оптимизации; соответствие понимается в смысле совпадения параметров СР при обес­ печении минимума функционалов первичной и вторичной оптимизации.

Преобразование, осуществляемое разомкнутым ЛПЭ с двумя решениями, может быть представлено в следующем виде:

Ч (п) =

N

од, (л) =

sign g (я).

(5-1)

sign 2

 

1= 0

 

 

 

Выражения для аналоговой и дискретной ошибок ЛПЭ

имеют вид:

 

 

 

 

 

ха (п) = г(п) —g(n); xg(л) = е (я)—хк(л).

(5-2)

Функция распределения входного сигнала при К = 2

равна (см. гл. 1):

A-iti (х)+44

(*) прие=1’

 

44

 

/(*. е) =

 

+ 4

 

( х ) при е = — 1 .

 

4

л 1/ 1 ( х )

в 2/ 2

 

4

 

4

 

 

 

Здесь

 

 

 

 

 

= [2 + (с2—Cj) —bi (Ci + с2)] Pi,

 

А %= [2 -f- (ся —Ci) -f- b2(ca-f- Cj)] p2;

 

Bi = [2 -(- (c2Ci)

bi (d -(- c2)] Pi,

 

B2 = [2 + (ся —Ci)b2(ci-\- c2)} p2.

125

Распределение аналоговой ошибки рассматриваемой СР имеет вид:

 

 

N — 1

 

 

 

 

 

 

 

 

 

М * ) =

1

 

 

A J J x ! , . . . , Xft—j , 1 Я(»

 

4а,

 

 

 

 

 

 

 

 

 

 

N—1

\

 

 

 

 

 

 

 

1-f a„— xa

 

 

 

+

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

> Xh/-1>

 

i£=i

/

 

 

 

 

 

 

 

JV

 

 

 

 

 

 

 

 

 

 

Л1-1

 

 

 

 

 

 

 

 

 

1+ a0 —

 

 

"a7. l+ BiM *i’

■•

> **-1.

 

i=i

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N — 1

 

 

 

 

 

 

 

 

— 1 + aо — xa

 

 

i Xl a

)“1 ^2^2(Л'1’

• •

> Л'лг-1’

 

i=l

 

 

 

N - \

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

- Л

 

 

 

dxN_ v . .

dxv

(5-3)

 

 

 

 

 

 

 

 

 

 

 

 

 

i—\

 

 

 

 

 

 

 

 

 

а дискретной ошибки

 

 

 

 

 

 

 

 

 

 

~

[В]. (1 — (Dj) +

5 а (1 — Ф2)!

 

 

 

4

 

при xg= — 2,

 

 

 

 

 

 

 

 

 

fxe (xg)~

~ [ A i ( 1

Ф*)~ЬЗ1Ф1 -f- Л2 (1— Ф2) 4~

(5-4)

 

 

 

 

+

З 2Ф2]

ПРИ хг О,

 

 

 

 

1Ф1 + Л 2Ф2]

при

xg = 2.

 

Здесь

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

l N — 1

 

 

 

JV—1

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

|

 

 

|

 

fk (-^1»

• • ■> % ) 6^1

 

 

— DO

 

Л1-1

 

 

 

 

 

 

 

 

 

I».

 

V I

ai

 

 

 

 

 

 

 

 

7N

- V

UN

 

 

 

 

 

 

 

 

 

1=1

 

 

 

 

 

 

 

 

 

 

. . . dxN,

k = \ ,

2.

 

 

126

Выражения для моментов г-го порядка распределения аналоговой и дискретной ошибок рассматриваемой СР можно представить в виде

а.

= _!_ у

(. ■1)2г+тС

N

а(.

 

V

 

'

4

 

 

 

 

 

Х {[^I (ао+ 1)Г m+ 5 i(ao—

( 1)

+

У]

+

[ 'М а0 + 1Г m +

^2 (а0— 1 )Г "lj

. \ ; (5-5)

•ml

 

 

N

 

 

 

 

 

 

ои

 

 

 

 

 

С

j ■•

• J 4

• • •

xi J k w

dx'

arg = 2Г- 2 [(Л,Фх +

А2Ф2) + ( - 1 ) г(В1+

В2

 

 

— В 1Ф 1- В г Ф 2)1

 

(5-6)

В частном случае при с1 = с2 '= 1 и br = b2 = Ь рас­ пределение аналоговой ошибки рассматриваемой СР имеет вид (5-3) с заменой

Лх = 2 (1 — Ь ) p i ,

Л8 = 2(1 + 6 )р 2;

Bl = 2{\ + b)Pl\

В2 — 2( \ Ь) р2.

Распределение дискретной ошибки:

■ Y (Pi (1 + Ь ) (1- Ф 0 + р2 (1 - 6 ) (1 Ф.2)], xg= - 2 ; .

^-[1 + 6 ( р 2— Pi) + 2/?i60i — 2р2М>2], хй = 0;

- i - [ ( l — 6 ) p 1O i + ( l + b) р2ф 2], x g = 2.

Выражение для моментов распределения дискретной ошибки СР в данном случае имеет следующий вид:

а ,й = 2{р1[1 + 6 (1 - 2 Ф 1)] + р2[ 1 - М 1 - 2 Ф 2)]},

и отдельно для совокупностей образов первого и второго класса:

a ,le = 2 [Pl (1 + b) (1 - Ф г) + р2(1

- Ь) (1 - Ф 2)];

аг2я= 2 [Pl (1 - 6) Фх -1 р2 (1

-I- Ь) Ф2].

127

Преобразование, осуществляемое разомкнутым

ЛПЭ

с континуумом решений в режиме обучения, может

быть

представлено в следующем виде:

N

 

= F[g (л)].

xk (п) = F V CLX;

1—0

1 1

 

В случае континуума классов образов на входе СР

/(х, е) = /' (хъ . . . , xN/e)fe(n).

Совместное распределение сигнала е (п) и аналогового выходного сигнала g (п) имеет следующий вид:

N —1

/gE(£. е) = ~

Р

g + До

N —1’

°N. '

N

 

 

- 2 *<’^

/ eV e(e)d*jv- 1 ■■■ d X r

 

Распределение аналоговой ошибки СР

N — 1

00 -

Отсюда можно получить выражение для момента г-го порядка аналоговой ошибки в следующем виде­

ла

N

у

■>j ailJi + е +

а 0 ] х

£--■1

 

х Г (у/е) /е (е) dyde.

(5 -7 )

Распределение дискретной ошибки СР

N

 

aN I • • 1 I ^ ( Xi’ ’ ' • ’ X N - 1>

F 1(e — *g) + a„

йЛ£

 

128

dF 1(s — x g)

X

d (s — xg)

X dxN-1 . . dx^e.

(5-7a)

Отсюда

 

лг+i

 

N

 

2 a iVi a 0 + e

X

i=l

 

X f ( y / E ) f e ( e) dyde.

(5-8)

В частном случае при обучении распознаванию двух

классов образов

N — 1

 

 

00

 

 

1

 

 

 

 

d F

\ —

\ — X g)

 

 

 

 

d( — 1 — xg)

|

 

 

 

 

 

 

N - \

 

 

X / , [

F

1( — 1— xg) + a0

 

 

 

. . . ,XN _ ^ ,

 

 

-

2 1 4

*

 

 

aN

 

 

 

N —1

 

 

 

 

 

 

 

00

 

(1 — xg)

 

 

X d

x ^ . . . <&, + -£*- j . . .

J*

 

X

d (1 —Xg)

 

 

 

 

 

 

 

 

X f2 ( x y, . . . ,

F

1(* — Xg) -f- a0

 

 

 

* д , _ ! ,

 

N

 

 

 

 

N —1

 

 

 

 

 

 

 

 

 

 

 

 

 

/ i^i

j JV}^XN—1 ' ' •

^Xl’

 

 

(5-8a)

 

 

 

 

 

i=l

 

 

 

 

 

 

 

N

 

 

 

 

 

 

a rg ~ P i \ • • •

■F \ 2 У Л — а0 ] — 1

X

 

 

-oo

i=1

 

 

 

 

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

x f i ( y ) d y + p 2 . .

N

 

 

 

/2 (y) dy

—^ ( 2

 

ao] + 1

 

 

 

 

 

 

 

(5-9)

5 З а к а з № 975

129

Соседние файлы в папке книги из ГПНТБ