![](/user_photo/_userpic.png)
книги из ГПНТБ / Галушкин, А. И. Синтез многослойных систем распознавания образов
.pdfОбратная постановка задачи синтеза является практи чески менее пригодной, нежели прямая, так как задание ограничения на количество входных каналов в СР физи чески более оправдано, нежели несколько расплывчатое ограничение на число областей.
Пример 1. Покажем, что структура многослойной СР, оптималь ная по верхней оценке количества областей с ограничением на число элементов, будет в одномерном случае оптимальна по верхней оценке с ограничением по суммарному числу входов. Согласно ме тоду множителей Лагранжа и (4-31) при N = 1 оптимальные иЯц? являются решениями следующей системы уравнений:
w |
г |
w |
Я |
:0, |
h = l , |
. . . , W\ |
П (Я /+ |
1) + >. |
1+ 2 |
||||
i=i |
L |
/= I |
|
|
|
|
/*/. |
/ w |
\ 2 |
|
|
(4-33) |
|
w |
I |
|
|
|
||
Й я'+т (£ |
') - T g |
|
|
|||
Здесь |
%— множитель Лагранжа. |
|
||||
Решением (4-33) являются: |
|
|
|
|||
|
|
J / / = |
1. / = |
I...........W; |
(4-34) |
|
|
|
|
K = ------------ . |
|||
|
|
|
|
|||
|
|
|
|
W |
|
|
Здесь |
W — число слоев — есть |
целая |
часть положительного |
|||
корня уравнения |
|
V |
0. |
|
|
|
W2-(- W -----= |
|
|
Из (4-34) и следует исходное утверждение.
Пример 2. Рассмотрим синтез СР с учетом (4-32), где определяется выражением (4-17). Отметим, что при перенесении
ЛПЭ из /-го слоя в / — /2-слой |
уменьшение числа входов элемента |
|
для СР с полными перекрестными связями будет равно: |
|
|
Д у ~ = |
' у Я д, |
(4-35) |
|
/>=/-! |
|
а суммарное увеличение числа входов остальных элементов сети
будет |
равно: |
|
/—/i+1 |
|
|
|
|
|
(4'36) |
||
|
|
|
Ду+= 2 |
Яд. |
|
|
|
|
h=i |
|
|
Из |
(4-35), |
(4-36) следует, что при перенесении ЛПЭ из /-го |
|||
в / —/ 2-й слой |
число входных каналов в многослойной СР будет |
||||
уменьшаться, |
если |
|
|
|
|
|
|
2* |
"/ . >* £ +Ч . |
ИЛИ Hi - h > Hr |
(4-37) |
|
|
/.=/—1 |
/|=/ |
|
|
120
Из (4-28) и (4-29) следует, что условиям оптимальности (4-32) отвечают две структуры с суммарным числом ЛПЭ в сети Н = = [log2 'F], где квадратные скобки означают округление до ближай шего целого в сторону увеличения:
|
Нх = А; Я /= N, j = 2, |
|
, Г ; |
|||
Hj = N; Hw = |
A, |
j = |
1, . . . , W — 1. |
|||
Здесь A — остаток от деления Н на |
N; |
|||||
F = |
Н — А |
где |
, |
1 |
0 |
при А = О |
-------------б, |
о = |
1 |
при А Ф 0 . |
|||
|
N |
|
|
| |
Обеим этим структурам отвечает одинаковое число входов, определяемое (4-30).
Рассмотрим оптимизацию структуры СР, оптимальной по длине связей.
Припишем каждой связи, идущей из Д-го в /-й слой, не который вес U. .. Физическим смыслом такого веса наряду
с длиной в обычном понимании может быть, например, ве личина, обратная помехозащищенности. Через Uoj обозна чим длину связей входного вектора с /-м слоем.
Тогда суммарная длина .связей ЛПЭ в /-м слое будет:
/ - 1 |
(4-38) |
v r H, u °iN + 2 " Л / |
|
/.=1 |
|
Суммарная длина связей в W-слойной сети будет, оче видно, равна:
" / K * + : s 4 a / V
У=1 \ /i=i
Аналогично (4-32) запишем:
4rw m = nlfx |
max |
™ "i |
. . • г* w |
V > I , H l [ u w N + ,^ H i Ul .
|
/= i |
V |
Vw |
|
w |
™}п ц m in0 |
2 |
|
|
«г н г . . Hw /=1 |
/,= i
/ - 1
Hi U 0iN + 2 H L U U
/i=i
V,N I W ] > 4 .
<4-39)
(4-40)
(4-41)
В (4-40) и (4-41) ¥ , как и ранее, определяются выраже нием (4-17) или (4-18) в зависимости от вида оценки. От-
121
метим, что при U. , = |
1 |
(]\ = |
0, |
1, . . . , |
W— 1; |
/ = |
1, . . . |
•V |
(4-39) совпадает с |
(4-30), |
а |
(4-40) и |
|||
. . . , W) выражение |
|||||||
(4-41) соответственно |
с |
(4-31) |
и |
(4-32). |
|
|
|
Естественно теперь рассмотреть наиболее общие огра ничения на структуру СР, включающие в себя как частные случаи все остальные вышеперечисленные ограничения. С этой целью назначим цену одного ЛПЭ |3Н, цену одного
входа ра и цену единицы длины связи р„. Тогда на основа нии (4-30) и (4-39) суммарная стоимость запишется следую щим образом:
S w — Ря |
W |
2 |
|
|
/'.=1 |
- v |
9 |
Я 2 |
|
— |
/1 |
Н= 1
+ ft, N
W
/-!=/
W |
, |
/ |
W |
|
V |
Я. + — V |
Я. |
I' |
|
~ |
/. 1 о |
|
л |
|
/.=/ |
Z |
\/,=1 |
|
|
Я .Я 0/.Я + |
/ - 1 |
я . я . . . (4-42) |
||
у |
||||
|
|
— |
Ь |
1,1 |
|
/.=1 |
|
|
Аналогично (4-31) и (4-32) сформулируем задачи синтеза многослойной СР с ограничением по стоимости S ^ в сле дующем виде:
r N{W] = max |
max |
WN[W]- |
|
|||
|
W |
n^—rtyp |
|
(4-43) |
||
|
|
s> V- |
|
|
||
|
|
|
|
|
||
S* |
= min |
min |
S |
; |
|
|
v |
v |
|
|
|
|
(4-44) |
|
4' |
|
> 4r. |
|
||
|
|
|
|
|||
|
|
Я [W7] ^ |
• |
|
|
|
В выражениях (4-43) и |
(4-44) |
S r |
определяется |
выра |
||
жением (4-42), а |
|
— выражениями (4-17) и |
(4-18) |
|||
в зависимости от вида оценки. |
|
|
РнРа |
|||
Отметим, что вариацией коэффициентов стоимости |
и Ри в выражениях (4-43) и (4-44) могут быть получены все
рассмотренные выше формулировки задач синтеза струк туры СР.
4-8. Оптимизация структуры многослойных СР
сК р решениями
Вданном случае многослойная СР с полными перекрестными связями составлена из элементов, описываемых соотношением (4-2).
Каждый такой элемент реализует в своем пространстве признаков совокупность параллельных разделяющих гиперплоскостей. Оче видно, что максимальное число областей, выделяемых в исходном
122
пространстве признаков эквивалентной разделяющей поверхностью, в данном случае не превышает Кр, где Н — число ЛПЭ в сети.
Эта оценка достигается только для многослойных СР с полными перекрестными связями.
Оценим количество областей, на которое пространство призна ков размерности N может быть разбито Я х группами гиперплоско стей по (Кр — 1)-й гиперплоскости в каждой группе. Обозначим
максимальное количество |
областей, выделяемых [Н1— 1 ]-й |
груп |
|||||
пой через Ч' |
Р |
. Тогда аналогично (§ 4-6) можно показать, |
что |
||||
|
N [ п — 1] |
_TjfKP |
|
|
|
||
|
|
Ш К Р |
|
|
|
||
|
|
N [ Я , ] ~ |
я [ Я .- 1 'J + Z. |
|
|
||
Оценим |
величину z. |
При |
проведении |
каждой |
из (Кр — 1)-й |
||
гиперплоскостей |
количество выделяемых |
областей |
увеличивается |
на число областей, образуемых на гиперплоскости линиями ее пере сечения с остальными гиперплоскостями пространства, т. е. на
шк р
Т Я — 1 [ Я ,— 1]-
Отсюда
z = [ /^p _ i ] ^ L 1
и окончательно |
|
|
|
|
|
|
^ ][Ря ,]= |
^ W |
. ] + F p - 4 ^ |
1 |
[Я,-.] |
(4-45) |
|
с начальными |
условиями |
|
|
|
|
|
K |
pl1] = |
< |
Ря,] = |
1 )+ |
'• |
(4‘46) |
Исходя из (4-45) |
и (4-46) доказывается следующее: |
|
||||
|
т ^ Р[Я1] = ^ р 1 ПРИ |
|
|
(4-47) |
||
|
^ |
P№ ]< |
"Рч Hi > N- |
|
|
|
Рассмотрим |
hj-й ЛПЭ с Кр решениями, |
расположенный |
в /'-м |
слое многослойной СР с полными перекрестными связями. Входные
сигналы hj-то ЛПЭ могут быть разбиты на две группы: х = |
[х1г . . . |
. . . , лсдг ] — вектор входных сигналов и у = (ух, . . . . |
уК) — |
вектор-строка выходных и промежуточных сигналов (/ — 1) -слой- ной СР. Пусть (/ — 1)-слойная СР выделяет в исходном простран-
стве признаков |
_jj |
областей. Тогда по каналу у на входы hj-го |
ЛПЭ может поступить |
различных вариантов вектора у. |
Уравнение для выходного сигнала hj-го ЛПЭ с Кр решениями может быть записано в следующем виде:
Ah и A hx — векторы весовых коэффициентов соответственно для х и у.
123
Геометрически, как следует из (4-48), каждый из Hj ЛПЭ с Кр решениями реализует в пространстве входных сигналов CP (/С —
— 1) ЧгдГР|у_цпараллельных гиперплоскостей. Допуская, что сущест
вует метод настройки коэффициентов СР, при котором для каждого hj-го ЛПЭ каждые (Кр — 1) гиперплоскостей, порожденных вариан том вектора у, проходят через область исходного пространства признаков, соответствующую ему, запишем выражение для верхней оценки числа областей, на которое пространство X разбивается рассматриваемой /-слойной СР:
|
ш^р |
_ |
\ц^р |
(4-49) |
|
* N ГЛ — |
[i - lV NH: |
|
|
Здесь |
определяется |
выражениями (4-45) и (4-46). |
Если |
считать (4-49) рекуррентным выражением и вспомнить, что первый
слой ЛПЭ с Кр решениями разбивает пространство X на Y ^ |
об |
||
ластей, то (4-49) перепишется в следующем виде: |
|
||
YKp |
П YKP |
(4-50) |
|
NU] |
til |
NHi |
|
Выражение (4-50) позволяет поставить и решить задачу син теза структуры СР, оптимальной по верхней оценке количества
областей при ограничении на суммарное число |
Н ЛПЭ в СР. Из |
||||
(4-50) и (4-47) |
следует, |
что в U^-слойной СР |
|
||
|
|
|
w |
|
|
|
|
|
S " / |
|
|
^ |
V |
] = |
< ‘ |
при Hj < N; |
|
|
|
w |
|
|
(4-51) |
¥ w V ] |
< |
1 |
при |
Hi > N ( / = 1, • ■ • |
- w )- |
Следовательно, оптимальной по верхней оценке числа областей будет СР с полными перекрестными связями такая, что число ЛПЭ с Кр решениями в любом ее слое не превышает размерности исход ного пространства признаков.
Г л а в а п я т а я
АНАЛИЗ РАЗОМКНУТЫХ СР
5-1. Законы распределения аналоговой и дискретной ошибок СР
Исходным материалом для анализа разомкнутых СР являются заданная в общем виде плотность распределения входного сигнала и структура разомкнутой СР. Рассмат риваются такие структуры разомкнутых СР, как ЛПЭ
124
с двумя, Кр и континуум решений, нелинейные и много слойные СР из ЛПЭ. Варианты характеристик входного сигнала представлены случаями двух, К и континуума клас сов образов при произвольной квалификации учителя.
Целью анализа разомкнутых СР является вывод и ис следование выражений для распределений и моментов рас пределений промежуточных и выходных сигналов СР. В данной главе в основном производится анализ распреде лений и моментов распределений ошибок СР. На основании результатов анализа разомкнутых СР выбираются функ ционалы вторичной оптимизации.
Под функционалом вторичной оптимизации понимается функционал, выражаемый через параметры распределений текущих сигналов и ошибок СР и непосредственно миними зируемый в многослойных СР при настройке по замкнутому циклу. При этом основной является задача формирования функционала вторичной оптимизации, соответствующего заданному критерию первичной оптимизации; соответствие понимается в смысле совпадения параметров СР при обес печении минимума функционалов первичной и вторичной оптимизации.
Преобразование, осуществляемое разомкнутым ЛПЭ с двумя решениями, может быть представлено в следующем виде:
Ч (п) = |
N |
од, (л) = |
sign g (я). |
(5-1) |
|
sign 2 |
|||||
|
1= 0 |
|
|
|
|
Выражения для аналоговой и дискретной ошибок ЛПЭ |
|||||
имеют вид: |
|
|
|
|
|
ха (п) = г(п) —g(n); xg(л) = е (я)—хк(л). |
(5-2) |
||||
Функция распределения входного сигнала при К = 2 |
|||||
равна (см. гл. 1): |
A-iti (х)+44 |
(*) прие=1’ |
|
||
44 |
|
||||
/(*. е) = |
|
+ 4 |
|
( х ) при е = — 1 . |
|
4 |
л 1/ 1 ( х ) |
в 2/ 2 |
|
||
4 |
|
4 |
|
|
|
Здесь |
|
|
|
|
|
= [2 + (с2—Cj) —bi (Ci + с2)] Pi, |
|
||||
А %= [2 -f- (ся —Ci) -f- b2(ca-f- Cj)] p2; |
|
||||
Bi = [2 -(- (c2—Ci) |
bi (d -(- c2)] Pi, |
|
B2 = [2 + (ся —Ci) — b2(ci-\- c2)} p2.
125
Распределение аналоговой ошибки рассматриваемой СР имеет вид:
|
|
N — 1 |
|
|
|
|
|
|
|
|
|
М * ) = |
1 |
|
|
A J J x ! , . . . , Xft—j , 1 Я(» |
|
||||||
4а, |
|
|
|
|
|
|
|
|
|
|
|
N—1 |
\ |
|
|
|
|
|
|
|
1-f a„— xa |
|
|
|
|
+ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
> Xh/-1> |
|
|||
i£=i |
/ |
|
|
|
|
|
|
|
JV |
|
|
|
|
|
|
|
|
|
|
|
|||
Л1-1 |
|
|
|
|
|
|
|
|
|
1+ a0 — |
|
|
"a7. l+ BiM *i’ |
■• |
• |
> **-1. |
|
||||||
i=i |
N |
|
|||||||||
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
N — 1 |
|
|
|
|
|
|
|
|
— 1 + aо — xa |
|
|
|
i Xl a |
)“1 ^2^2(Л'1’ |
• • |
• |
> Л'лг-1’ |
|
|||||
i=l |
|
|
|||||||||
|
N - \ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
- Л |
|
|
|
dxN_ v . . |
dxv |
(5-3) |
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i—\ |
|
|
|
|
|
|
|
|
|
а дискретной ошибки |
|
|
|
|
|
|
|
|
|||
|
|
~ |
[В]. (1 — (Dj) + |
5 а (1 — Ф2)! |
|
||||||
|
|
4 |
|
при xg= — 2, |
|
|
|||||
|
|
|
|
|
|
|
|||||
fxe (xg)~ |
~ [ A i ( 1 |
Ф*)~ЬЗ1Ф1 -f- Л2 (1— Ф2) 4~ |
(5-4) |
||||||||
|
|
|
|
+ |
З 2Ф2] |
ПРИ хг —О, |
|
||||
|
|
|
[Л1Ф1 + Л 2Ф2] |
при |
xg = 2. |
|
|||||
Здесь |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
l N — 1 |
|
|
|
JV—1 |
|
|
|
N |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| |
‘ |
|
|
| |
|
fk (-^1» |
• • ■> % ) 6^1 |
|
|||
|
— DO |
|
Л1-1 |
|
|
|
|
|
|
|
|
|
|
I». |
|
V I |
ai |
|
|
|
|
|
|
|
|
7N |
- V |
UN |
|
|
|
|
|
||
|
|
|
|
1=1 |
|
|
|
|
|
|
|
|
|
|
. . . dxN, |
k = \ , |
2. |
|
|
126
Выражения для моментов г-го порядка распределения аналоговой и дискретной ошибок рассматриваемой СР можно представить в виде
а. |
= _!_ у |
(. ■1)2г+тС |
N |
а(. |
|
|
V |
|
|||||
' |
4 |
|
|
|
|
|
Х {[^I (ао+ 1)Г m+ 5 i(ao— |
( 1) |
+ |
||||
У] |
||||||
+ |
[ 'М а0 + 1Г m + |
^2 (а0— 1 )Г "lj |
. \ ; (5-5) |
|||
•ml |
||||||
|
|
N |
|
|
|
|
|
|
ои |
|
|
|
|
|
С |
j ■• |
• J 4 |
• • • |
xi J k w |
dx' |
arg = 2Г- 2 [(Л,Фх + |
А2Ф2) + ( - 1 ) г(В1+ |
В2 |
||||
|
|
— В 1Ф 1- В г Ф 2)1 |
|
(5-6) |
В частном случае при с1 = с2 '= 1 и br = b2 = Ь рас пределение аналоговой ошибки рассматриваемой СР имеет вид (5-3) с заменой
Лх = 2 (1 — Ь ) p i , |
Л8 = 2(1 + 6 )р 2; |
Bl = 2{\ + b)Pl\ |
В2 — 2( \ — Ь) р2. |
Распределение дискретной ошибки:
■ Y (Pi (1 + Ь ) (1- Ф 0 + р2 (1 - 6 ) (1 — Ф.2)], xg= - 2 ; .
^-[1 + 6 ( р 2— Pi) + 2/?i60i — 2р2М>2], хй = 0;
- i - [ ( l — 6 ) p 1O i + ( l + b) р2ф 2], x g = 2.
Выражение для моментов распределения дискретной ошибки СР в данном случае имеет следующий вид:
а ,й = 2{р1[1 + 6 (1 - 2 Ф 1)] + р2[ 1 - М 1 - 2 Ф 2)]},
и отдельно для совокупностей образов первого и второго класса:
a ,le = 2 [Pl (1 + b) (1 - Ф г) + р2(1 |
- Ь) (1 - Ф 2)]; |
аг2я= 2 [Pl (1 - 6) Фх -1 р2 (1 |
-I- Ь) Ф2]. |
127
Преобразование, осуществляемое разомкнутым |
ЛПЭ |
с континуумом решений в режиме обучения, может |
быть |
представлено в следующем виде:
N |
|
= F[g (л)]. |
xk (п) = F V CLX; |
||
1—0 |
1 1 |
|
В случае континуума классов образов на входе СР
/(х, е) = /' (хъ . . . , xN/e)fe(n).
Совместное распределение сигнала е (п) и аналогового выходного сигнала g (п) имеет следующий вид:
N —1
/gE(£. е) = ~ |
Р |
g + До |
|
N —1’ |
°N. ' |
||
N |
|
|
|
- 2 *<’^ |
/ eV e(e)d*jv- 1 ■■■ d X r |
|
Распределение аналоговой ошибки СР
N — 1
00 -
Отсюда можно получить выражение для момента г-го порядка аналоговой ошибки в следующем виде
ла
N |
у |
■>j ailJi + е + |
а 0 ] х |
£--■1 |
|
х Г (у/е) /е (е) dyde. |
(5 -7 ) |
Распределение дискретной ошибки СР
N |
|
|
aN I • • 1 I ^ ( Xi’ ’ ' • ’ X N - 1> |
F 1(e — *g) + a„ |
|
йЛ£ |
||
|
128
dF 1(s — x g)
X
d (s — xg)
X dxN-1 . . dx^e. |
(5-7a) |
Отсюда |
|
лг+i |
|
N |
|
2 a iVi —a 0 + e |
X |
i=l |
|
X f ( y / E ) f e ( e) dyde. |
(5-8) |
В частном случае при обучении распознаванию двух
классов образов
N — 1
|
|
00 |
|
|
1 |
|
|
|
|
d F |
\ — |
\ — X g) |
|
|
|
|
|
d( — 1 — xg) |
| |
|
|
||
|
|
|
|
N - \ |
|
|
|
X / , [ |
F |
1( — 1— xg) + a0 |
|
|
|
||
. . . ,XN _ ^ , |
|
|
- |
2 1 4 |
* |
||
|
|
aN |
|
||||
|
|
N —1 |
|
|
|
|
|
|
|
00 |
|
(1 — xg) |
|
|
|
X d |
x ^ . . . <&, + -£*- j . . . |
J* |
|
X |
|||
d (1 —Xg) |
|
||||||
|
|
|
|
|
|
||
|
X f2 ( x y, . . . , |
F |
1(* — Xg) -f- a0 |
|
|
||
|
* д , _ ! , |
|
N |
|
|
|
|
|
N —1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
/ i^i |
j JV}^XN—1 ' ' • |
^Xl’ |
|
|
(5-8a) |
|
|
|
|
|
||||
|
i=l |
|
|
|
|
|
|
|
N |
|
|
|
|
|
|
a rg ~ P i \ • • • |
■F \ 2 У Л — а0 ] — 1 |
X |
|
||||
|
-oo |
i=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
N |
|
|
|
|
|
|
x f i ( y ) d y + p 2 . . |
N |
|
|
|
/2 (y) dy |
||
—^ ( 2 |
|
ao] + 1 |
|||||
|
|
|
|
|
|
|
(5-9) |
5 З а к а з № 975 |
129 |