
книги из ГПНТБ / Галушкин, А. И. Синтез многослойных систем распознавания образов
.pdfж) Двухслойная СР с обратными связями (рис. 4-17, в)\
xk (п) -■ F [g («)]; g (п) = 2 ару (п) + akxk («— 1); /=о
Xki (И) = F Igy («)]; |
N |
|
gj (n) = V a,,*, (n) + |
|
|
|
о |
|
|- akixk (n — |
1) -1- akjxkj {n— 1). |
(4-11) |
В принципе возможно рассмотрение многослойных СР произвольной заданной структуры с обратными и пере крестными связями. Объективная необходимость введения перекрестных связей в многослойных СР отмечается и обо сновывается в следующем параграфе, а обратных связей— в гл. 8 при исследовании замкнутых СР нестационарных образов.
4-6. Оптимизация структуры многослойных СР с перекрестными связями
Вопрос выбора структуры разомкнутой многослойной СР является сложным. Структура разомкнутой СР может задаваться либо априори, либо исходя из соображений, высказанных выше при рассмотрении двухслойной и трех слойной СР, либо исходя из ограничений технического характера. Ниже рассматривается возможность выбора структуры (числа слоев и числа ЛПЭ в слое) многослойных СР с перекрестными связями, состоящих из ЛПЭ с двумя решениями.
Необходимо остановиться на критерии сложности задачи распознавания решаемой многослойной СР. При использо вании детерминированной модели СР таким критерием мо жет служить количество эталонных образов, заключаемых в замкнутые области гиперплоскостями, реализуемыми ЛПЭ первого слоя в исходном пространстве признаков. При рассмотрении вероятностной модели СР каждому эта лонному образу соответствует мода функции распределе ния вероятностей совокупности образов на входе СР. При этом в каждой области исходного пространства признаков многослойная СР выделяет уже не эталонный образ, а не которое компактное множество образов. При многомодаль ных распределениях совокупностей образов на входе СР эти компактные множества могут характеризоваться об ластями в многомерном пространстве признаков, образо-
110
ванными линиями равных значений плотности распреде лений (на определенном уровне). Число и сложность дан ных областей совместно характеризуют сложность решае мой задачи. При этом детерминированная модель СР может рассматриваться как частный случай вероятностной и реа лизует, по сути дела, систему памяти для конечного числа многомерных векторов. Принимая в данном параграфе за критерий качества многослойной СР число областей, реализуемых подобной СР в исходном пространстве при знаков, необходим отметить, что качество многослойной
Рис. 4-18. Двухслойная СР с перекрестной связью, одномерный вариант.
СР с последовательными связями, рассмотренной выше, монотонно возрастает при увеличении числа слоев и числа элементов в каждом слое. Поэтому в подобной СР задача оптимизации структуры (минимизация числа ЛПЭ и числа слоев) может быть поставлена только либо в плане ликви дации избыточности числа ЛПЭ, либо при наличии ограни чений на число ЛПЭ.
Основное внимание ниже уделяется многослойным СР с полными перекрестными связями, когда множество при знаков каждого слоя состоит из признаков исходного про странства и выходных сигналов первого, второго и (/—1)-го слоя. Для подобной СР задача оптимизации структуры, в частности выбора числа слоев и числа ЛПЭ в каждом слое при ограничении на общее число ЛПЭ в сети, является актуальной.
Рассмотрим на простейшем примере одномерного варианта, когда N = 1 (одни признак х), принцип действия перекрестной связи. Структурная схема рассматриваемой двумерной СР представ лена на рис. 4-18. Разделяющая поверхность, реализуемая подоб
111
ной |
СР при отсутствии |
перекрестной связи, представлена на |
рис. |
4-19. В областях /, |
//, III аналоговый выходной сигнал CP g |
при включенной перекрестной связи представляется следующим образом:
£l = «0 + апХ~ а1 - аГ
gll = а0+ апХ+ а1 ~ аГ em = ao + anx + ai + a2-
Каждую из областей I, II, III СР делит на две подобласти, где g > 0 и g < 0. Из условия равенства нулю gv gn , ^ следуют вы
ражения для дополнительных порогов при включении обратной
связи |
в пространстве |
X: |
|
|
|
|
|||
., |
ЩН" |
л |
|
а0 . .. |
Щ |
а0 _ |
— |
— ctn |
|
Л1 — |
|
|
> |
Х2-- |
~ |
> |
Хд-- ------- ----------- . |
||
■'-—О' |
|
— |
X |
|
Рис. 4-19. К принципу дей |
||||
|
|
|
ствия |
перекрестной |
связи |
||||
I |
°-т |
|
Л |
а 02 Ш |
|
в многослойных СР. |
Таким образом, рассматриваемая СР (рис. 4-18) реализует максимально пять порогов, делящих ось х на шесть областей. В этом случае СР, изображенная на рис. 4-18, эквивалентна (по критерию максимума количества областей, реализуемых кусочно-линейной разделяющей поверхностью в исходном пространстве признаков) многослойной СР с последовательными связями с пятью ЛПЭ в пер вом слое, т. е. СР с перекрестными связями реализуется значительно проще, чем СР с последовательными связями.
В процессе анализа многослойной СР необходимо знать максимальное число областей, на которое пространство признаков размерности N может быть разбито Н 1 гипер плоскостями. Согласно результату, полученному в [Л. 19],
максимальное количество |
областей |
¥ NH |
определяется по |
|||||
следующей рекуррентной формуле: |
|
|
|
|
||||
¥ |
— ¥ |
|
4 - ¥ |
N- 1, |
Н,—1 |
(4-12) |
||
N H , |
N , H , - - Р |
т |
|
|||||
или в нерекуррентном виде |
|
|
|
|
|
|
||
T „Hl = C" _ |
, + 2 v 'c ; ( _ r |
|
(4-13) |
|||||
Здесь имеется в виду, |
что |
1--0 |
|
|
|
|||
|
|
|
|
|
||||
|
С] = 0 |
при /-<s. |
|
|
|
|||
Отметим, что из (4-12) следует: |
|
|
|
|
||||
WNH, = |
2" ‘ |
ПРИ Я , < |
N |
|
(4-14) |
|||
^ |
я < 2 |
Я‘ |
при |
H{ > N. |
. |
(4-15) |
112
Вывод верхней и нижней оценки количества областей
Рассмотрим многомерный вариант (г -- 1, . . . , N) СР, структура которой представлена на рис. 4-20. Обозначим количество областей, на которое разбивает исходное про странство признаков (у—1)-слойная СР через f где
через [/—1] обозначено условно эквивалентное количество гиперплоскостей, реализуемых многослойной сетью с пол
ными |
перекрестными связями |
и с |
(у— 1)-м слоем. Данная |
|||||||||
сеть |
содержит |
L. |
|
/'-1 |
|
|
где через Н обозначено |
|||||
|
- - V |
Н . ЛПЭ, |
||||||||||
|
|
|
|
|
|
г=1 |
|
|
|
|
|
|
количество ЛПЭ в i-м слоеСР. |
|
|
|
|
||||||||
Как |
следует |
из |
структурной |
|
|
|
|
|||||
схемы, входные каналы каж |
|
|
|
|
||||||||
дого h,-го ЛПЭ у-го слоя (hj —- |
|
|
|
|
||||||||
= |
1.......... Hj) могут быть раз |
|
|
|
|
|
||||||
делены на два множества. |
|
|
|
|
||||||||
Первое множество составляют |
|
|
|
|
||||||||
входные |
сигналы |
СР, |
вто |
Рис. 4-20. |
К решению задачи |
|||||||
рое — выходные |
сигналы СР |
оптимизации структуры разом |
||||||||||
с |
1-го, |
2-го, |
. . . , |
(у—1)-го |
кнутой |
СР с полными после |
||||||
слоев. Тогда |
уравнение |
раз |
|
довательными связями. |
||||||||
деляющей поверхности, реа |
|
слое, |
имеет следующий |
|||||||||
лизуемой одним hj-м ЛПЭ |
в /-м |
|||||||||||
вид: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
аГлх“ |
а£;- |
аГ л ,/- 1 |
= |
0- |
|||
|
Здесь |
ah . — вектор |
настраиваемых |
весов входных сиг- |
||||||||
|
|
|
/ |
элементе |
(ЛПЭ) |
A.; ah2 — вектор настраи |
||||||
налов СР на |
ваемых весов входных и промежуточных сигналов (у—1)-
слойной сети элемента А.; а? — порог А.-элемента; х. . |
. — |
||
/ «у |
/ |
К» / |
I |
вектор выходных сигналов ЛПЭ (у—1)-го слоя.
Отсюда следует, что по отношению к исходному прост ранству признаков каждый из ЛПЭ в у-м слое реализует столько параллельных гиперплоскостей, сколько вариантов вектора xk ._t порождает (у—1)-слойная СР. Предполагая,
что существует метод настройки СР, при котором все ги перплоскости, порождаемые вектором в у'-м слое,
попадают в область исходного пространства признаков, соответствующую ему, запишем рекуррентную формулу для вычисления верхней оценки в виде
X^ N [/] = |
[ i - \ ] ^ N H j • |
(4 - 1 6 ) |
113
Это следует из того, что каждая из Ч ^ ^ .^ областей выделяемая (/—1)-слойиой подсетью, разбивается на XVNII. областей. Здесь Ч *^. определяется рекуррентным выра
жением (4-12). Запишем теперь нерекуррентную формулу. Из (4-16), а также из того, что первый слой СР разбивает
пространство признаков на |
Ч ^ ^ областей, следует: |
|
WN [/] |
И V NH{' |
(4-17) |
|
1=1 |
|
Для вывода нижней оценки количества областей потре- |
||
буем от каждой из Ч*1 |
гиперплоскостей, |
порождае- |
N [ / - I ] |
|
|
мых hj-м ЛПЭ, выполнения условия более сильного, чем попадание в область, соответствующую вектору хА ._г
Именно потребуем, чтобы некоторое количество гиперпло скостей из 4*^ могли быть проведены через любую точку
исходного пространства изменением только свободного члена в уравнении гиперплоскости. Отметим, что в этом случае эти гиперплоскости, несомненно, могут попасть в любую область. Для оценки их количества составим си стему линейных уравнений относительно настраиваемых весов и порога элемента hx
|
0 . . . |
0 |
0 |
1 |
хг _ |
|
|
0 |
|
0 |
1 |
1 |
хг |
Ч'N [ / - 1 ] ' |
0 |
|
1 0 1 х т X |
|||
|
|
|
1 |
1 |
1 |
хг |
|
|
Ч- 1 |
|
|
|
|
|
а 1к/ 2 |
|
|
q i |
|
|
|
|
|
|
|
|
|
|
а '2Н-2 |
|
|
|
|
|
|
|
= |
|
|
|
(4-17а) |
ao - , v |
|
|
|
|
|
|
|
0 |
|
|
|
|
|
|
а/,. |
|
|
|
|
|
|
J |
|
|
|
|
|
_ |
av |
_ wL- |
|
|
1J |
|
114
Здесь q. [i — 1, . . . , |
— произвольно зада |
ваемые числа. Отметим, что |
количество чисел qh которые |
можно задать произвольно, не нарушая равенства (4-17а), есть искомое число гиперплоскостей из числа [;._j
которые могут быть проведены через любую точку исход ного пространства. Из (4-17) следует, что это число есть (Ls_j + 1), т. е. равно размерности вектора ah2 плюс еди
ница.
Отсюда следует рекуррентная формула для вычисления нижней оценки количества областей:
[/] = |
[/-1] ~ ' (^у-1 + 1 ) + (^/-1 + |
1 ) XVNHj • |
||
Здесь ¥ |
— |
—число областей, в которых не |
||
проводятся новые гиперплоскости; (L._j + |
1) XVNH,—число |
|||
новых областей, которое появляется после разбиения. |
||||
Окончательно |
|
|
|
|
[/]= |
[/-1] + |
(^/-1 + |
1) j^ N H j ~ ~ 1] ’ |
|
|
|
|
|
(4-18) |
|
L l = L i - i + |
H r |
|
Выражение (4-18) есть окончательный результат вывода. В одномерном случае (4-18) имеет следующий вид:
v . [ n = 4ri[/ - u+(L /-. + 1№ |
(4-19) |
L. = V 1+ tfy. |
|
Частная задача оптимизации
Можно сформулировать несколько задач оптимизации структуры многослойных СР с перекрестными связями.
1. Задано число слоев и число ЛПЭ многослойной СР. Найти распределение ЛПЭ по слоям, максимизирующее число областей ¥ , образованных кусочно-линейной разде ляющей поверхностью, реализуемой данной многослойной
СР в исходном пространстве признаков.
2. Задано общее число ЛПЭ сети. Найти число слоев и распределение ЛПЭ по слоям, максимизирующее ¥ .
3.Задано количество областей ¥ , которое должно быть реализовано сетью, и число слоев в ней. Найти структуру, минимизирующую количество элементов в сети.
4.Найти структуру (количество слоев и распределение
ЛПЭ по слоям) при заданном ¥ , минимизирующую коли
115
чество ЛПЭ в сети. Отметим, что оптимизация структуры по числу областей представляет частный критерий опти мальности СР. Рассмотрим синтез структуры одномерного варианта сети для указанных задач оптимизации.
1. Для заданного числа слоев CP |
W и числа ЛПЭ во |
|||
|
w |
Д/> найдем распределение элемен- |
||
всей сети Я, равного ^ |
||||
тов по слоям, |
/=1 |
|
|
|
максимизирующее VP1U7. Формально задача |
||||
ставится в виде соотношений, |
записанных с учетом (4-17) |
|||
и (4-12): |
w |
|
|
|
|
|
|
||
|
V |
H j ~ Я ; |
|
|
|
i=‘ |
|
(4-20) |
|
|
, |
|
w |
|
|
max |
|
||
|
= |
И (Я .+ 1). |
||
|
1[W] ' Н. |
н w i 1 |
|
|
Метод множителей Лагранжа дает решение в виде си |
||||
стемы уравнений |
|
|
|
|
w |
|
' |
|
. . . , W; |
I I |
( Я ;- ~ | 1 Н - Я = 0, |
/ 1 , |
||
/=1 |
|
|
|
|
i+1 |
W |
|
|
(4-21) |
|
|
|
||
|
я,— Я |
= 0. |
|
|
|
V |
|
||
|
|
■ |
|
. |
|
/=1 |
|
||
Решением системы (4-21) являются: |
|
|||
|
Д /= W Я ( /= 1, |
wy, |
||
|
X |
н_ |
W—1 |
(4-22) |
|
W |
|
|
|
|
|
|
|
|
Из (4-22) |
и (4-17) следует, |
что при этом |
||
|
U/opt |
_ |
w |
(4-23) |
|
|
|||
|
|
|
|
т. е. при заданном числе слоев имеющееся число ЛПЭ надо
распределять по слоям равномерно. |
В связи с (4-22) воз |
|||
никает |
вопрос о |
целочисленное™ Hf (j = I, |
, W). |
|
Если Я |
не делится на W нацело, то, |
как следует из (4-17) |
||
и (4-22), остаток |
элементов также |
следует распределить |
по слоям равномерно, причем не имеет значения как именно.
116
В этом смысле (4-23) есть верхняя оценка 4r?pt IW ], которая становится точной верхней оценкой при Я — KW, где К — целое.
2. Для заранее незаданного числа слоев W и при огра ничениях на количество ЛПЭ Я в сети найдем оптималь ную по верхней оценке структуру. Это можно записать сле дующим образом:
шах |
|
|
W<H |
|
(4-24) |
W |
|
|
2 Я, = |
Я- |
|
Из очевидного неравенства с учетом (4-23) |
||
w |
Н |
w \ 1 |
< W |
|
|
|
|
следует, что число областей с ростом числа слоев монотонно возрастает. Отсюда получается, что оптимальной в данном случае является Я-слойная сеть с одним элементом в каж дом слое, для которой из (4-23) следует, что
есть точная верхняя оценка.
3.Для заранее заданного числа слоев W и суммарного
количества ЛПЭ в сети найдем структуру, оптимальную по нижней оценке. С этой целью представим (4-19) в виде
нерекуррентной формулы: |
|
У 1[Г] |
(4-24а) |
|
w |
Условный экстремум (4-24а) при условии |
= ^ С0‘ |
|
i=1 |
гласно методу множителей Лагранжа достигается в случае,
если |
Я г- (г = 1, |
. . . , W) являются |
решениями системы: |
|
|
|
Hi (к — |
1)4- Я -f 1 = |
0; |
|
|
w |
н {- н = о, |
(4-25) |
|
|
2 |
|
|
|
|
i—i |
|
|
где |
/ = 1, . . . , |
W. |
|
|
117
Отсюда |
|
|
|
|
|
Н1 = Н2— |
. . . Hw = - ^ - H |
и |
при |
заранее |
заданном W |
|
ч 'Г Ь ,- 1 + н + |
№_ |
fP_ |
(4-26) |
|
|
2 |
2W |
|||
|
|
||||
Из (4-26) следует, что |
|
монотонно возрастает при |
|||
W -> со и является точной |
при Я -- KW, где К — целое. |
||||
Отсюда |
— 1 -----L— |
для |
Я-слойной |
сети с одним |
ЛПЭ в слое. Таким образом, в одномерном случае (N = 1) структуры, оптимальные по верхней и нижней оценкам, совпадают.
Для многомерного варианта сети, оптимальной по верх ней оценке, на основании (4-17), так же как в одномерном случае, можем записать:
m ° p t — m a x |
|
w |
|
max |
П YNHf |
||
|
|||
N W<H Нг . . . |
Яд, /=i |
||
|
W |
(4-27) |
|
v H, = |
H. |
/=1
Из (4-27), а также из (4-14) и (4-15) следует, что усло виям оптимальности (4-27) отвечает целый класс структур, именно все структуры, для которых Я,- < N (/ = 1, . . .
. . . , Г ) :
w
|
|
2 Я / = Я. |
|
(4-28) |
||
Для |
|
/=1 |
|
|
|
|
этих структур |
’ |
|
|
|
||
|
|
|
W |
|
|
|
|
Ч 7 ‘ = |
- |
Hi |
2Н. |
(4-29) |
|
|
2'“ ‘ |
= |
||||
Для |
структур, |
у |
которых |
Яу> Я , для |
любого |
|
(/= 1 , ... ,U 7 ) ¥ ° / m |
< 2 H. |
|
|
|
4-7. Оптимизация структуры по некоторым основным топологическим характеристикам
При технической реализации СР возникает естествен ное желание ограничить суммарное число входов в сети, вызванное тем, что число входов есть число технически трудно реализуемых блоков умножения. На этапе настройки
118
выбранной структуры число входов равно размерности пространства настраиваемых коэффициентов, в котором производится поиск экстремума функционала качества СР. Поэтому уменьшение числа входов многослойной СР облегчает как реализацию, так и настройку.
Для СР с полными перекрестными связями суммарное
количество входов ЛПЭ в г-м слое равно: |
|
|||
yr^ { L r VN )H ir il= 1, . . . , |
W. |
|||
Отсюда следует выражение для суммарного количества |
||||
■■ходов ЛПЭ в 1С-слойной сети: |
|
|
||
W |
W |
/ i |
|
w |
[ w :2 V |
2 2 Я /+ |
N H, = N % H + |
||
/=1 |
/=i |
\/=1 |
w |
/=1 |
|
+ - Я 2------ |
(4-30) |
||
|
2 Я Л |
|||
|
2 |
2 |
/=1 |
|
На основании |
(4-30) |
задача |
синтеза многослойной СР |
с полными перекрестными связями, оптимальной по верх ней или нижней оценке количества областей при ограниче нии на суммарное число входов у в сети, формулируется следующим образом:
¥ NWV |
■шах |
шах |
¥ N [ W ] ' |
|
|
W |
W |
н1 . . . н W |
|
W |
(4-31) |
|
■W |
|
|||
? > * 2 я / + т |
2 н ! |
- | 2 ^ |
|
||
/=1 |
/ |
\/=1 / |
1 |
/=1 |
|
Индекс* означает экстремальное значение. С учетом (4-30) обратная задача, т. е. задача синтеза многослойной СР с полными перекрестными связями, минимальной по суммарному числу входов, при ограничении на количество областей ¥ , реализуемых СР, имеет следующий вид:
y'L = min шш |
w |
, |
W |
\ 2 |
|
N V |
Я. + — |
2 |
" |
/ |
|
W h \ . . . Hw |
-fcJ |
I 9 |
|||
7= 1 |
|
h |
-1 |
|
|
1 |
W 9 |
|
|
|
(4-32) |
z/=i
¥'> ¥
N [ № ] ^ -
В формулах (4-31) и (4-32) ¥ ;V[U7] в зависимости от вида оценки определяется выражением (4-17) или (4-18).
119