Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Галушкин, А. И. Синтез многослойных систем распознавания образов

.pdf
Скачиваний:
34
Добавлен:
22.10.2023
Размер:
12.65 Mб
Скачать

ного преобразования кроме символических применяются также структурные, топологические методы. В результате подобного структурного подхода рассматриваются такие СР, как: ЛПЭ, реализующий гиперплоскость в многомер­ ном пространстве признаков; ЛПЭ с Kv и континуумом решений; СР, реализующие нелинейную разделяющую по­ верхность; многослойные СР с последовательными, пере­ крестными и обратными связями; многослойные СР со слу­ чайными связями; многослойные СР с континуумом при­ знаков, когда входом СР являются не jV-мерные векторы, а непрерывные функции (одномерные, двумерные и т. д.).

Главная задача при выборе структуры разомкнутой СР заключается в обосновании того или другого варианта структуры. Однородная структура многослойных СР реа­ лизует в простейшем случае кусочно-линейную разделяю­ щую поверхность в исходном пространстве признаков. Вве­ дение систем распознавания образов с перекрестными связями по сравнению с СР с последовательными связями позволяет реализовать более сложную разделяющую по­ верхность при незначительном усложнении СР.

Таким образом, с учетом сложности разделяющей по­ верхности и сложности разомкнутой СР ставится и решается задача синтеза структуры разомкнутой СР, состоящая в выборе оптимальных числа слоев и числа элементов в слое.

4-2. Линейная и нелинейные разделяющие поверхности

Линейная разделяющая поверхность задается следую­

щим уравнением:

N

2 aixl+ a0= О i=l

N

 

или 2 CL[Xi = 0, если принять х 0 = 1.

(4-1)

i=0

 

Линейная разделяющая поверхность является опти­ мальной по критерию минимума средней функции риска для случая распознавания двух совокупностей векторов, распределенных по нормальным законам с равными кова­ риационными матрицами, при определенных ограничениях на коэффициенты рг и 1ц. Структурная схема СР, реали­ зующей линейную разделяющую поверхность (линейный пороговый элемент — ЛПЭ), изображена на рис. 4-2. Та­ кая схема СР применима при произвольных характеристи­ ках входного сигнала СР (два, К и континуум классов об-

90

разов; произвольных квалификаций учителя и «собствен­ ного мнения учителя о своих способностях»). В соответст­ вии с модификациями пространства решений СР, пред­ ставленными в гл. 2 , возможны некоторые вариации струк­ туры ЛПЭ в зависимости от характеристик пространства решений (здесь название ЛПЭ условное в смысле линей­ ности): ЛПЭ с конечным, равным К р, числом решений — уровней квантования выходного сигнала (рис. 4-3), ЛПЭ

Рис. 4-2. Структурная схема ЛПЭ.

Рис. 4-3.

Структурная схема

Рис. 4-4. Структурная схема ЛПЭ

ЛПЭ с

Кр решениями.

с континуумом решений.

с континуумом решений (рис. 4-4). Преобразование, осу­ ществляемое схемой рис. 4-3, имеет вид:

xk(n) = Fp {g(n)] =

=i j [sign £ (и) — .fl*p.*p;i+1] ;

* ftp=1

i

(4-2)

 

N

 

g(n) = '2i а д (л).

1= 0

где двойные индексы у коэффициентов а разделяют две об­ ласти изменения сигнала g (п).

Преобразование, осуществляемое схемой рис. 4-4:

 

N

(4-3)

** (я) = F [£ (я)] = F

2 а л (я)

i=о

 

91

Функция F является непрерывной, монотонно возрас­ тающей ввиду специфики работы СР, формирующей непре­ рывный выходной сигнал. Здесь понятие разделяющей по­ верхности вырождается. На рис. 4-3 и 4-4 коэффициенты ai 2>• • • ’ ак к и паРаметРы функции xk = F (g) мо­

гут быть как фиксированными, так и настраиваемыми. Для повышения вероятности правильного распознава­

ния при более сложных, чем нормальные, законах распре­ деления строятся СР, реализующие нелинейные разделяю­ щие поверхности, определяемые, в частности, следующим выражением:

N

 

N

2

• •

2 O-i ... i Xi{ . . . Xir•-)- . . .-f

('i= 1

 

V=1

N

N

N

+ 2 2

я^2*л**2+2 ал*л+ ао= 0..

[,=1 i2= 1

н=1

Зачастую для удобства записи и частичного сокраще­ ния числа настраиваемых коэффициентов применяют за­

пись

выражения

для нелинейной разделяющей поверхно­

 

 

 

сти через систему ортогональ­

Х ( п )

Х 0 (п )

xh(n)

ных полиномов.

Всякое ре­

 

 

шение задачи распознавания

 

N

лпз

 

 

 

с нелинейной

разделяющей

Рис. 4-5. Структурная схема

поверхностью можно реализо­

вать двояко:

 

СР, реализующей

нелинейную

1.

 

разделяющую поверхность.

ном пространстве признаков

 

 

 

строится нелинейная разделя­ ющая поверхность по параметрам последовательности образов.

2. По параметрам последовательности образов нахо­ дится нелинейное преобразование исходного пространства признаков в пространство вторичных признаков. Данное нелинейное преобразование позволяет в пространстве вто­ ричных признаков строить линейную разделяющую поверх­ ность.

Эти два способа эквивалентны, хотя второй является более удобным, так как позволяет представить рассматри­ ваемую СР в виде некоторой двухслойной СР, показанной на рис. 4-5. На рисунке N — нелинейное преобразование исходного пространства признаков в пространство вторич­ ных признаков, х0 (п) — сигнал в пространстве вторичных

92

признаков. Подобной двухслойной СР на этапе распозна­ вания может быть представлено большинство рассмотрен­ ных в [Л. 1, 8 , 15, 34, 40, 41 ]. Естественно, чем шире воз­ можности нелинейного преобразования, которое осущест­ вляется слоем N, тем шире класс функций распределения вероятностей в исходном пространстве признаков, для ко­ торых данная двухслойная СР будет оптимальной. В [Л. 22, 46] показано несколько вариантов построения слоя N в не­ линейной СР.

Реализация СР с нелинейной разделяющей поверхностью является трудной технической задачей. Это следует из того,

что число настраиваемых

 

коэффициентов

данной

 

системы равно числу по­

 

рядка

(N +

г)! !N\ х г!,

 

где

N

— размерность

 

пространства признаков,

 

а г — порядок разделяю­

 

щей поверхности. В ре­

 

альных задачах

при N ,

 

равном

нескольким де­

 

сяткам и сотням и г по­

 

рядка 6 8 , число на­

 

страиваемых

коэффици­

 

ентов

достигает многих

 

миллиардов.

 

Поэтому

Рис. 4-6. Построение кусочно-линей

при

решении

конкрет­

ной разделяющей поверхности.

ных задач стараются со­ кратить число настраиваемых коэффициентов, причем наи­

более естественным и перспективным путем здесь является аппроксимация разделяющей поверхности кусками гипер­ плоскостей (рис. 4-6) [Л. 13, 44, 59, 60]. При этом можно считать, что, если разделяющая поверхность r-го порядка может быть достаточно точно (с точки зрения вероятности правильного распознавания) аппроксимирована гиперпло­ скостями, то приближенное число настраиваемых коэффи­ циентов равно числу порядка Nr. Например, при N = 100 и г = 6 сравниваются числа настраиваемых коэффициен­ тов порядка 1006 и 600. Более строгое сравнение сложности реализации нелинейных и кусочно-линейных СР на этапе распознавания, как правило, не проводится ввиду явного преимущества кусочно-линейных СР.

93

4-3. Реализация СР с кусочно-линейной разделяющей поверхностью в виде многослойной СР на ЛПЭ

В принципе после предварительного построения кусочно­ линейной разделяющей поверхности в многомерном про­ странстве признаков необходимо решить задачу отнесения

Рис. 4-7. Структурная схема СР, реализующей кусочно­ линейную разделяющую поверхность.

Рис. 4-8. Граф многослойной СР с последовательными связями.

различных областей к тому или иному классу (рис. 4 -7 ). Указанные области образуются при взаимном пересечении гиперплоскостей, реализуемых ЛПЭ первого слоя кусочно­ линейной системы распознавания образов. Каждая из об­ ластей определена в виде набора Н 1 двоичных сигналов ( H i — число ЛПЭ первого слоя), принимающих значения

94

± 1 на выходе ЛПЭ первого слоя, и соответствующего зна­ чения выходного сигнала всей СР. Блок отнесения областей к тому или иному классу должен реализовать в данном кон­ кретном случае некоторую функцию е (хк) от Я 2 двоичных

. А в

 

 

 

 

с д \

00

01

11

10

00

0

0

1

0

01

0

1

1

О

11

1

0

1

1

10

0

0

0

1

Рис. 4-9. Карта Карнапа

Рис. 4-10. Реализация

логической функции че-

логической функции

че­

тырех переменных.

тырех переменных

на

 

сети из элементов И и

 

ИЛИ.

 

переменных. Указанная логическая функция должна реа­ лизоваться в виде сети из ЛПЭ по следующим причинам.

1. Техническая реализация логических функций мно­ гих переменных упрощается при использовании сети из ЛПЭ по сравнению с логиче­ скими схемами на стандарт­ ных элементах И, ИЛИ, НЕ

ит. д.

2.Точность реализации ло­ гических функций (относи­ тельная нечувствительность работы блока реализации ло­

гической функции к ошибкам

 

 

установки параметров) значи­ Рис.

4-11. Реализация логиче­

тельно повышается при пере­

ской

функции четырех пере­

менных на сети из ЛПЭ с двумя

ходе к сети ЛПЭ [Л. 23, 12].

 

решениями.

3. Основной задачей иссле­ дований является создание

структуры разомкнутой СР. Если такая структура будет однородной, то это в значительной степени упростит ее ста­ тистический анализ, а также синтез алгоритмов настройки коэффициентов. На рис. 4-8 представлена граф-схема мно-

95

гослойной СР с полными последовательными связями ме­ жду слоями, реализующей, в частности, и кусочно-линей­ ную разделяющую поверхность. Заметим, что в случае ЛПЭ с двумя решениями при отсутствии ограничений на величину # 2 легко показать, что W < 3 . В общем случае каждый слой многослойной СР осуществляет некоторое преобразование своего исходного пространства признаков в пространство своих выходных переменных. Вид преобра­ зования зависит от структуры слоя и от величины настраи­ ваемых коэффициентов.

Пример. Пусть логическая функция задана в виде карты Кар' нэпа (рис. 4-9). С помощью элементов И — ИЛИ при использова' нии минимального числа таких элементов данная логическая функ­ ция реализуется так, как показано на рис. 4-10 [Л. 12]. Реализация этой же логической функции на ЛПЭ с двумя решениями имеет вид, изображенный на рис. 4-11. Из сравнения видно, что элементов И — ИЛИ нужно шесть, а ЛПЭ — два.

4-4. Классификация типов структур разомкнутых многослойных СР с последовательными связями

В книге в частности рассматриваются многослойные СР с последовательными связями, у которых коэффициенты первых W1 слоев из W являются настраивающимися, а W2 слоев (W2 = W—U^j) являются слоями с фиксирован­ ными коэффициентами. Качество работы многослойной СР

будет улучшаться при

увеличении общего числа слоев W

и числа слоев Wx с

настраиваемыми коэффициентами.

В данном случае в качестве обучаемых слоев выбираются именно первые слои СР, так как по мере удаления от пер­ вого слоя (исходного пространства признаков) происходит все большее и большее сжатие информации о наблюдаемых образах. При этом обучение целесообразнее производить в слоях с наибольшим потоком информации. В принципе может быть рассмотрена классификация типов структур разомкнутых многослойных СР по следующим признакам: числу слоев с настраиваемыми коэффициентами, числу слоев с фиксированными коэффициентами и методу фикса­ ции коэффициентов.

Ниже, в частности, рассмотрены следующие типы мно­ гослойных СР: двухслойная СР с настраиваемыми коэффи­ циентами первого слоя и фиксированными и настраивае­

мыми коэффициентами ЛПЭ

второго слоя;

трехслойная

СР с различными вариантами

Wx и W2\ многослойная СР

(коэффициенты всех слоев настраиваемые). В

[Л. 6, 19]

96

отмечается место наиболее важных из существующих СР в данной классификации. Случай W =-- 0 не имеет смысла, так как такая СР осуществляет отображение исходного пространства признаков в то же самое пространство. При W2 --- 0 и Wi — 1 описанная выше многослойная СР вырож­

дается в ЛПЭ. При

W 2 -= 1 и Wx = О

СР

вырождается

в ЛПЭ с фиксированными коэффициентами.

СР с W = 2,

первым слоем ЛПЭ

с фиксированными

коэффициентами,

а вторым слоем с настраиваемыми коэффициентами вырож­ дается в трехслойный персептрон Розенблатта, если труд­ ность, связанная с реализацией полных связей ЛПЭ пер­ вого слоя с исходным пространством признаков, устра­ няется путем резкого уменьшения числа входов ЛПЭ пер­ вого слоя, резкого увеличения числа ЛПЭ первого слоя и организации случайных связей входов ЛПЭ первого слоя

иисходного пространства признаков.

Втом случае, если вместо ЛПЭ первого слоя с фиксиро­ ванными коэффициентами в двухслойной СР поставить слой N нелинейных преобразований, указанная СР будет реализовывать нелинейную разделяющую поверхность в ис­ ходном пространстве признаков. Необходимо отметить особую роль нелинейных преобразователей F на выходе ЛПЭ каждого из слоев. Можно легко показать, что при

устранении данных преобразователей в многослойной СР с W слоями в одном из слоев, кроме последнего, данная СР превращается в СР с (W—1) слоем, что уменьшает по­ тенциальное качество ее работы на этапе распознавания.

Рассмотрим многослойные системы распознавания на два решения и два класса образов.

Двухслойные СР.

В двухслойной СР из ЛПЭ с двумя решениями реализацию ло­ гической функции в (х^) осуществляет ЛПЭ второго слоя.

Для реализации логической функции необходимо найти зна­ чения настраиваемых коэффициентов ЛПЭ второго слоя с тем, чтобы выполнялись соотношения:

Hi

2

°ixik + Со >

0 при ek = 1;

t=l

 

н,

 

 

2 a i x ik + «о < 0 при Ч = — 1■

i=l

 

 

Пример. Пусть

разделяющая

поверхность в исходном про­

странстве признаков

образована

кусками трех гиперплоскостей,

т. е. первый слой системы содержит три ЛПЭ. Второй слой имеет

4 З а к а з № 975

97

один ЛПЭ. Последний реализует логическую функцию, которая соответствует конфигурации разделяющей поверхности, показан­ ной на рис. 4-12. На рисунке незаштрихованные области относятся

к первому

классу (е^ = —1),

заштрихованные — ко второму

(ей = -)-1).

Стрелками указаны

положительные направления ги­

перплоскостей. Каждой области, образованной гиперплоскостями, соответствует своя комбинация двоичных выходов ЛПЭ первого слоя и на ЛПЭ второго слоя поступают три двоичных сигнала. Если взять

веса ЛПЭ второго слоя равными аг = 1, аг = 1, а3 =

2, а порог

ап — —1, то разделение на классы, показанное на рис.

4-12, будет

реализовано.

 

Ассоциативная система [Л. 12] является частным слу­ чаем многослойной сети ЛПЭ с фиксированными коэффи­

циентами. Если

число Н г

ЛПЭ первого

слоя

нечет-

 

 

ное, то ЛПЭ второго слоя

 

 

может

реализовать

мажо­

 

 

ритарный элемент, т. е.

 

 

элемент,

работающий

по

 

 

принципу голосования. По­

 

 

тенциальные

возможности

Рис. 4-12. Иллюстрация разделя­

двухслойной

ассоциатив­

ной СР ниже, чем

двух­

ющей поверхности,

реализуемой

двухслойной СР.

слойной

СР

с настраивае­

 

 

мыми

коэффициентами

во

втором слое. Можно показать, что для двухслойной ассоциативной СР с мажори­ тарным элементом на выходе при заданном числе гипер­ плоскостей (ЛПЭ первого слоя) реализуется только одна конфигурация разделяющей поверхности, так как каждой области соответствует определенный знак суммы «голосов» и к первому и второму классу относятся соответственно области с отрицательным и положительным преоблада­ нием. Этот вывод верен для данной системы и в том случае, если порог мажоритарного элемента отличен от нуля. При этом при изменении порога меняется вид конфигурации разделяющей поверхности, но она остается единственной. Число конфигураций разделяющих гиперповерхностей (т. е. число возможных разбиений объектов на два класса), которое можно реализовать изменением величины порога мажоритарного элемента, равно числу Н 1 разделяющих гиперплоскостей.

Можно также показать, что с помощью ЛПЭ во втором слое на элементах И или ИЛИ можно реализовать только одну конфигурацию разделяющей гиперповерхности. Ре­ зультаты исследования реализуемости различных конфи-

98

Т а б л и ц а 4-1

4*

99

Соседние файлы в папке книги из ГПНТБ