Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Материалы по дисциплине Технология Нейронных сетей. Принятие решений. .doc
Скачиваний:
147
Добавлен:
04.02.2021
Размер:
3.88 Mб
Скачать

43. Решение проблемы нелинейного разделения применением двух линейных разделителей

Итак, однослойный персептрон не в состоянии реализовать даже такую

несложную функцию, как XOR.

Эту проблему легко разрешить путем расширения искусственной нейронной сети. С этой целью добавим в слой еще один нейрон и подберем веса обоих нейронов таким образом, чтобы они разделяли пространство на две части в зависимости от входного вектора

x=[x1, x2]T:

u1=w11x1+w22x2+w10>0 и u1=w11x1+w12x2+w10<0 (первый нейрон) и u2=w21x1+w22x2+w20>0 и u2=w21x2+w22x2+w20<0 (второй нейрон).

Подбор весов должен обеспечить

разделение пространства, показанное на рис.17.

Рис. 17. Применение двух линейных разделителей

Общая часть подмножеств, соответствующая условиям u1>0, u2>0,

определила область, отделенную от остального пространства, соответствующего условиям u1<0, u2<0.

44. Структура инс, выполняющей функцию xor

Добавлением на выходе сети еще одного слоя, состоящего из единственного нейрона, можно реализовать функцию логического суммирования, выделяющую общую часть подмножеств u1>0, u2>0.

Окончательная структура ИНС, выполняющей функцию XOR, представлена на рис. 18. Следует отметить, что добавление в сеть дополнительного слоя позволило разрешить проблему невозможности линейного разделения данных. Каждый нейрон скрытого слоя осуществляет дополнительное линейное разделение плоскости, причем граница такого раздела на области ui>0 и ui<0 зависит от значений весов нейрона. Выходной слой выполняет соответствующую линейную комбинацию (например, логическую сумму) подобластей, на которые множество, входных данных было разделено нейронами скрытого слоя.

Рис. 18. Структура ИНС, выполняющей функцию XOR

Несмотря на то, что однослойная сеть имеет небольшое практическое значение, ее продолжают использовать там, где для решения поставленной задачи достаточно и одного слоя нейронов.

Выбор архитектуры такой сети весьма прост. Количество входных нейронов определяется размерностью входного вектора x, а количество

выходных нейронов определяется размерностью вектора y. Обучение сети производится, как правило, с учителем и является точной копией обучения одиночного нейрона.

45. Многослойный персептрон

Структура персептронной сети. Многослойная сеть состоит из нейронов, расположенных на разных уровнях, причем, помимо входного и выходного слоев, имеется еще, как минимум, один внутренний, т.е. скрытый, слой. Такая нейронная система называется многослойным персептроном (рис. 19).

Рис. 19. Обобщенная структура двухслойной

сигмоидальной нейронной сети (с одним скрытым слоем)

Веса нейронов скрытого слоя пометим верхним индексом (1), а выходного слоя – верхним индексом (2). Выходные сигналы нейронов скрытого слоя обозначим vj (j=1, 2, …, K), а выходного слоя – yj (j=1, 2, …, M). Примем, что функция активации нейронов задана в сигмоидальной униполярной или биполярной форме.

Для упрощения описания будем использовать расширенное обозначение входного вектора сети в виде x=[x0, x1, …, xN]T, где x0=1 соответствует единичному сигналу поляризации. С вектором х связаны два выходных вектора сети: вектор фактических выходных сигналов y=[y0, y1, …, yM]T и вектор ожидаемых выходных сигналов d=[d0, d1, …, dM]T .

Цель обучения состоит в подборе таких значений весов wij(1) и wij(2) для всех слоев сети, чтобы при заданном входном векторе х получить на выходе значения сигналов yi, которые с требуемой точностью будут совпадать с ожидаемыми значениями di для i=1, 2, …, M. Если рассматривать единичный поляризационный сигнал как один из компонентов входного вектора х, то веса поляризации можно добавить в векторы весов соответствующих нейронов обоих слоев. При таком подходе выходной сигнал i-го нейрона скрытого слоя удается описать функцией

(49)

В выходном слое k-й нейрон вырабатывает выходной сигнал, определяемый как

(50)

Из формулы следует, что на значение выходного сигнала влияют веса обоих слоев, тогда как сигналы, вырабатываемые в скрытом слое, не зависят от весов выходного слоя.