Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
лекц_нейр_ сети.(2008-09-10).doc
Скачиваний:
113
Добавлен:
23.09.2019
Размер:
2.22 Mб
Скачать

Лекция 24

4.3. Математическая модель нейрона

Приведем обобщенную математическую модель, в соответствии с которой нейрон представляет собой безынерционное устройство с n входными сигналами и одним выходным сигналом у (рис. 3).

Рис. 3

Процесс преобразования входа включает в себя:

во-первых, вычисление функции передачи (функции распространения)

, (1)

представляющей собой взвешенную сумму всех входных сигналов, получаемых от нейронов-передатчиков, где весовые коэффициенты wi, определяются синаптической силой соответствующих входным сигналам синапсов. Возбуждающим синапсам соответствуют положительные значения, а успокаивающим синапсам - отрицательные значения весовых коэффициентов. Величина v называется уровнем активации или внутренним входом нейрона. Чтобы учесть то обстоятельство, что уровень активации нейрона в отсутствие входных сигналов ui не является нулевым, к взвешенной сумме добавляется так называемое смещение b;

во-вторых, так называемую активационную функцию (функцию активации f), преобразующую уровень активации v в выходной сигнал нейрона у. Для этой цели используются различные функции, среди которых наиболее распространенной является сигмоидальная функция (рис.4), описываемая следующим выражением

(2)

Рис.4

В этой функции при любых значениях v множество значений y ограничено интервалом [0,1]. Крутизна нелинейной характеристики нейрона

определяется производной от активационной функции.

Для сигмоидальной функции, описываемой (2), крутизна имеет вид

(3)

и изменяется в зависимости от уровня активации от малых значений (при отрицательных значениях v) до максимального значения (при нулевом уровне активации) и снова уменьшается при больших положительных значениях v.

Самой простой формой активационной функции является линейная функиия, описываемая выражением

y=kv, (4)

где k - некоторая постоянная. В ряде случаев ее принимают равной единице.

Для упрощения изображения нейрона (рис. 2) используем понятие узла, известное в сигнальных графах. При этом в случае двух входов нейрон можно представить графически в более простом виде (рис. 5).

Рис. 5

На этом рисунке узел является графическим изображением двух операций, определяемых уравнениями (1) и (2), причем . При этом

.

4.4. Многослойная нейронная сеть

Многослойная нейронная сеть включает в себя один или несколько скрытых слоев, нейроны которых называют скрытыми нейронами (рис. 1). Граф на рис. 6 изображает многослойную сеть с одним скрытым нейроном. Когда мы говорим, что сеть состоит из N слоев, мы учитываем лишь скрытые слои и выходной слой. Входной слой при этом не учитывается, т.к. его узлы не отражают никаких действий вычислительного характера. Однослойная нейронная сеть, таким образом, состоит из одного выходного слоя.

Рис. 6

Найдем математическую модель двухслойной сети, полагая, что в каждом слое используется одна и та же активационная функция (функция активации f) и что число входов n и число выходов m. Считаем, что скрытый слой содержит c нейронов. Для двухслойной нейронной сети, представленной на рис. 6, n=m=2, c=3. Ради простоты мы не показываем смещения нейронов.

В нейронах скрытого слоя, во-первых, вычисляется взвешенная сумма входных сигналов u1 и u2 , так что внутренний сигнал i-го нейрона этого слоя определяется как

. (4a)

Затем используется нелинейная активационная функция f, чтобы вычислить выходной сигнал i-го нейрона скрытого слоя

. (4b)

Заметим, что активационные функции вводят в нейронную сеть нелинейности и при этом придают ей устойчивость в работе.

Выходной сигнал активационной функции в общем случае проходит непосредственно на выход i-го нейрона скрытого слоя (хотя имеются исключения, когда используется динамический фильтр), после чего он поступает на входы нейронов следующего слоя посредством весовых коэффициентов. Для двухслойной сети следующим слоем является выходной слой, так что внутренний сигнал j-го нейрона этого слоя определяется как

. (4c)

Затем с помощью активационной функции выходного слоя окончательно формируется выходной сигнал j-го нейрона, другими словами, j-й выходной сигнал нейронной сети

. (4d)

Несмотря на простоту рассмотренной структуры, эта модель нейронной сети весьма универсальна. Показано, что нейронная сеть с одним скрытым слоем, может аппроксимировать любую непрерывную функцию с любой степенью точности (если имеется достаточное число нейронов в скрытом слое). Следует сказать, что нейронная сеть с двумя скрытыми слоями может аппроксимировать всецело любую функцию.

Различают два режима работы нейронной сети рабочий режим и режим обучения.

В рабочем режиме имеет место прямое распространение сигнала от входа к выходу. Хотя применяются нейронные сети с обратной связью, мы ограничимся лишь изучением многослойной сети с однонаправленным распространением входного сигнала (персептрона). В режиме обучения используется как прямое, так и обратное распространение сигнала, которое сводится к тому, что сигнал ошибки e=d-y=(e1,…,em) между желаемым d=(d1,…,dm) и действительным y=(y1,…,ym) значениями выхода используется для подстройки весов и смещений выходного и скрытого слоев.