Добавил:

TooL Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Тульский Государственный Университет

Предмет:

Информационные технологии в экономике

Файл:

Конспект лекций по ИСЭ. Огнянович А.В. / Глава 6.doc

Скачиваний:

Добавлен:

21.01.2014

Размер:

689.15 Кб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 89 / 149 10 11 12 13 14 > Следующая >>>

6.6. Модели нейронных сетей

6.6.1. Многослойные однонаправленные сети

Такие сети называются также сетями прямого распространения, или многослойными персептронами. В дальнейшем (там, где это не может привести к неоднозначности) будем называть такие сети многослойными.

Сети этого типа состоят из нескольких слоев нейронов: входного слоя, выходного и нескольких «скрытых слоев». На рис. 7.3 изображена сеть, у которой К слоев. Нейроны каждого слоя не связаны между собой. Выходной сигнал с каждого нейрона поступает на входы всех нейронов следующего слоя. Нейроны входного слоя не осуществляют преобразования входных сигналов, их функция заключается в распределении этих сигналов между нейронами первого скрытого слоя.

Функционирование многослойной сети осуществляется следующим образом: входной сигнал, подаваемый на сеть, поступает на нейроны входного слоя, прохо дит по очереди через все слои и снимается с выходов нейронов выходного слоя. По мере распространения сигнала по сети он претерпевает ряд преобразований, которые зависят от его начального значения, от преобразующих функций и величин весов связей.

Пусть сеть состоит из К слоев: одного входного, одного выходного и ( K >-2) скрытых слоев, — каждый слой состоит из n ( k ) нейронов. Набор выходных сигналов нейронов k - ro слоя ( k = 1: K ) обозначим . Далее обозначим w^k набор весов синаптических связей, соединяющих нейроны k - 1-го слоя с нейронами k -го слоя; — вес связи, соединяющий i - й нейрон k -1-го слоя c j -м нейроном k -го слоя Т огда прямое функционирование сети описывается следующими соотношениями:

y ¹= x

—выход нейронной сети.

Рис 6.3. Схема многослойной однонаправленной сети

В основе методов обучения многослойных нейросетей наиболее часто лежит так называемое дельта-правило. Дельта-правило используется при обучении с учителем и реализуется следующим образом:

где h — параметр (шаг обучения);

d — эталонное (требуемое) значение выхода элемента.

Таким образом, изменение силы связей происходит в соответствии с ошибкой выходного сигнала 5 = ( d — у) и уровнем активности входного элемента х.. Обобщение дельта-правила , называемое обратным распространением ошибки ( Back — propagation ), применимо к сетям с любым числом слоев.

Обучение сети в этом случае состоит из следующих шагов:

Выбрать очередную обучающую пару ( х , d ). Подать входной вектор на вход сети.
Вычислить выход сети у.
Вычислить разность между выходом сети и требуемым выходом (ошибку).
Подкорректировать веса сети так, чтобы минимизировать ошибку.
Повторять шаги с 1-го по 4-й для каждой обучающей пары, пока ошибка не достигнет приемлемого уровня.

Ошибка функционирования сети обычно определяется как

г де у _j= — выход сети.

Для уменьшения этой ошибки следует изменить веса сети по правилу

Эта формула описывает процесс градиентного спуска в пространстве весов. Очевидно, для выходного слоя

Т ак как

то для промежуточных (скрытых)

слоев (то есть для

Если в качестве нелинейной преобразующей функции используется сигмоидная функция, то удобно использовать рекуррентные формулы:

- для выходного слоя;

-для скрытых cлоев ,

тогда

Эти соотношения называются формулами обратного распространения ошибки. Если при прямом функционировании входной сигнал распространяется по сети от входного слоя к выходному, то при подстройке весов ошибка сети распространяется от выходного слоя к входному.

Область применения многослойных нейросетей обусловлена тем, что они аппроксимируют отображение используя для этого предварительное обучение на наборах тренировочных данных (х ₁ , d ₁), ( x ₂, d ₂), ..., ( x_L , d_L ), где d_e = F ( x_e ). Таким образом, сеть можно рассматривать как модель у = φ ( х ) реального объекта у = F ( x ) . Доказаны теоремы о том, что с помощью сети с обратным распространением ошибок можно аппроксимировать любую функцию с любой точностью.

<<< < Предыдущая 1 2 3 4 5 6 7 89 / 149 10 11 12 13 14 > Следующая >>>

Соседние файлы в папке Конспект лекций по ИСЭ. Огнянович А.В.

#
21.01.2014634.37 Кб94Глава 1.doc
#
21.01.2014167.94 Кб62Глава 2.doc
#
21.01.2014295.42 Кб77Глава 3.doc
#
21.01.201469.12 Кб58Глава 4.doc
#
21.01.2014204.8 Кб69Глава 5.doc
#
21.01.2014689.15 Кб86Глава 6.doc
#
21.01.2014411.65 Кб60Глава 7.doc
#
21.01.2014247.81 Кб67Глава 8.doc
#
21.01.201420.99 Кб52Книга1.xls
#
21.01.201424.06 Кб45Копия Приложение 4..xls
#
21.01.201462.98 Кб52Начало ИСЭ.doc