- •Введение
- •1. Аналитические технологии
- •1.1. Определение аналитических технологий.
- •1.2. Традиционные технологии
- •1.3.Новые технологии
- •2. Искусственные нейронные сети
- •2.1. Принципы работы мозга
- •2.2. Искусственная нейронная сеть
- •2.3 Принципы обучения искусственной нейронной сети
- •2.4. Сбор данных для нейронной сети
- •2.5. Переобучение и обобщение
- •3. Модели нейронов и методы их обучения
- •3.1. Персептрон
- •3.2. Сигмоидальный нейрон
- •3.3. Нейрон типа «адалайн»
- •3.4. Инстар и оутстар Гроссберга
- •3.5. Нейроны типа wta
- •3.6. Модель нейрона Хебба
- •3.7. Стохастическая модель нейрона
- •4.Алгоритмы обучения искусственных нейронных сетей
- •Многослойный персептрон
- •Алгоритм обратного распространения ошибки
- •Стохастические алгоритмы обучения искусственных нейронных сетей
- •Настройка числа нейронов в скрытых слоях многослойных сетей в процессе обучения
- •Виды искусственных нейронных сетей
- •5.1. Линейные сети
- •5.2. Радиальные нейронные сети
- •5.3. Сети с самоорганизацией на основе конкуренции
- •5.4. Модели ассоциативной памяти
- •5.5. Когнитивные карты
- •Способы внедрения новых аналитических технологий
- •Заключение
- •Список литературы
3.2. Сигмоидальный нейрон
Нейрон сигмоидального типа имеет структуру, подобную модели МакКаллока-Питса, с той разницей, что функция активации является непрерывной и может быть выражена в виде сигмоидальной униполярной или биполярной функции [10,17] (рис.11).
Рисунок 11 – Структурная схема сигмоидального нейрона
Униполярная функция представляется формулой
,
(7)
биполярная функция задается в виде
.
(8)
В
этих формулах параметр
подбирается пользователем. Его значение
влияет на форму функции активации. На
рисунках12,13 представлены графики
сигмоидальной функции от переменной
для различных значений
,
на рисунке 12 показана униполярная, а на
рисунке 13 - биполярная. Графики обеих
функций сильно зависят от значения
.
При малых величинах
график функции достаточно пологий, но
по мере роста значения
крутизна графика увеличивается. При
сигмоидальная функция превращается в
функцию ступенчатого типа, идентичную
функции активации персептрона. На
практике чаще всего для упрощения
используется значение
.
Важным свойством сигмоидальной функции является ее дифференцируемость. Для униполярной функции имеем
,
(9)
для биполярной функции
.
(10)
Рисунок 12 – График униполярной сигмоидальной функции
Рисунок 13 – График биполярной сигмоидальной функции
И
в первом и во втором случае график
изменения производной относительно
переменной xимеет
колоколообразную форму, а его максимум
соответствует значению
.
Сигмоидальный
нейрон, как правило, обучается с учителем
по принципу минимизации целевой функции,
которая для единичного обучающего
кортежа
i-го
нейрона определяется в виде
,
(11)
где
.
(12)
Функция
является сигмоидальной, где
– это входной вектор, а
–соответствующее
ему ожидаемое значение на выходе i-го
нейрона.
3.3. Нейрон типа «адалайн»
Модель нейрона типа «адалайн» (AdaptiveLinearNeuron – адаптивный линейный нейрон) была предложена Б. Видроу [23]. Её структурная схема, демонстрирующая адаптивный способ подбора весовых коэффициентов представлена на рисунке14.
Рисунок 14 – Структурная схема нейрона типа «адалайн»
По методу весового суммирования сигналов нейрон типа «адалайн» аналогичен представленным ранее моделям нейронов. Функция активации имеет вид
(13)
Адаптивный подбор весовых коэффициентов осуществляется в процессе минимизации квадратичной ошибки, определяемой как
.
(14)
Несмотря на нелинейный характер модели, в целевой функции присутствуют только линейные элементы, представляющие собой сумму взвешенных входных сигналов. В связи с выполнением условия непрерывности целевой функции, стало возможно применение алгоритма градиентного обучения. Значения весовых коэффициентов могут утоняться либо дискретным способом:
,
(15)
либо аналоговым:
,
(16)
в
которых
.
В практических приложениях нейроны типа «адалайн» всегда используется группами, образуя слои, называемые «мадалайн» (Manyadaline–много адалайн). Каждый входящий в слой нейрон обучается по правилу адалайн. Б. Видроу [23] предложил три базовых типа межнейронных соединений: OR, AND, мажоритарное (рис.15).
Рисунок 15 – Структурная схема базового межнейронного соединения
Сигналы суммируются с учетом порогового значения, установленного раздельно для каждого типа связи. Для схемы OR порог имеет значение (n-1), для AND – (1-n), для мажориторной схемы – нулевое значение.
В связи с используемой функцией активации выходной сигналy принимает значение +1, когда хотя бы один из входных сигналов имеет значение +1(OR), когда все входные сигналы имеют значение +1(AND), либо когда большинство сигналов имеет значение +1 (мажоритарное соединение).
