5.4 Радиально-базисные нейронные сети

Радиально-базисная НС (РБНС) состоит из двух слоев. Соединительные весовые векторы слоев будем обозначать w^(μ,j), где μ-номер слоя (μ=1,2), j – номер нейрона (узла) в слое. Базисные (или ядерные) функции в первом слое производят локализованную реакцию на входной стимул. Выходные узлы сети формируют взвешенную линейную комбинацию из базисных функций, вычисленных узлами первого слоя.

Выходные узлы соответствуют выходным классам, в то время, как узлы первого слоя представляют собой кластера (количество кластеров m задается пользователем), на которые разбивается входное пространство. Обозначим x = (x₁, ..., x_i, ..., x_N) и y = (y₁, ..., y_i, ..., y_K) - вход и выход сети, соответственно. Здесь N – количество признаков, а K-число классов.

Выход u_j j-го узла первого слоя, используя ядерную функцию Гауссиан как базисную, определяется по формуле:

,j=1,2,...,m,

где x - входной образ (экземпляр), w^(1,j) - его входной весовой вектор (то есть центр Гауссиана для узла j) и σ²_j - параметр нормализации j-го узла, такой что 0 < u_j < 1 (чем ближе вход к центру Гауссиана, тем сильнее реакция узла).

Выход y_j j-го узла второго слоя определяется из выражения:

y_j= w^(2,j)Tu, j =1 ,2, ..., K;

где w^(2,j) – весовой вектор для j-го узла второго слоя и u - вектор выходов первого слоя.

Сеть выполняет линейную комбинацию нелинейных базисных функций. Задача обучения сети состоит в минимизации ошибки:

где y^s*_j и y^s_j - желаемое и расчетное значения выхода j-го узла выходного слоя для s-го экземпляра, S - размер набора данных (количество экземпляров), и K - число выходных узлов (число классов). Далее для наглядности верхний индекс s опущен.

Обучение РБНС может выполняться двумя различными способами.

Первый способ заключается в том, что алгоритмом кластеризации формируется фиксированное множество центров кластеров. Затем минимизацией квадратичной ошибки, то есть минимизацией E, получают ассоциации центров кластеров с выходом.

Второй способ заключается в том, что центры кластеров могут быть также обучены наряду с весами от первого слоя до выходного слоя методом градиентного спуска. Однако, обучение центров наряду с весами может привести к попаданию сети в локальные минимумы.

Пусть фиксированное множество центров кластеров сформировано на основе первого способа, а центры кластеров будут обозначены w^(1,j), j = 1, ..., m. Параметр нормализации σ_j представляет меру распределения данных, ассоциируемых с каждым узлом.

Обучение в выходном слое выполняется после того, как определены параметры базисных функций. Веса обычно обучают, используя алгоритм среднеквадратических отклонений:

где e_j = y_j — y*_j и η - коэффициент скорости обучения.

5.5 Нейронные сети Хопфилда

5.5.1 Модель сети Хопфилда

НС Хопфилда (псевдоинверсная НС) задается четверкой net=(N,w, θ, x), где N — число нейронов в сети, θ = {θ₁,θ₂,...,θ_N}-вектор внешних воздействий. Нейроны связаны по принципу «все со всеми», это значит, что в сети NxN связей. Связь между i-ым и j-ым нейронами обозначаетсяw_ij. Величинаw_ijназывается весом связи и может быть нулем, положительным или отрицательным числом. Веса связей задаются матрицейw = {w_ij}, i, j= 1,.., N. В модели Хопфилда связи симметричные, т. е.w_ij= w_ji. Состояние сети определяется вектором состояний нейроновx = {x₁, ...,x_N}.

Нейрон рассматривается как двустабильный пороговый элемент (модель Мак-Каллока - Питтса). Состояниеx_i нейрона i может иметь два значения0и1 или 1 и -1. Нейрон i имеет внешний вход θ, входы от других нейроновx_jи один ветвящийся выход, равныйx_i. Вход в нейрон i (постсинаптический потенциал) определяется суммой взвешенных состояний, связанных с ним нейронов:

В зависимости от величины входаnet_iнейрон i изменяет свое состояние или остается в прежнем в соответствии с пороговым правиломnet_i^k+1=ψ(net_i^k), где k, k+1— номера старого и нового состояний нейрона i, аψ(x) – функция активации нейрона:

(пороговая) или(сигмоидная).

Сеть может изменять свое состояние синхронным или асинхронным способом.

Всинхронном случаевсе нейроны одновременно изменяют свои состояния. Аналитическое выражение перехода сети из состоянияx_kвx_k+1записывается в матричной форме:net_k= wx_k+ θ_k,x_k+1= ψ(net_k), гдеx_k={x₁^k,x₂^k,...,x_N^k},net_k={net₁^k,net₂^k,...,net_N^k} Функцияψприменяется к векторуnet_kпоэлементно.

Васинхронном случаекаждый нейрон может изменять свое состояние случайно, при этом он использует информацию об обновленных состояниях других нейронов. Аналитическая запись перехода сети из состоянияx_kвx_k+1в асинхронном случае, когда нейрон m изменяет свое состояние, имеет видnet_m^k= w_mx_k+ θ_k,x_k+1={x₁^k,...,ψ(net_m^k),...,x_N^k}, гдеw_m— строка матрицыwс номером m.

Начиная с начального состоянияx₀ и работая синхронно или асинхронно, сеть генерирует последовательность состоянийx₀,x₁, ...,x_M, которая в благоприятных случаях заканчивается устойчивым состоянием, в неблагоприятных случаях могут возникнуть колебания.

Основной операцией, производимой нейронной сетью, является умножение матрицы на вектор (в синхронном случае) или вектора на вектор (в асинхронном случае) с последующим вычислением нелинейной функции. Однако, благодаря массовости связей большого числа нейронов при такой достаточно простой операции сеть обладает способностью решать сложные задачи.

<<< < Предыдущая 1 2 3 45 / 165 6 7 8 9 10 11 12 13 14 15 16 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
07.02.20162.47 Mб42Mikhaylin_Osnovi_zhurnal.doc
#
07.02.20161.24 Mб41Mikroekonomika_2013_seminar.doc
#
14.08.2019184.32 Кб2mini ЗИ-21-30хр.doc
#
01.05.202580.9 Кб0MINISTERSTVO_OBRAZOVANIYa_I_NAUKI.doc
#
11.12.201864.51 Кб6Ministerstvo_osviti_i_nauki_Ukrayin1.doc
#
07.02.20162.5 Mб61mmotor5.doc
#
07.02.2016200.19 Кб7Modelyuvannya_gotovo.doc
#
01.05.2025180.96 Кб0modul1.docx
#
01.03.2025723.48 Кб0modul_2.docx
#
01.05.2025254.61 Кб0MODUL_2_FIZKhIMIYa_33__33__33__33__33__33.docx
#
22.04.201936.94 Кб6Mod_2.docx