- •Глава 5. Нейросетевые методы распознавания и аппроксимации
- •5.1 Принципы организации и классификация нейронных сетей
- •5.2 Формальный нейрон. Однослойный персептрон
- •5.3 Многослойный персептрон
- •5.3.1 Модель сети
- •5.3.2 Обучение многослойного персептрона
- •Да: перейти на шаг 11. Нет: Перейти на шаг 13.
- •Да: Окончание поиска: нет продвижения к решению. Перейти на шаг 13.
- •Алгоритмы сопряженных градиентов представляют собой подкласс квадратично сходящихся методов. Для алгоритмов сопряженных градиентов шаг 6 обобщенного градиентного алгоритма имеет вид:
- •5.3.3 Следящий алгоритм обучения мнс
- •5.4 Радиально-базисные нейронные сети
- •5.5 Нейронные сети Хопфилда
- •5.5.1 Модель сети Хопфилда
- •5.5.2 Обучение сети Хопфилда распознаванию образов
- •5.5.3 Эффект разнасыщения
- •5.6 Нейронная сеть Хэмминга
- •5.7 Машина Больцмана
- •5.8 Двунаправленная ассоциативная память
- •5.9 Нейросетевой селектор максимума
- •5.10 Карта признаков самоорганизации Кохонена
- •5.10.2 Интерпретация результатов классификации нс Кохонена
- •Блок кпск-азу может быть рекомендован для использования в системах классификации в случае, когда:
- •5.10.3 Выбор метрики и учет информативности признаков
- •Шаг 3. Произвести обучение блока кпск-азу на всей выборке X
- •5.11 Квантование обучающих векторов
- •5.11.1 Модель сети
- •5.11.2 Алгоритм обучения lvq1
- •5.11.3 Алгоритм обучения lvq2
- •5.11.4 Алгоритм обучения lvq3
- •5.11.5 Алгоритм обучения olvq1
- •5.12 Контрастирование нейронных сетей
- •Алгоритм построения и оптимизации модели объекта.
- •Алгоритм контрастирования многослойной нейронной сети.
5.6 Нейронная сеть Хэмминга
Когда на выходе НС достаточно получать номер образца, ассоциативную память успешно реализует сеть Хэмминга. Данная разновидность нейросети характеризуется, что видно по ее структуре, изображенной на рис. 5.4, в сравнении с чаще используемой сетью Хопфилда, снижением затрат на память и также снижением общего объема вычислений.

Рис. 5.4 - Структура нейронной сети Хемминга.
Идея данной конфигурации сети состоит в нахождении расстояния Хэмминга от тестируемого образца до всех образцов. При этом, расстоянием Хэмминга принято считать число отличающихся битов в двух бинарных векторах.
Сеть выбирает образец с минимальным расстоянием Хэмминга до неизвестного входного сигнала, в результате чего будет активизирован только один выход сети, соответствующий этому образцу.
На стадии инициализации весовым коэффициентам первого слоя и порогу активационной функции присваиваются следующие значения:
wik = 0,5xik, i = 0,..., N-1, k = 0, ..., m-1,
θk = N / 2, k = 0, ..., m-1,
где xik – i-ый элемент k-го образца, n - количество признаков, m – количество нейронов в слое.
Весовые коэффициенты тормозящих синапсов во втором слое берут равными некоторой величине 0 < < 1/m. Синапс нейрона, связанный с его же аксоном имеет вес +1.
Алгоритм функционирования сети Хэмминга следующий:
1. На входы сети подается неизвестный вектор x = {xi}, i = 0, ..., N-1, исходя из которого рассчитываются состояния нейронов первого слоя (верхний индекс указывает номер слоя):
,
j=0,
...,
m-1.
После этого полученными значениями инициализируются значения аксонов второго слоя:
y(2,j) = y(1,j), j = 0, ..., m-1.
2. Вычислить новые состояния нейронов второго слоя:
![]()
и значения их аксонов:
.
Активационная
функция
имеет вид порога, причем границы порога
должны быть достаточно велики, чтобы
любые возможные значения аргумента не
приводили к насыщению.
3. Проверить, изменились ли выходы нейронов второго слоя за последнюю итерацию. Если да – перейди к шагу 2. Иначе – завершение алгоритма.
При внимательной оценке алгоритма видно, что роль первого слоя весьма условна: воспользовавшись один раз на шаге 1 значениями его весовых коэффициентов, сеть больше не обращается к нему, поэтому первый слой может быть вообще исключен из сети (заменен на матрицу весовых коэффициентов).
5.7 Машина Больцмана
Машина Больцмана задается четверкой{N,Е, x0,w}, где N - число нейронов, E = {(i, j)} -множество связей между нейронами, i, j= l,...,Nпри этом все автосвязи принадлежат этому множеству, то есть {(i,i)} - подмножество Е. Каждый нейрон может иметь состояние 0или 1. Состояние xkмашины Больцмана определяется состояниями нейронов xk= (xk1, ...,xkN), x0 -начальное состояние.
Каждая связь (i, j)имеет весwij —вещественное число, множество весов связей обозначаетсяw. Связь (i, j)называется активной в состоянии xk,если xkixkj = 1Вес связи (i, j)интерпретируется как количественная мера желательности, чтобы эта связь была активной. Если wij>>0,то считается, что активность связи очень желательна, еслиwij<<0, то очень не желательна. Как и в модели Хопфилда связи в машине Больцмана симметричны, то естьwij = wji.
Для состояния xijмашины Больцмана вводится понятие консенсуса:
.
Консенсус Сkинтерпретируется как количественная мера желательности, чтобы все связи (i, j)в состоянии xkбыли активными.
Для состояния xkопределяется множество соседей x(k).Соседнее состояниеxk(i), принадлежащееx(k), получается из xkпри изменении состояния нейрона i:
Разница консенсусов соседних состояний xk и xk(i) равна:
,
где Е(i) - множество связей нейрона i.
Эволюция состояний от начальногоx0с максимизацией консенсуса приводит машину к финальному состоянию, имеющему локальный или глобальный максимум консенсуса и соответствующему решению задачи, близкому к оптимальному или оптимальному.
Переход машины Больцмана из состояния в состояние с максимизацией консенсуса происходит путем выполнения пошаговой процедуры. На каждом шаге ее выполняется испытание, состоящее из двух частей:
1)для данного состояния xkгенерируется соседнееxk(i),
2)оценивается, может ли быть принято состояниеxk(i), если может, то результат испытания—xk(i), иначе xk.
Состояниеxk(i) принимается с вероятностью:
,
где t - управляющий параметр (положительное вещественное число).
Процесс максимизации консенсуса начинается с высокого значения t0параметра tи случайно выбранного начального состоянияx0. В течение процесса параметр tуменьшается от t0до 0.По мере того как tприближается к нулю нейроны все реже изменяют свои состояния и, наконец, машина Больцмана стабилизируется в финальном состоянии.
Асимптотически машина Больцмана способна прийти к финальному состоянию, соответствующему оптимальному решению задачи. Но практически сходимость машины к состоянию с максимальным консенсусом гарантирована быть не может, машина Больцмана стабилизируется в состоянии, соответствующем локальному максимуму консенсуса, который близок (или равен) глобальному.
Сходимостью машины Больцмана управляют следующие параметры:
1)начальное значение параметра tдля каждого нейрона i:
,
2)правило затухания t:
,
где
-
положительное число меньшее единицы,
но близкое к ней;
3)число Lиспытаний, которые проводятся без изменения t (L -функция от N),
4)число М последовательных испытаний, не приводящих к изменению состояния машины (М - также функция отN),как критерий завершения процесса.
Описанный процесс максимизации консенсуса является последовательным. Максимизация может быть выполнена параллельно синхронным или асинхронным способом.
Для выполнениясинхронного процессавсе множество нейронов разбивается на непересекающиеся подмножества {W1, ..., Wm},такие, что нейроны, попавшие в одно подмножество, не связаны один с другим. Тогда на каждом такте синхронизации элементы случайно выбранного подмножества Wiмогут одновременно изменить свои состояния в соответствии с вероятностью.
Васинхронномпараллельном процессе все нейроны могут изменять свои состояния только в зависимости от величины вероятности.Практически асинхронный параллелизм может быть выполнен следующим образом. Случайно выбирается подмножество W,содержащее qнейронов. Для каждого нейрона из этого подмножества устанавливается состояние в соответствии с выражением.Получившееся в результате состояние xiесть результат одного асинхронного шага. Число qвыбирается равным 2/3.
