Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Пензенский Государственный Университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Учебное пособие_1.docx

Скачиваний:

Добавлен:

01.07.2025

Размер:

1.53 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 67 / 217 8 9 10 11 12 13 14 15 16 17 18 19 20 21 > Следующая >>>

3. Модели нейронов и методы их обучения

В соответствии с принципами функционирования биологических нейронов созданы различные математические модели, которыми в большей или меньшей степени реализуются свойства природной нервной клетки.

3.1. Персептрон

Простой персептрон – обычная модель МакКаллока-Питса с соответствующей стратегией обучения [16, 19]. Структурная схема и обозначения элементов i-го персептрона представлены на рисунке 9.

Рисунок 9 – Структурная схема персептрона

Нелинейная функция активации персептрона представляет собой дискретную функцию ступенчатого типа, где выходной сигнал принимает значения 0 либо 1, - пороговое значение для функции активации персептрона.

, (1)

(2)

Обучение персептрона требует наличие учителя и состоит в таком подборе весов, чтобы выходной сигнал был наиболее близок к целевому значению .

Обучение персептрона осуществляется по следующему алгоритму:

При первоначальных (случайных) наборах значений весов на вход подаётся обучающий вектор x и рассчитывается значение выходного сигнала ;
По результатам сравнения фактически полученного значения с заданным значением уточняются значения весов;
Если значение совпадает с ожидаемым значением , то весовые коэффициенты не изменяются;
Если =0, а , , где tобозначает номер предыдущего цикла, а (t+1) – номер текущего цикла;
Если , а , то ,где tобозначает номер предыдущего цикла, а (t+1) – номер текущего цикла.

По завершении уточнения весовых коэффициентов представляются очередной обучающий вектор x и связанное с ним ожидаемое значение , и значения весов уточняются заново. Этот процесс многократно повторяется на всех обучающих выборках, пока не будут минимизированы различия между всеми значениями и соответствующими им ожидаемыми значениями .

Правило персептрона представляет собой частный случай предложенного позже правила Видроу-Хоффа [23]. В соответствии с этим правилом подбор весовых коэффициентов нейрона проводится по формулам:

, (3)

. (4)

Отсюда, если сигналы и принимают только двоичные значения 0 и 1, то правило Видроу-Хоффа превращается в правило персептрона.

Характерная особенность как правила персептрона, так и обобщенного правила Видроу-Хоффа состоит в использовании для обучения информации только о текущем и ожидаемом значениях выходного сигнала. В связи с разрывностью нелинейной функции активации персептрона невозможно учитывать информацию об изменении значения . Минимизация различий между фактическими реакциями нейрона и ожидаемыми значениями может быть представлена как минимизация конкретной функции погрешности (целевой функции) Е, чаще всего определяемой как

, (5)

где р означает количество предъявляемых обучающих выборок. Минимизация при использовании правила персептрона проводится по методу безградиентной оптимизации.

Персептрон с одним слоем нейронов способен представлять ограниченный класс линейно разделимых образов [6]. Рассмотрим пример применения персептрона для решения задач дихотомии. Тогда на выходе нейрона получим

, (6)

где – выход нейрона, –ступенчатая функция активации, - значение порога.

Предположим, что входные сигналы принимают двоичные значения (0 или 1). В этом случае пространство входных признаков состоит из 4-х возможных комбинаций:


0	0
0	1
1	0
1	1

и может быть представлено на плоскости на рисунке10.

Рисунок 10 – Линейная разделяющая функция

В зависимости от конкретных значений весов и , а так же от значения порога уравнение будет определять прямую на плоскости, разбивающую плоскость признаков на две части, соответствующие двум классам выходных образов. Отсюда следует, что возможности персептрона ограничены классом линейно разделимых образов. Так, персептрон не может реализовать функцию исключающего «ИЛИ», т.к. в этом случае точки (0,0) и (1,1) должны находиться по одну сторону прямой, (1,0) и (0,1) – по другую, что невозможно. Данные рассуждения останутся справедливыми и в случае наличия произвольного числа признаков и выходных классов. Только в этом случае разделяющая функция будет представлять собой гиперплоскость в n-мерном пространстве признаков.

<<< < Предыдущая 1 2 3 4 5 67 / 217 8 9 10 11 12 13 14 15 16 17 18 19 20 21 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
18.05.20155.66 Mб287Учебник Гусейханов КСЕ.doc
#
18.05.2015532.99 Кб582Учебное пособие - Иммунология.doc
#
01.05.20251.99 Mб8Учебное пособие Издательство Пензенского госуда...doc
#
01.05.202551.39 Mб42Учебное пособие по антропологии Ч_АНТР май 2013...doc
#
19.03.20163.91 Mб532Учебное пособие.doc
#
01.07.20251.53 Mб3Учебное пособие_1.docx
#
01.05.20253.27 Mб12Учет и анализ Голдина.doc
#
20.11.201967.58 Кб27учет операций по международным расчетам.doc
#
01.03.2025123.9 Кб6Учет ОС и НМА.doc
#
01.09.201920.66 Кб35Учет товарных потерь.docx
#
01.05.202575.11 Кб0УЧЕТ ЦЕННЫХ БУМАГ 2.docx