Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Казанский федеральный университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

часть II Искусственный интеллект.doc

Скачиваний:

Добавлен:

01.05.2025

Размер:

4.04 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 67 / 427 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

8.5. Алгоритм «обучение с учителем».

Алгоритм обратного распространения ошибки (обучение с учителем) - это итеративный градиентный алгоритм обучения, который используется с целью минимизации среднеквадратичного отклонения текущих от требуемых выходов многослойных нейронных сетей с последовательными связями.

Согласно методу наименьших квадратов, минимизируемой целевой функцией ошибки нейронной сети является величина:

E(w)=0,5(y_j_,_k⁽^Q⁾– d_j_,_k)²,

где y_j_,_k⁽^Q⁾ - реальное выходное состояние нейрона j выходного слоя нейронной сети при подаче на ее входы k-го образа; d_j_,_k - требуемое выходное состояние этого нейрона.

Суммирование ведется по всем по всем нейронам выходного слоя и по всем обрабатываемым сетью образам. Минимизация методом градиентного спуска обеспечивает подстройку весовых коэффициентов следующим образом:

E

w_ij⁽^q⁾ ,

 w_ij

где w_ij⁽^q⁾ - весовой коэффициент синаптической связи, соединяющей i-й нейрон слоя (q-1) с j-м нейроном слоя q; - коэффициент скорости обучения, 0 <  <1.

В соответствии с правилом дифференцирования сложной функции:

E E dy_js_j

= × × ,

 w_ijy_jds_j  w_ij

где s_j - взвешенная сумма входных сигналов нейрона j, т. е. аргумент активационной функции. Так как производная активационной функции должна быть определена на всей оси абсцисс, то функция единичного скачка и прочие активационные функции с неоднородностями не подходят для рассматриваемых нейронных сетей. В них применяются такие гладкие функции, как гиперболический тангенс или классический сигмоид с экспонентой . Например, в случае гиперболического тангенса:

= 1 – s² .

После несложных преобразований можно получить, что:

w_ij⁽^q⁾_j⁽^q⁾ × y_i⁽^q^-1) ,

dy_j

г де: _j⁽^q⁾  _r⁽^q⁺¹⁾ w_jr⁽^q⁺¹⁾ ds_j.

Таким образом, полный алгоритм обучения нейронной сети с помощью процедуры обратного распространения строится следующим образом.

ШАГ 1. Подать на входы сети один из возможных образов и в режиме обычного функционирования нейронной сети, когда сигналы распространяются от входов к выходам, рассчитать значения y последних.

ШАГ 2. Рассчитать ^(Q)и соответствующее изменение весов w^(Q)для выходного слоя Q.

ШАГ 3. Рассчитать по формулам ⁽^q⁾ и соответственно w⁽^q⁾ для всех остальных слоев, q=(Q-1)…1.

ШАГ 4. Скорректировать все веса в нейронной сети:

w_ij⁽^q⁾(t)  w_ij⁽^q⁾(t-1) + w_ij⁽^q⁾(t).

ШАГ 5. Если ошибка сети существенна, перейти на шаг 1. В противном случае - конец.

Сети на шаге 1 попеременно в случайном порядке предъявляются все тренировочные образы, чтобы сеть, образно говоря, не забывали одни по мере запоминания других. Рассмотрим вопрос о емкости нейронной сёти, т. е. числа образов, предъявляемых на ее входы, которые она способна научиться распознавать. Для сетей с числом слоев больше двух, этот вопрос остается открытым. Для сетей с двумя слоями, детерминистская емкость сети Cd оценивается следующим образом:

L_wL_w L_w

m  Cd  m log m  ,

где L_w - число подстраиваемых весов, m - число нейронов в выходном слое.

Рассмотренный алгоритм обратного распространения ошибки подразумевает наличие некоего внешнего звена (d_j_,_k), предоставляющего нейронной сети, кроме входных, целевые выходные образы. Алгоритмы, основанные на подобной концепции, называются

алгоритмами обучения с учителем. Для их успешного функционирования необходимо наличие экспертов, задающих на предварительном этапе для каждого входного образа эталонного выходного.

<<< < Предыдущая 1 2 3 4 5 67 / 427 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
22.09.201955.45 Кб5часть 2 бкг.docx
#
10.02.201587.11 Кб5часть 2.docx
#
10.02.201565.9 Кб7часть 3.docx
#
17.11.2019645.63 Кб3Часть 9 испр.doc
#
01.05.20256.07 Mб0часть I Искусственный интеллект.doc
#
01.05.20254.04 Mб1часть II Искусственный интеллект.doc
#
22.11.2018641.02 Кб19Часть1.doc
#
28.09.20192.17 Mб5часть2-методики-черновик-обр.doc
#
01.07.2025684.03 Кб0Человек в поисках идентичности.doc
#
10.02.2015280.69 Кб169Чему учить щенка.docx
#
01.03.2025572.42 Кб0Черновой вариант лекций по дисциплине Финансы и...doc