3.4.1. Дельта-правило

Важное обобщение алгоритма обучения персептрона [60], называемое дельта-правилом, переносит этот метод на непрерывные входы и выходы. Чтобы понять, как оно было получено, шаг 2 алгоритма обучения персептрона может быть сформулирован в обобщенной форме с помощью введения величины δ, которая равна разности между требуемым или целевым выходом t и реальным выходом o [74].

Тогда если требуемый вход i-ого элемента обозначить , а наблюдаемый на самом деле , то ошибка для образца p может быть записана исходя из метода наименьших квадратов, следующим образом:

, (3.2)

а полная ошибка E для сети будет равна соответственно:

Случай, когда δ=0, соответствует шагу 2а, когда выход правилен и в сети ничего не изменяется. Шаг 2б соответствует случаю δ > 0, а шаг 2в случаю δ < 0.

В любом из этих случаев персептронный алгоритм обучения сохраняется, если δ умножается на величину каждого входа х_i и это произведение добавляется к соответствующему весу. С целью обобщения вводится коэффициент «скорости обучения» η), который умножается на δх_i, что позволяет управлять средней величиной изменения весов [75].

В алгебраической форме записи

Δw_i = ηδx_i, (3.3)

w(n+1) = w(n) + Δw_i, (3.4) (3.4)

где Δw_i – коррекция, связанная с i-м входом х_i; w_i(n+1) – значение веса i после коррекции; w_i(n) -значение веса i до коррекции.

Дельта-правило модифицирует веса в соответствии с требуемым и действительным значениями выхода каждой полярности как для непрерывных, так и для бинарных входов и выходов [32]. Эти свойства открыли множество новых приложений.

Может оказаться затруднительным определить, выполнено ли условие разделимости для конкретного обучающего множества. Кроме того, во многих встречающихся на практике ситуациях входы часто меняются во времени и могут быть разделимы в один момент времени и неразделимы в другой [64]. В доказательстве алгоритма обучения персептрона ничего не говорится также о том, сколько шагов требуется для обучения сети. Мало утешительного в знании того, что обучение закончится за конечное число шагов, если необходимое для этого время сравнимо с геологической эпохой. Кроме того, не доказано, что персептронный алгоритм обучения более быстр по сравнению с простым перебором всех возможных значений весов, и в некоторых случаях этот примитивный подход может оказаться лучше [82].

На эти вопросы никогда не находилось удовлетворительного ответа, они относятся к природе обучающего материала. Ответы для современных сетей как правило не более удовлетворительны, чем для персептрона. Эти проблемы являются важной областью современных исследований.

3.4.2. Процедура обратного распространения

Разработка алгоритма обратного распространения сыграла важную роль в возрождении интереса к искусственным нейронным сетям. Обратное распространение – это систематический метод для обучения многослойных искусственных нейронных сетей. Он имеет солидное математическое обоснование. Несмотря на некоторые ограничения, процедура обратного распространения сильно расширила область проблем, в которых могут быть использованы искусственные нейронные сети, и убедительно продемонстрировала свою мощь [82].

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1718 / 2318 19 20 21 22 23 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
30.04.20222.36 Mб6332.doc
#
30.04.20222.38 Mб6333.doc
#
30.04.20222.4 Mб16334.doc
#
30.04.20222.43 Mб8335.doc
#
30.04.20222.43 Mб7336.doc
#
30.04.20222.47 Mб26337.doc
#
30.04.20222.51 Mб10338.doc
#
30.04.20222.52 Mб47339.doc
#
30.04.2022616.45 Кб934.doc
#
30.04.20222.53 Mб15340.doc
#
30.04.20222.55 Mб10341.doc