5.7.2. Обучение Коши

В этом методе распределение Больцмана заменяется на распределение Коши. Распределение Коши имеет, как показано на рис. 6.19, более высокую вероятность больших шагов. Дисперсия распределения Коши бесконечна. С помощью такого простого изменения максимальная скорость уменьшения температуры становится обратно пропорциональной линейной величине, а не логарифму, как для алгоритма обучения Больцмана. Эта связь может быть выражена следующим образом: Таким образом, время обучения резко уменьшается. Распределение Коши имеет вид

где - вероятность принять изменение веса .

Несмотря на улучшение скорости обучения, даваемое распределением Коши по сравнению с распределением Больцмана, время сходимости все еще может в 100 раз превышать время для алгоритма обратного распространения.

Рис. 6.19. Распределение Коши и распределение Больцмана

Комбинирование обратного распространения с обучением Коши. Коррекция весов в комбинированном алгоритме, использующем обратное распространение и обучение Коши, состоит из двух компонент: компоненты, вычисляемой с использованием алгоритма обратного распространения, и случайной компоненты, определяемой распределением Коши.

Эти компоненты вычисляются для каждого веса, и их сумма является величиной, на которую изменяется вес. Как и в алгоритме Коши, после вычисления изменения веса вычисляется целевая функция. Если имеет место улучшение, изменение сохраняется. В противном случае оно сохраняется с вероятностью, определяемой распределением Коши.

Коррекция веса вычисляется с использованием представленных ранее уравнений для каждого из алгоритмов:

где — коэффициент, управляющий относительными величинами обучения Коши и обратного распространения в компонентах весового шага. Если приравнивается нулю, метод становится обучением Коши. Если приравнивается единице, метод становится алгоритмом обратного распространения.

Комбинированная сеть, использующая обратное распространение и обучение Коши, обучается быстрее, чем каждый из алгоритмов в отдельности. Сходимость к глобальному минимуму гарантируется алгоритмом Коши, и во многих экспериментах по обучению сеть практически не попадала в локальные минимумы.

Упражнения

5.11. Стохастические нейронные сети можно использовать для поиска глобального минимума в невыпуклых или не имеющих строгой математической формализации задачах оптимизации. На первом этапе обучения, например по методу Коши, подстраиваются весовые коэффициенты сети так, чтобы она аппроксимировала данную функцию (в качестве обучающей выборки используются наборы значений переменных, для которых известно значение функции). На втором этапе весовые коэффициенты сети остаются без изменения, а определению подлежат входные значения сети, которые пересчитываются по тому же закону, что и весовые коэффициенты, но в качестве функции ошибки используется оптимизируемая функция, аппроксимируемая данной сетью (за ее уменьшением или увеличением должен следить алгоритм обучения). Напишите программу, определяющую с помощью обучения Коши глобальный минимум функции на отрезке [—2, 2].

5.12. Напишите программу, обучающую стохастическую сеть распознаванию цифр. На вход сети подаются графические изображения цифр, разбитые на квадраты (или пиксели) так же, как для однослойного персептрона или сети обратного распространения. Используйте не менее 15—20 различных написаний цифр. Выходом сети служит двоичное представление входной цифры.

<<< < Предыдущая 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 3132 / 3732 33 34 35 36 37 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.07.2025168.48 Кб2tsd_shpory.docx
#
23.09.2019353.79 Кб8turizm.doc
#
23.03.201637.97 Кб6TZ (1).docx
#
19.11.201967.07 Кб2Tz_ParmenovaOA.doc
#
23.03.2016596.4 Кб119Uch.posobie_Plastichnost.pdf
#
01.03.20254.13 Mб1Uchebnik_SII_po_red_Astakhovoy_14_shrift.doc
#
10.02.20156.51 Mб123Uchebnoe_posobie_Inventor_2009_11_10_1.pdf
#
01.05.20253.42 Mб0UChPU_Kontrollery_elektroavtomatiki.docx
#
01.05.2025424.96 Кб0UChPU_Kontrollery_izmeritelnykh_sistem.doc
#
01.05.2025809.47 Кб0UChPU_Logiko-vychislitelny_blok.doc
#
09.11.20193 Mб2Ukaz_kursov_rab_ex12.doc