Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Одесский национальный университет им. И.И. Мечникова

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Downloads / 0208215_96D21_voronovkiy_g_k_geneticheskie_algoritmy_iskusstvennye_neyronn.pdf

Скачиваний:

Добавлен:

20.05.2015

Размер:

1.21 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 67 / 127 8 9 10 11 12 > Следующая >>>

Алгоритм обратного распространения ошибки

Шаг 1. Инициализация весов и смещений.

,(*)	,(*)}	во всех слоях задаются случайным обра
Веса щ	и смещения щй	во всех слоях задаются случайным обра

зом как маленькие величины, например, в интервале от-1 до +1.

•Шаг 2. Представление нового входного вектора X и соответствующего желаемого выходного вектора О.

•Шаг 3. Прямой проход: расчет фактического выхода.

Вычисление выхода У; для /-го узла в к-м скрытом слое, к=1,...,К, и У1 в выходном слое:

		IIк I	\
-(*)	/с	,(*)	(Ы-1) (к = \>...>К\тдеУ^=Хр
	/с
		./=1

Ъ = /с ^+%^ГХК)

Здесь Нк — количество узлов в к-м скрытом слое.

Шаг 4. Обратный проход: адаптация весов и порогов. Использование рекурсивного алгоритма, начинающегося на выход ных узлах и возвращающегося к первому скрытому слою:

Для к=К+\ член 5; , описывающий ошибку, известен:

6,- ^ = (/3, - У;)УГ([-У;) и его можно рекурсивно посчитать для всех других случаев:

5р) = ур(\-у.^8^+1Ц+1)(к = \,...,К).

Отметим, что член У>к'\[ — У>к*) является производной сигмоидальной функции относительно ее аргумента. Если используется другая пороговая функция, этот член необходимо изменить. Обучающий параметр Г| обычно выбирается в интервале от 0 до +1.

• Шаг 5. Повторение от шага 2.

пых процедур), их вычислительные способности слишком ограничены. Выход из этого положения — добавление скрытых слоев с нелинейными нейронами — был известен и тогда, однако не было ясности, как настро ить веса у такой сети.

Настоящий прогресс был достигнут лишь после того, как Румельхарт, Хинтон и Вильяме в 1986 последовательно переоткрыли Алгоритм Обрат ного Распространения ошибки (АОР) [11, 12], впервые описанный Вербосом в 1974 году [13].

Уместно также вспомнить работы новосибирских ученых [14,15], неза висимо и одновременно с Румельхартом предложивших очень близкий к АОР Алгоритм Двойственного Функционирования для обучения нейрон ной сети.Хотя АОР рассеял пессимизм о возможности обучения многослойных сетей, он, тем не менее, не стал инструментом, который позволил бы решить коренной вопрос синтеза нейронных сетей — глобальную оптимизацию структуры и параметров сети. Инициализация начальных параметров сети осуществляется здесь случайным образом, а сам АОР, известный в статистике как метод стохастической аппроксима ции, является по своей сути не более чем локальным методом и в силу этого не гарантирует окончания процесса обучения в точке глобального экстремума. Вместе с тем, не вызывает сомнений, что ошибка (4), используемая для оценки качества ИНС, является многоэкстремальной функцией параметров сети, поэтому для поиска ее минимума требуется, соответственно, глобальный метод.

Тем не менее, с появлением АОР интерес к нейронным сетям снова возродился. Нельзя игнорировать и тот факт, что к концу 80-х годов общая ситуация в мире науки существенно изменилась по сравнению с 60-тыми — прогресс в разработке персональных компьютеров существен но раздвинул границы численного экспериментирования, началась эра численных методов моделирования. Искусственные нейронные сети ста новятся массовым увлечением и через своих поклонников проникают в самые разные научные дисциплины.

Последние 10 лет ознаменовались двумя событиями, имеющими отно шение к теме нашего исследования. Первое из них — появление КВР-сетей, поддающихся очень простой, не содержащей рекурсии, на стройке [16]. Второе — применение ГА для тренировки сети произвольной архитектуры, содержащей любые комбинации активационных функций нейронов скрытого слоя [17].

Большое внимание уделялось также доказательству универсальности нейронных сетей для решения задач аппроксимации произвольной функ ции с любой степенью точности. В [18—19] это сделано для сетей перцептронного типа с сигмоидальными активационными функциями, в [20] — для КВР-сетей.

Рассмотрим процедуру тренировки КВР-сети (см. Рис.12), осуществ ляющей аппроксимацию функции, заданной в неявном виде набором шаб лонов, как она описана в [16].

Пусть V— количество входов сети, Н— количество нейронов скрыто го слоя, 2— количество выходов сети.

Предположим, что размер () набора тренировочных шаблонов Е не слишком велик и что шаблоны размещены достаточно разреженно в про странстве входных сигналов сети Х=(ХЬХ2, ...,Ху).

|х-=,|2

V//	е	°?
V//	е	*		У),2 А
		\Х-С2\\		X
хШ				ь^
хШ
хШ\		\|Х-с„\|!
			1
	в	°"
	в	°"

11Х-С12||2

„1

е°п

Рис. 12. Классическая ЯВР-сеть

Сеть характеризуется тремя особенностями: 1) единственный скрытый слой; 2) только нейроны скрытого слоя имеют нелинейную активационную функцию; 3) синаптические веса всех нейронов скры того слоя равны единице.

Введем следующие обозначения:

с = (с|,с2 ,...,с{ / )— вектор координат центра активационной функции ней рона скрытого слоя;

оI — ширина окна активационной функции у-го нейрона скрытого слоя;

*Ы Л\	-\|\|Х-с\|\|2/а2	-ГфГс}Г^
*Ы Л\	-\|\|Х-с\|\|2/а2	Д
у{Х,с) = е	" "' -е }	радиально-симметричная активаци-

онная функция нейрона скрытого слоя; щ — вес связи между /-м нейроном выходного слоя иу'-м нейроном скры

того слоя.

Синтез и обучение сети включает в себя три этапа, объединенные сле дующим алгоритмом.

Алгоритм синтеза КВР-сети

1. Выберем размер скрытого слоя Н равным количеству тренировоч ных шаблонов (). Синаптические веса нейронов скрытого слоя при мем равными 1.

2.Разместим центры активационных функций нейронов срытого слоя в точках пространства входных сигналов сети, которые входят в набор тренировочных шаблонов Е: с . = X ., ] = 1, Н.

3.Выберем ширины окон активационных функций нейронов срытого

слоя а / 5 } - \,И достаточно большими, но так, чтобы они не накла дывались друг на друга в пространстве входных сигналов сети.

4. Определим веса нейронов выходного слоя сети у?.., 1=\,2] = \,Н.

Для этого предъявим сети весь набор тренировочных шаблонов. Вы ход /-го нейрона выходного слоя дляр-го шаблона будет равен:

^=гул /(Х/ ,,с1 )+гу/ 2 /(Х/ ,,с2 )+... + гу//;/(Х/,,ся)=

Расписав это уравнение для всех выходов сети и всех шаблонов, по лучим следующее уравнение в матричной форме:

			ФЛУ1 =Т>,		(6)
		' / ,	.Л//
где	Ф =	./;21	У 2 Я	интерполяционная	матрица,
		] Н\	1НН ;
^.=/(х,,х.);
	щ	\У]/.
	И
УУ	=		матрица выходных синаптических весов;
	И'/Л
	д	АН
О			матрица выходных шаблонов.
	д'н\	[)	и/.
Решение
			ЛУ1	=Ф _ 1 Б	(7)

даст нам искомые значения выходных синаптических весов, обеспе чивающие прохождение интерполяционной поверхности через тре нировочные шаблоны в пространстве выходных сигналов сети.

Ошибка аппроксимации в точках входного пространства, не совпа дающих с центрами активационных функций, зависит от того, насколько удачно выбраны ширины окон, и адекватно ли количество тренировочных шаблонов сложности функционального преобразования.

К сожалению, процедура настройки синаптических весов является да леко не единственной и не последней проблемой, встречающейся при обу чении сети. Куда как более сложным вопросом остается формирование набора тренировочных шаблонов, адекватно описывающего рассматри ваемое функциональное преобразование. К этой проблеме мы еще вернем ся в следующих разделах.

<<< < Предыдущая 1 2 3 4 5 67 / 127 8 9 10 11 12 > Следующая >>>

Соседние файлы в папке Downloads

#
20.05.2015778.59 Кб560177413_EC0A1_batishev_d_i_neymark_e_a_starostin_n_v_primenenie_genetiches.pdf
#
20.05.20151.21 Mб320208215_96D21_voronovkiy_g_k_geneticheskie_algoritmy_iskusstvennye_neyronn.pdf
#
20.05.201544.79 Кб170972894_68451_referat_geneticheskie_algoritmy.docx
#
20.05.20153.17 Mб20aspu08 (1).pdf
#
20.05.20153.17 Mб19aspu08.pdf
#
20.05.2015245.65 Кб18holland_2000.pdf