Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Московский государственный технический университет им. H.Э.Баумана

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Лекции по нейроинформатике.doc

Скачиваний:

Добавлен:

01.05.2025

Размер:

9.7 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 89 / 319 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Обучение многослойной нейронной сети без обратных связей Математическая постановка задачи обучения

Многие прикладные задачи, решаемые с использованием нейронной сети, такие как задача распознавания образов, задача прогнозирования, задача управления и прочие, сводятся к следующей математической постановке:

Необходимо построить отображение вектора X в Y такое, что на каждый входной сигнал, представленный вектором X, формировался правильный выходной сигнал (вектор Y).

Для решения поставленной задачи будем использовать многослойную нейронную сеть без обратных связей, имеющую n входов и m выходов.

Каждому входу нейронной сети соответствует входной сигнал , , а каждому выходу –выходной сигнал , . Тогда входу НС соответствует вектор X с координатами , выходу – вектор Y с координатами .Нейронная сеть в этом случае представляется как некоторая многомерная функция F: XY.

Если множество весовых коэффициентов входных сигналов НС не упорядочено, то функция F, реализуемая сетью, является произвольной.

Совокупности всех весовых коэффициентов всех нейронов соответствует вектор W. Пусть множество векторов W образует пространство состояний нейросети. Начальному состоянию сети соответствует некоторый произвольный вектор W⁰. Тогда обученной нейросети соответствует W*, т. е. такое состояние, при котором реализуется однозначное отображение F: XY.

Задача обучения нейронной сети: задача перехода от некоторого начального состояния сети, соответствующего W⁰, к конечному состоянию, соответствующему W*.

Для решения задач управления:

X – вектор контролируемых параметров;

Y – вектор кода управления.

Для решения задач прогнозирования:

X – вектор временного ряда контролируемых параметров;

Y – подмножество контролируемых параметров X.

С математической точки зрения задача обучения нейронной сети сводится к продолжению функции, заданной в конечном числе точек, на всю область определения. Входные данные считаются аргументами функции, а ответ сети – значением функции.

В основе процедуры построения отображения F лежит теорема Колмогорова о представлении непрерывных функций нескольких переменных в виде суперпозиции непрерывных функций одной переменной, обобщённая Хехт-Нильсеном применительно к НС:

Для любого множества пар векторов X и Y существует двухслойная однородная (с одинаковыми функциями активации) нейронная сеть с прямым распространением сигналов, которая выполнит отображение XY, выдавая на каждый входной сигнал правильный выходной.

Таким образом, уже с помощью двухслойной нейронной сети может быть построено отображение F (может быть реализована произвольная функция многих переменных).

Теорема о функциональной полноте НС (вытекает из предыдущих теорем):

Любая непрерывная функция,заданная на ограниченном множестве, может быть равномерно приближена функциями, вычисляемыми НС, если функция активации нейрона непрерывна и дважды дифференцируема.

Вывод: многослойный персептрон с числом слоёв более двух является универсальным аппроксиматором функций.

Основной недостаток использования такой сети является то, что в качестве функции активации нейронов может использоваться только сигмоидальная функция. Для преодоления данного недостатка при решении прикладных задач стали использовать сигмоидальную функцию активации с подстраиваемыми параметрами.

С математической точки зрения задача обучения нейронной сети сводится к продолжению функции, заданной в конечном числе точек, на всю область определения. При таком подходе входные данные считаются аргументами функции, а ответ сети – значением функции.

Пусть имеется обучающая выборка, состоящая из k пар векторов (при стратегии обучения с учителем):

, .

Ошибка сети E, появляющаяся в некотором состоянии W_j, может быть представлена как средняя квадратичная ошибка, усреднённая по выборке

, (1)

где k – число примеров в обучающей выборке; Y_i – эталонный выходной вектор i-го примера.

Если сеть не делает ошибки, то E = 0. Следовательно, необходимо, чтобы в обученном состоянии сети ошибка сети стремилась к минимуму.

Задача обучения нейронной сети: поиск минимума функции ошибки в пространстве состояний W.

Алгоритм обучения многослойной нейросети (набор обучающих правил, определяющих изменение межнейронных связей в ответ на входное воздействие):

определённым образом устанавливаются значения весовых коэффициентов межнейронных связей
из базы данных в соответствии с некоторым правилом поочерёдно выбираются примеры (пары обучающей выборки X_i, Y_i:входной вектор X_i подаётся на вход сети, а желаемый результат Y_i на выход сети).
вычисляется ошибка сети E₀ по формуле (1)
если ошибка велика, то осуществляется подстройка весовых коэффициентов для её уменьшения
процесс повторяется до тех пор, пока ошибка не станет меньше заданной, либо закончится время обучения

Ошибка обучения E₀ – внутренний критерий (вычисляется на основе результатов эксперимента – обучения НС на основе примеров из обучающей выборки).

Для оценки полученной ошибки обучения необходимо использовать внешний критерий, которым является ошибка обобщения E_общ., вычисляемая по проверочной (тестовой) выборке.

Необходимо, чтобы созданная модель объекта обладала свойством непротиворечивости: ошибка обобщения сохраняется на приемлемом уровне при реализации отображения не только для примеров исходного множества пар (X_i,Y_i), , но и для всего множества возможных входных векторов.

Таким образом, при синтеза НС для отображения зависимости F: XY с наименьшей ошибкой обучения проводится разделение исходных данных на две части:

обучающая выборка;
тестовая выборка.

Если НС хорошо отслеживает примеры из обучающей выборки, но плохо работает с примерами из тестовой, то возникает эффект переобучения НС, то есть в процессе работы с тестовой выборкой ошибка сети возрастает. Для контроля правильности работы сети вводится подтверждающее множество (подтверждающая выборка), на котором проверяется адекватность получаемого отображения F: XY объекту с задаваемой ошибкой обобщения.

Основные проблемы при обучении НС:

большое число параметров НС ограничение по памяти;
необходимость обеспечения параллельности вычислений; процесс параллелизма важен в процессе функционирования нейронной сети в реальном масштабе времени;
многокритериальность задачи оптимизации;
необходимость нахождения достаточно широкой области, в которой значения всех минимальных функций стремятся к минимуму;
разделение всей базы примеров на обучающую, тестовую и подтверждающую выборки.

<<< < Предыдущая 1 2 3 4 5 6 7 89 / 319 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.07.20251.77 Mб1Лекции по моделированию.doc
#
03.11.2018401.41 Кб20Лекции по начертательной геометрии.doc
#
09.02.20151.63 Mб56Лекции по начертательной геометрии.doc
#
10.02.20152.8 Mб2085Лекции по начертательной геометрии.pdf
#
01.07.202513.46 Mб0Лекции по НГ ИУ.doc
#
01.05.20259.7 Mб2Лекции по нейроинформатике.doc
#
01.05.20251.02 Mб1Лекции по оп. исчислению.docx
#
23.09.2019851.97 Кб15Лекции по ПА и ПО (с пояснениями).doc
#
31.08.20191.2 Mб206Лекции по патологической анатомии.doc
#
01.05.2025424.24 Кб0Лекции по СИИ.docx
#
19.11.20192.57 Mб77Лекции по Спецтехнологиям ГТиКУ by Абрамов+Треф...doc