Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Московский государственный технический университет им. H.Э.Баумана

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Uchebnik_SII_po_red_Astakhovoy_14_shrift.doc

Скачиваний:

Добавлен:

01.03.2025

Размер:

4.13 Mб

Скачать

☆

<<< < Предыдущая 11 12 13 14 15 16 17 18 19 20 21 2223 / 3723 24 25 26 27 28 29 30 31 32 33 34 35 > Следующая >>>

5.2.2. Обучение искусственных нейронных сетей

Сеть обучается, чтобы для некоторого множества входов давать требуемое (или, по крайней мере, сообразное с ним) множество выходов. Каждое такое входное (или выходное) множество рассматривается как вектор. Обучение осуществляется путем последовательного предъявления входных векторов с одновременной подстройкой весов в соответствии с определенной процедурой. В процессе обучения веса сети постепенно становятся такими, чтобы каждый входной вектор вырабатывал выходной вектор. Различают алгоритмы обучения с учителем и без учителя.

Обучение с учителем предполагает, что для каждого входного вектора существует целевой вектор, представляющий собой требуемый выход. Вместе они называются обучающей парой. Обычно сеть обучается на некотором числе таких обучающих пар. Предъявляется выходной вектор, вычисляется выход сети и сравнивается с соответствующим целевым вектором, разность (ошибка) с помощью обратной связи подается в сеть, и веса изменяются в соответствии с алгоритмом, стремящимся минимизировать ошибку. Векторы обучающего множества предъявляются последовательно, для каждого вектора вычисляются ошибки и подстраиваются веса до тех пор, пока ошибка по всему обучающему массиву не достигнет приемлемо низкого уровня.

Обучение без учителя не нуждается в целевом векторе для выходов и, следовательно, не требует сравнения с предопределенными идеальными ответами. Обучающее множество состоит лишь из входных векторов. Обучающий алгоритм подстраивает веса сети так, чтобы получались согласованные выходные векторы, т. е. чтобы предъявление достаточно близких входных векторов давало одинаковые выходы. Процесс обучения, следовательно, выделяет статистические свойства обучающего множества и группирует сходные векторы в классы. Предъявление на вход вектора из данного класса даст определенный выходной вектор, но до обучения невозможно предсказать, какой выход будет производиться данным классом входных векторов. Следовательно, выходы подобной сети должны трансформироваться в некоторую понятную форму, обусловленную процессом обучения.

5.3. Теорема Колмогорова

Рассмотрим в качестве примера двухслойную нейронную сеть с n входами и одним выходом, которая достаточно проста по структуре и в то же время широко используется для решения прикладных задач. Эта сеть изображена на рис. 6.6. Каждый i-й нейрон первого слоя имеет n входов, которым приписаны веса

Рис. 6.6. Пример нейронной сети

Получив входные сигналы, нейрон суммирует их с соответствующими весами, затем применяет к этой сумме передаточную функцию и пересылает результат на вход нейрона второго (выходного) слоя. В свою очередь, нейрон выходного слоя суммирует полученные от второго слоя сигналы с некоторыми весами Для определенности будем предполагать, что передаточные функции в скрытом слое являются сигмоидальными, а в выходном слое используется тождественная функция, т. е. взвешенная сумма выходов второго слоя и будет ответом сети.

Подавая на входы любые числа мы получим на выходе значение некоторой функции которое является ответом (реакцией) сети. Очевидно, что ответ сети зависит как от входного сигнала, так и от значений ее внутренних параметров - весов нейронов. Выпишем точный вид этой функции:

где

В 1957 году математик А. Н. Колмогоров доказал следующую теорему.

Теорема Колмогорова. Любая непрерывная функция F, определенная на n-мерном единичном кубе, может быть представлена в виде суммы суперпозиций непрерывных и монотонных отображений единичных отрезков:

где и - непрерывные функции, причем не зависят от функции F.

Эта теорема означает, что для реализации функций многих переменных достаточно операций суммирования и композиции функций одной переменной. К сожалению, при всей своей математической красоте, теорема Колмогорова малоприменима на практике. Это связано с тем, что функции - в общем случае негладкие и трудновычислимые; также неясно, каким образом можно подбирать функции для данной функции F. Роль этой теоремы состоит в том, что она показала принципиальную возможность реализации сколь угодно сложных зависимостей с помощью относительно простых автоматов типа нейронных сетей. Более значимые для практики результаты в этом направлении были получены только в 1989 году, зато одновременно несколькими исследователями.

Пусть - любая непрерывная функция, определенная на ограниченном множестве, и - любое сколь угодно малое число, означающее точность аппроксимации. Через обозначена сигмоидальная функция.

Теорема. Существуют число m, набор чисел , и набор чисел такие, что функция

приближает данную функцию с погрешностью не более е на всей области определения.

Легко заметить, что эта формула полностью совпадает с выражением, полученным для функции, реализуемой нейросетью. В терминах теории нейросетей эта теорема формулируется так: любую непрерывную функцию нескольких переменных можно с любой точностью реализовать с помощью двухслойной нейросети с достаточным количеством нейронов в скрытом слое.

<<< < Предыдущая 11 12 13 14 15 16 17 18 19 20 21 2223 / 3723 24 25 26 27 28 29 30 31 32 33 34 35 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.07.2025168.48 Кб2tsd_shpory.docx
#
23.09.2019353.79 Кб8turizm.doc
#
23.03.201637.97 Кб6TZ (1).docx
#
19.11.201967.07 Кб2Tz_ParmenovaOA.doc
#
23.03.2016596.4 Кб119Uch.posobie_Plastichnost.pdf
#
01.03.20254.13 Mб1Uchebnik_SII_po_red_Astakhovoy_14_shrift.doc
#
10.02.20156.51 Mб123Uchebnoe_posobie_Inventor_2009_11_10_1.pdf
#
01.05.20253.42 Mб0UChPU_Kontrollery_elektroavtomatiki.docx
#
01.05.2025424.96 Кб0UChPU_Kontrollery_izmeritelnykh_sistem.doc
#
01.05.2025809.47 Кб0UChPU_Logiko-vychislitelny_blok.doc
#
09.11.20193 Mб2Ukaz_kursov_rab_ex12.doc