Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Miapr_shporpak_RC1_post_Shpory.docx
Скачиваний:
1
Добавлен:
01.05.2025
Размер:
4.98 Mб
Скачать

44. Принципы построения и действия искусственной нейронной сети

Каждый нейрон можно считать своеобразным процессором. Он суммирует веса сигналов, приходящих от других нейронов, выполняет нелинейную решающую функцию и передает результат следующим нейронам.

Искусственная нейронная сеть – это совокупность моделей биологических нейронных сетей. Большинство моделей нейронных сетей требует обучения. В общем случае – это выбор параметров сети, при которых сеть лучше всего решает поставленную задачу.

Обучение – это задача многомерной оптимизации и для её решения существует множество алгоритмов.

Нейронная сеть – средство обработки информации, включающее в себя:

  1. Гибкую модель для нелинейной аппроксимации многомерных функций

  2. Средство прогнозирования во времени для процессов, зависящих от многих переменных

  3. Классификатор по многим признакам, дающий разбиение входного пространства на области

  4. Средство распознавания образов

  5. Инструмент для поиска по ассоциациям

Современные искусственные сети демонстрируют свойства:

  1. Обучаемость. Выбрав одну из моделей сети, построив сеть и обучив её, мы можем решать задачи, схожие с теми, на которых её обучали

  2. Способность к обобщению. После обучения сеть становится нечувствительной к малым изменения входных сигналов (шума или небольших изменений входных образов) и даёт корректный результат на выходе.

  3. Способность к абстрагированию. Если предъявить сети несколько искаженных вариантов входного образа, то она может создать на выходе корректный результат, с которым никогда не встречалась.

К задачам, успешно решаемым нейронной сетью, относят те, которые человек решает лучше, чем машина:

  • Распознавание различных образов

  • Ассоциативный поиск информации

  • Задачи прогнозирования и построения моделей

Ф ормальный нейрон

– входные сигналы

– весовые коэффициенты

Несмотря на простоту формального нейрона, сети, построенные из таких элементов, могут сформировать произвольную многомерную функцию на выходе.

Нейрон состоит из взвешенного сумматора и нелинейного элемента. Функционирование нейрона определяется формулами:

– взвешенная сумма входных сигналов. Её значение передается на нелинейный элемент

– пороговый уровень данного нейрона

- нелинейная функция активации

Каждый нейрон имеет несколько входов и 1 выходной сигнал (OUT). Параметрами нейрона, определяющими его работу является вектор

Выбор функции определяется

  1. Спецификой задачи

  2. Удобством реализации на вычислительной технике

  3. Алгоритмом обучения

, поскольку некоторые алгоритмы накладывают ограничение на выбор функции активации.

45. Инс в виде многослойного персептрона

Ф ормальные нейроны могут объединяться в сети различным образом. Однако, одним из самых распространённых видов сети стал многослойный персептрон.

Сеть состоит из произвольного количества слоёв нейронов. Нейроны каждого слоя соединяются с нейронами предыдущего и последующего слоёв по принципу «каждый с каждым».

Первый слой называется сенсорным или входным. Внутренние слои ­– скрытыми или ассоциативными. Последний состоит из одного нейрона и называется выходным или результативным слоем. Количество нейронов в слоях может быть произвольным, но для удобства работы во всех скрытых слоях выбирают одинаковое количество нейронов.

Существует разночтение с подсчётом количества слоев в сети. Входной слой не выполняет никаких вычислений, а только распределяет входные сигналы. Поэтому иногда его не учитывают при подсчёте слоев.

Работа многослойного персептрона как абстрактной сети также определяется формулами

– сигнал j-го нейрона в слое l

– пороговый уровень данного нейрона

- нелинейная функция активации

, , где – номер входа, – номер нейрона в слое, – номер слоя

Каждый слой сети вычисляет нелинейное преобразование от линейной комбинации сигналов предыдущего слоя. Следовательно, линейная функция активации может применяться только для тех моделей сетей, где не требуется последовательное соединение слоёв нейронов друг за другом. Для многослойных сетей функция активации должна быть нелинейной, иначе можно построить эквивалентную однослойную сеть и многослойность окажется ненужно, т.к. линейная функция активации будет давать на выходе линейную комбинацию входов.

Многослойная сеть может формировать на выходе произвольную многомерную функцию при соответствующем выборе количества слоёв в диапазоне изменения сигналов и параметров нейронов.

В многослойном персептроне нет обратных связей, поэтому такие модели называются сетями прямого распространения. Они не позволяют без дополнительных действий моделировать развитие динамических систем.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]