Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ответики.docx
Скачиваний:
119
Добавлен:
13.03.2016
Размер:
684.82 Кб
Скачать

9. Использование возможностей нейронных сетей для анализа данных

Одним из эффективных и точных современных методов моделирования является моделирование с помощью нейронных сетей [4]. Идея нейронных сетей возникла в результате попыток смоделировать деятельность человеческо-го мозга. Мозг воспринимает воздействия, поступающие из внешней среды, и обучается на собственном опыте. Идея нейрона является обобщающей: она синтезирует биологические представления с математическими образами. Такого рода идеи на стыке мате-матики и биологии характерны для науки XX века.

Модель нейронной сети состоит из простых нейронов, которые объеди-нены в группы (слои). У сети есть некоторое количество входов и выходов, зависящее от условий задачи: X1, X2, X3, …, Xn – входные данные (факторы производственной среды); Y’1, Y’2, Y’3, …, Y’m – выходные данные (показатели производственного риска).

Пример модели нейронной сети показан на рис.

Самый важный и трудоёмкий процесс работы модели – это обучение. В модель, обучающуюся с учителем, на вход подаются статистические значе-ния независимых переменных (факторов производственной среды). Затем эти значения суммируются и поступают на нейроны первого слоя. Там они обраба-тываются при помощи функции активации, которая в свою очередь может быть как линейной так и нелинейной. На выходе получаются некоторые значения, вновь суммируемые и поступающие на вход нейронов следующего слоя. Обыч- но, в моделях нейронной сети имеются один и или два скрытых слоя (без учёта входного и выходного слоёв). Результирующий сигнал, полученный на выходе модели, сравнивается с фактическим значением зависимой переменой из выборки исходных данных. Затем вычисляется ошибка сети и оценивается её приемлемость. При больших значениях ошибки выполняется пересчет весовых коэффициентов модели по методу обратного распространения ошибок и происходит обучение нейрон- ной сети. Процедура обучения проходит в несколько итераций и после её оконча-ния сеть готова давать прогноз. Вышеизложенный алгоритм работы нейронной сети справедлив для решения многих слабо структурированных задач, нереша-емых прямыми аналитическими методами.

По сравнению с традиционными технологиями, нейронные сети имеют следующие достоинства: - универсальность – нейронные сети не зависят от свойств входных дан-ных, для них не существует требования к определенному типу распределения исходных данных, либо требования к линейности целевых функций; - простота – использование нейронных сетей не требует специальной подготовки, для практического применения нет необходимости глубоко вни-кать во внутренние механизмы работы сети, в отличие от статистических мето- дов, требующих фундаментальных знаний теории вероятностей и математиче- ской статистики; - не существует проблемы "проклятия размерности". Они способны моде-лировать зависимости в случае большого числа переменных; - ускоряют процесс нахождения зависимости за счет одновременной об- работки данных всеми нейронами.

Основными интересными на практике возможностями нейронных сетей являются следующие:

  • Гибкость структуры: можно различными способами комбинировать элементы нейросети (нейроны и связи между ними). За счёт этого на одной "элементной базе" и даже внутри "тела" одного нейрокомпьютера можно создавать совершенно разные вычислительные схемы, подбирать оптимальное для конкретной задачи число нейронов и слоёв сети.

  • Быстрые алгоритмы обучения нейронных сетей: нейросеть даже при сотнях входных сигналов и десятках-сотнях тысяч эталонных ситуаций может быть почти мгновенно обучена на обычном компьютере. Поэтомуприменение нейронных сетейвозможно для решения широкого круга сложных задач прогноза, классификации и диагностики.

  • Возможность работы при наличии большого числа неинформативных, избыточных, шумовых входных сигналов − предварительного их отсева делать не нужно, нейросетьсама определит их малопригодность для решения задачи и может их явно отбросить.

  • Возможность работы со скоррелированными независимыми переменными, с разнотипной информацией (измеренной в непрерывнозначных, дискретнозначных, номинальных, булевых шкалах), что часто доставляет затруднение методам статистики.

  • Нейронная сеть одновременно может решать несколько задач на едином наборе входных сигналов − имея несколько выходов, прогнозировать значения нескольких показателей. Часто это помогает нейросети построить более адекватные или более универсальные "внутренние"-промежуточные концепции (т.к. требуется, чтобы все эти промежуточные расчёты были пригодны не для одной, а для нескольких задач сразу) и, вследствие этого, повысить точности решения этих задач по сравнению с решениями задач по-отдельности.

  • Алгоритмы обучения накладывают достаточно мало требований на структуру нейронной сети и свойства нейронов. Поэтому при наличии экспертных знаний или в случае специальных требований можно целенаправленно выбирать вид и свойства нейронов, собирать структуру нейронной сети вручную из отдельных элементов, и задавать для каждого из них нужные характеристики или ограничения.

  • Нейросеть может обучиться решению задачи, которую человек-эксперт решает недостаточно точно (или для которой вообще отсутствует эксперт). Обученная сеть может быть представлена в виде явного алгоритма решения задачи, например, в виде набора правил "если …, то …", и изучение этого алгоритма может позволить человеку получить новые знания.

  • Синтезированная (обученная) нейросеть обладает устойчивостью к отказам отдельных элементов (нейронов) и линий передачи информации в ней. За счёт того, что навык решения задачи "размазан" по сети, не происходит катастрофического падения точности решения при выходе из строя нескольких элементов системы. Можно применять и специальные методы для повышения отказоустойчивости. Это бывает востребованным при аппаратных реализациях сетей − для обеспечения построения надёжных систем из ненадёжных элементов.

  • Высокая потенциальная параллельность вычислений (например, одновременное параллельное функционирование нейронов некоторого слоя сети) позволяет эффективно задействовать возможности современной вычислительной техники (от использования SIMD-команд до многопоточности и многопроцессорности) − что ускоряет процессы нейромоделирования и/или позволяет использовать синтезированные модели для решения задач реального времени.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]