- •Лекция 1. Введение в интеллектуальные информационные технологии
- •Основные сведения из истории создания ис
- •Лекция 2. Представление знаний
- •2.1. Модели представления знаний
- •Логическая модель представления знаний
- •2.2.2. Продукционная модель представления знаний.
- •2.2.3. Семантическая модель представления знаний
- •2.2.4. Фреймовая модель представления знаний
- •Лекция 3. Экспертные системы
- •3.1. Назначение и структура экспертных систем
- •3.2. Обобщенная структура экспертной системы.
- •3.3. Статическая и динамическая эс.
- •3.4. Понятие и работа машины вывода.
- •3.5. Этапы разработки экспертных систем
- •Лекция 4. Нейронные сети
- •4.1. Формальный нейрон.
- •4.2. Персептрон Розенблатта.
- •Однослойные персептроны
- •4.3. Обучение искусственных нейронных сетей
- •Цель обучения
- •Обучение с учителем
- •Обучение без учителя
- •4.4. Этапы решения задач
- •Сбор данных для обучения
- •Выбор топологии сети
- •Экспериментальный подбор характеристик сети
- •Экспериментальный подбор параметров обучения
- •Собственно обучение сети
- •Проверка адекватности обучения
- •Контрольная работа представление знаний
4.2. Персептрон Розенблатта.
Одной из первых искусственных сетей, способных к перцепции (восприятию) и формированию реакции на воспринятый стимул, явился PERCEPTRON Розенблатта (F.Rosenblatt, 1957). Персептрон рассматривался его автором не как конкретное техническое вычислительное устройство, а как модель работы мозга. Нужно заметить, что после нескольких десятилетий исследований современные работы по искусственным нейронным сетям редко преследуют такую цель.
Рис. 4.3. Элементарный персептрон Розенблатта.
Простейший классический персептрон содержит нейроподобные элементы трех типов (см. Рис. 4.3), назначение которых в целом соответствует нейронам рефлекторной нейронной сети, рассмотренной в предыдущей лекции. S-элементы формируют сетчатку сенсорных клеток, принимающих двоичные сигналы от внешнего мира. Далее сигналы поступают в слой ассоциативных или A-элементов (для упрощения изображения часть связей от входных S-клеток к A-клеткам не показана). Только ассоциативные элементы, представляющие собой формальные нейроны, выполняют нелинейную обработку информации и имеют изменяемые веса связей. R-элементы с фиксированными весами формируют сигнал реакции персептрона на входной стимул.
Розенблатт
называл такую нейронную сеть трехслойной,
однако по современной терминологии,
используемой в этой книге, представленная
сеть обычно называется однослойной,
так как имеет только один слой
нейропроцессорных элементов. Однослойный
персептрон характеризуется матрицей
синаптических связей W от S- к A-элементам.
Элемент матрицы
отвечает
связи, ведущей от i-го S-элемента к j-му
A-элементу.
В Корнельской авиационной лаборатории была разработана электротехническая модель персептрона MARK-1, которая содержала 8 выходных R-элементов и 512 A-элементов, которые можно было соединять в различных комбинациях. На этом персептроне была проведена серия экспериментов по распознаванию букв алфавита и геометрических образов.
В работах Розенблатта был сделано заключение о том, что нейронная сеть рассмотренной архитектуры будет способна к воспроизведению любой логической функции, однако, как было показано позднее М.Минским и С.Пейпертом (M.Minsky, S.Papert, 1969), этот вывод оказался неточным. Были выявлены принципиальные неустранимые ограничения однослойных персептронов, и в последствии стал в основном рассматриваться многослойный вариант персептрона, в котором имеются несколько слоев процессорных элементов.
С сегодняшних позиций однослойный персептрон представляет скорее исторический интерес, однако на его примере могут быть изучены основные понятия и простые алгоритмы обучения нейронных сетей.
Однослойные персептроны
Однослойный персептрон (Single layer perceptron - SLP) – это нейронная сеть, состоящая из оного нейрона. Схема однослойного персептрона представлена на Рис.1.
Рис. 4.4. Однослойный персептрон
Уровень активации нейрона обозначен как net и определяется уравнением:
.
Выражение, указанное выше суммирует взвешенные сигналы для всех входных связей и добавляет смещение. Полученный результат используется в качестве аргумента функции активации, которая может быть определена следующим образом:
Однослойный персептрон ограничен в своих возможностях, т.к. позволяет решать только линейно-разделимые задачи. Маккалок и Питтс, представляя базовые логические функции с помощью одиночного персептрона (см. Рис.4.5), обнаружили, что с его помощью не возможно смоделировать «исключающее ИЛИ» (XOR). Эта неспособность к моделированию функции XOR известна как проблема отделимости, которая может быть решена путем добавления одного или нескольких слоев между входами и выходами нейронной сети [1].
Хотя персептрон является очень простой моделью, ее возможности достаточно велики. Персептронные сети используются для решения целого ряда задач классификации.
Рис. 4.5. Базовые логические функции
