Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Тезисы лекций ИИС1.docx
Скачиваний:
9
Добавлен:
05.03.2016
Размер:
1.06 Mб
Скачать

ПРОБЛЕМНАЯ ОБЛАСТЬ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА

Обзор основных направлений в области интеллектуальных информационных систем

  • Системы, основанные на знаниях

  • Естественно-языковые интерфейсы и машинный перевод

  • Генерация и распознавание речи

  • Обработка визуальной информации

  • Обучение и самообучение

  • Распознавание образов

  • Игры и машинное творчество

  • Интеллектуальные роботы

  • Программное обеспечение систем ИИ

  • Разработка компьютеров с не фон-неймановской архитектурой

Основные проблемы ИИС

  1. Представление знаний

  2. Манипулирование знаниями

  3. Общение

  4. Восприятие

  5. Обучение

  6. Поведение

Представление знаний

Знания – закономерности предметной области, полученные в результате практической деятельности и профессионального опыта, позволяющие специалистам ставить и решать задачи в этой области.

Представление знаний – это выражение на некотором формальном языке свойств различных объектов и закономерностей, важных для решения прикладных задач и организации взаимодействия пользователя с ЭВМ.

Система знаний – совокупность знаний, хранящихся в вычислительной системе и необходимых для решения комплекса прикладных задач.

База знаний – основа любой интеллектуальной системы.

ЗНАНИЯ + ВЫВОДЫ = СИСТЕМА

Модели представления знаний

Семантические сети

Основная идея состоит в том, чтобы рассматривать проблемную среду как совокупность сущностей и связей между ними.

При построении семантической сети отсутствуют ограничения на число связей и на сложность сети.

Семантические сети получили широкое распространение в системах распознавания речи и экспертных системах.

Рис. 1. Семантическая сеть

Фреймы

Фрейм – абстрактный образ для представления некоего стереотипа восприятия путем сопоставления факта с конкретными элементами и значениями в рамках, определенных для объекта, в структуре БЗ.

Модель фрейма отображает все многообразие знаний о мире через:

  • Фреймы-структуры

  • Фреймы-роли

  • Фреймы-сценарии

  • Фреймы-ситуации

Фрейм – структура, состоящая из имени фрейма, слотов и присоединенных процедур, связанных с фреймом или со слотами.

Слот имеет уникальное в пределах фрейма имя, в качестве которого может выступать любой произвольный текст.

Системные слоты служат для редактирования базы знаний и управления выводом во фреймовой системе.

Фрейм имеет следующую структуру:

Имя фрейма

Имя слота

Значение слота

Значение типа данных слота

Указатели наследования показывают, какую информацию об атрибутах слотов из фрейма верхнего уровня наследуют слоты с одинаковыми именами в данном фрейме.

Значение слота должно соответствовать указанному типу данных и условию наследования.

Во фреймах различают два вида присоединенных процедур – процедуры демоны и процедуры-слуги.

Демоны автоматически запускаются при обращении к соответствующему слоту.

Слуги запускаются явно.

Формальные логические модели

Высказывание – некоторое предложение, смысл которого можно выразить значениями ИСТИНА или ЛОЖЬ.

Символами языка логики являются высказывания, составляющими ее алфавит:

  • Логические переменные

  • Логические константы

  • Логические операции

С помощью элементов алфавита можно построить разнообразные логические формулы.

Формула может быть истинной или ложной.

Значение формулы ИСТИНА говорит о наличии некоторого свойства, ЛОЖЬ – об отсутствии.

Логика предикатов первого порядка является более выразительным средством, чем логика высказываний и представляет знания о среде более компактно.

Предикат – некоторая связь, которая задана на наборе констант или переменных.

Предикат принимает только два значения – ИСТИНА и ЛОЖЬ.

Основные синтаксические единицы логики предикатов – константы, функции, предикаты, кванторы и логические операторы.

Продукционная модель

Продукционная модель – модель, основанная на правилах. Эта модель позволяет представлять знания в виде «Если, то».

Любое продукционное правило, содержащееся в базе знаний, состоит из двух частей: антецедента и консеквента.

Правило срабатывает, если при сопоставлении фактов, содержащихся в рабочей памяти, с антецедентом анализируемого правила имеет место совпадение, при этом заключение срабатываемого правила заносится в рабочую память.

Существует два типа продукционных систем: с прямым и обратным выводами.

Прямой вывод реализует стратегию от фактов к заключению.

Обратный вывод – от гипотез вероятных заключений, которые либо подтверждаются, либо нет фактами, поступающими в рабочую память.

Существуют системы с двунаправленными выводами.

Вывод на знаниях

Продукционная модель может быть важным механизмом для конструирования экспертных систем и других приложении ИИ.

База знаний в этом случае состоит из набора правил, а сама экспертная система должна содержать три основные компоненты: базу правил, рабочую память и механизм вывода.

База правил – формализованные с помощью правил продукций знания о конкретной предметной области.

Рабочая память – область памяти, в которой хранится множество фактов, описывающих текущую ситуацию, и все пары атрибут – значение, которые установлены к определенному моменту.

Механизм вывода работает циклически, выполняются следующие операции:

  • Сопоставление

  • Выбор

  • Срабатывание

  • Действие

В ИИС с фреймовым представлением знаний используется три способа управления логическим выводом: демоны, присоединенные процедуры и механизм наследования, который является основным механизмом вывода.

В ИИС с фреймовым представлением знаний невозможно четко отделить процедурные знания от декларативных, поскольку демоны и присоединенные процедуры одновременно являются и знаниями, и средствами управления логическим выводом.

В семантических сетях декларативные и процедурные знания также не разделены. Процедура вывода обычно представляет собой совокупность процедур обработки сети.

Вывод – это получение заключения из групп заданных представлений.

Вывод является формулой, полученной из некоторой группы описанных формул.

В логических моделях действие компоненты вывода основано на применении следующих правил вывода:

  • Modus Ponens

  • Modus Tollens

  • Modus Ponendo Tollens

  • Modus Tollendo Ponens

  • Правило транзитивности

  • Закон противоречия

  • Правило конртапозиции (метод резолюции)

ЭКСПЕРТНЫЕ СИСТЕМЫ

Структура экспертных систем

Экспертная система – это программа для компьютера, которая оперирует со знаниями в определенной области с целью выработки рекомендаций или решения проблем.

Область исследования ЭС- инженерия знаний.

ЭС применяются для решения неформализованных проблем со следующими характеристиками:

  • Задачи не могут быть представлены в числовой форме;

  • Исходные данные и знания о предметной области обладают неоднозначностью, неточностью, противоречивостью;

  • Цели нельзя выразить с помощью четко определенной целевой функции;

  • Не существует однозначного алгоритма решения задачи;

  • Алгоритмическое решение существует, но его нельзя использовать по причине большой размерности пространства решений и ограничений на ресурсы.

Идеальная ЭС состоит из 5-ти компонентов:

  1. Интерфейс с пользователем-это совокупность программных и аппаратных средств, обеспечивающих взаимодействие пользователя с компьютером. Основу такого взаимодействия составляют диалоги. Под диалогом в данном случае понимают регламентированный обмен информацией между человеком и компьютером, осуществляемый в реальном масштабе времени и направленный на совместное решение конкретной задачи. Каждый диалог состоит из отдельных процессов ввода / вывода, которые физически обеспечивают связь пользователя и компьютера. Обмен информацией осуществляется передачей сообщения.

  2. Подсистема логического вывода- предназначенна для генерации рекомендаций по решению прикладной задачи на основе информации, находящейся в базе знаний, строится на основе теории машины Поста.

  3. База знаний- в информатике и исследованиях искусственного интеллекта — это особого рода база данных, разработанная для оперирования знаниями (метаданными). База знаний содержит структурированную информацию, покрывающую некоторую область знаний, для использования кибернетическим устройством (или человеком) с конкретной целью. Современные базы знаний работают совместно с системами поиска информации, имеют классификационную структуру и формат представления знаний.

  4. Модуль приобретения знаний-служит для получения знаний от эксперта; поддержки базы знаний и дополнения ее при необходимости.

  5. Модуль отображения и объяснения решений- показывает пользователю промежуточные и окончательные результаты решения задачи с пояснением действий экспертной системы.

Классификация экспертных систем

По типу решаемых задач:

  • Интерпретирующие- Описывают ситуацию по информации, поступающей от датчиков. Обычно имеют дело с данными, которые зашумлены, неполны, ненадежны и нуждаются в обработке и последующем символьном представлении. Интерпретирующие экспертные системы могут обработать разнообразные виды данных. Например, интерпретирующая система в геологии использует ка­ротажное зондирование — измерение проводимости горных по­род в буровых скважинах и вокруг них,— чтобы определить подповерхностные геологические структуры. Наконец, в воен­ном деле интерпретирующие системы используют данные от ра­даров, радиосвязи и сонарных устройств, чтобы оценить ситу­ацию и идентифицировать цели.

  • Прогнозирующие- Прогнозирующие- предсказывают возможные результаты или события на основе данных о текущем состоянии объекта. Программная система “Завоевание

Уолл-стрита” может проанализировать конъюнктуру рынка и с помощью

статистических методов алгоритмов разработать для вас план капиталовложений

на перспективу. Она не относится к числу систем, основанных на знаниях,

поскольку использует процедуры и алгоритмы традиционного программирования.

Хотя пока еще отсутствуют ЭС, которые способны за счет своей информации о

конъюнктуре рынка помочь вам увеличить капитал, прогнозирующие системы уже

сегодня могут предсказывать погоду, урожайность и поток пассажиров. Даже на

персональном компьютере, установив простую систему, основанную на знаниях, вы

можете получить местный прогноз погоды.

  • Диагностические- используются для установления связи между нарушениями

деятельности организма и их возможными причинами. Наиболее известна

диагностическая система MYCIN, которая предназначена для диагностики и

наблюдения за состоянием больного при менингите и бактериальных инфекциях. Ее

первая версия была разработана в Стенфордском университете в середине 70-х

годов. В настоящее время эта система ставит диагноз на уровне врача-

специалиста. Она имеет расширенную базу знаний, благодаря чему может

применяться и в других областях медицины.

  • Системы проектирования состоит в подготовке спецификаций на создание «объектов» с заранее определенными свойствами. Под спецификацией понимается весь набор необходимых документов – чертеж, пояснительная записка и т.д. Основные проблемы – получение четко структурированного описания знаний об объекте и проблема «следа». Для организации эффективного проектирования и в еще большей степени перепроектирования необходимо формировать не только сами проектные решения, но и мотивы их принятия. Таким образом, в задачах проектирования тесно связываются два основных процесса. Выполняемых в рамках соответствующей экспертной системы: процесс вывода решения и процесс объяснения.

  • Системы планирования- Планирующие системы предназначены для достижения конкретных целей при решении задач с большим числом переменных.

  • Системы мониторинга. Основная задача мониторинга – непрерывная интерпретация данных в реальном масштабе времени и сигнализация о выходе тех или иных параметров за допустимые пределы. Главные проблемы – пропуск тревожной ситуации и инверсная задача «ложного» срабатывания. Сложность этих проблем в размытости симптомов тревожных ситуаций и необходимость учета временного контекста.

  • Наладочные системы предназначены для выработки рекомендаций по устранению неисправностей в контролируемой системе. К этому классу относятся системы, помогающие программистам в отладке программного обеспечения, и консультирующие системы.

  • Системы оказания помощи при ремонте оборудования выполняют планирование процесса устранения неисправностей в сложных объектах, например в сетях инженерных коммуникаций.

  • Обучающие проводят анализ знаний студентов по определенному предмету, отыскивают пробелы в знаниях и предлагают средства для их ликвидации.

  • Системы контроля обеспечивают адаптивное управление поведением сложных человеко-машинных систем, прогнозируя появление возможных сбоев и планируя действия, необходимые для их предупреждения. Областью применения таких систем является управление воздушным транспортом, военными действиями и деловой активностью в сфере бизнеса.

По способу и учету временного признака:

  • Статистические решают задачи при неизменяемых в процессе решения данных и знаниях, динамические системы допускают такие изменения. Статические системы осуществляют монотонное непрерываемое решение задачи от ввода исходных данных до конечного результата

  • Квазидинамические

  • Динамические предусматривают возможность пересмотра в процессе решения полученных ранее результатов и данных.

По способу формирования решений: анализирующие и синтезирующие.

Отличия экспертных систем от других программных продуктов

  1. Моделируют механизм мышления человека применительно к решению задач в некоторой проблемной области

  2. При решении задач основными являются эвристические и приближенные методы

  3. Имеют дело с предметами реального мира, операции с которыми требуют наличия большого опыта

  4. ЭС должна обладать способностью объяснить полученное решение, доказать его обоснованность.

Цикл работы экспертных систем

ЭС работает в двух режимах: приобретения знаний и решения задач.

Приобретение знаний – передача потенциального опыта решения проблемы от некоторого источника знаний и преобразование его в вид, который позволяет использовать эти знания в программе.

Проблемная область описывается в идее фактов и правил.

В режиме консультации общение с ЭС осуществляет конечный пользователь, которого интересует результат или способ получения результата.

В любой момент времени в системе существуют следующие типы знаний:

  • Структурированные статические знания

  • Структурированные динамические знания

Рис. 2. Схема работы экспертной системы

Технология проектирования и разработки экспертных систем

Промышленная технология создания ЭС включает следующие этапы:

  1. Исследование выполнимости проекта

  2. Разработку общей концепции системы

  3. Разработку и тестирование серии прототипов

  4. Разработку и испытание головного образца

  5. Разработку и проверку расширенных версий системы

  6. Привязку системы к реальной рабочей среде

Технология реализации ЭС включает шесть основных этапов: идентификацию, концептуализацию, формализацию, выполнение, тестирование, опытную эксплуатацию.

Подходы создания ЭС:

  • Поверхностный

  • Структурный

  • Глубинный

  • Смешанный.

ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ

Задача принятий решений в условиях неопределенности в настоящее время может быть решена с помощью четырех методологий:

  1. Нечеткая логика и нечеткие множества

  2. Неточный вывод на основе фактора уверенности

  3. Теория доказательств Демпстера-Шафера

  4. Байесовские рассуждения и байесовские сети доверия

Нечеткая логика позволяет определить промежуточные значения для таких общепринятых оценок, как да-нет, истинно-ложно и т.п.

Четкое множество – все элементы четко различимы между собой, относительно каждого элемента можно определить, принадлежит он множеству или нет.

Нечеткое множество отличается от обычного тем, что для элементов х из множества Е нет однозначного ответа да-нет относительно свойства R. В связи с этим, нечеткое подмножество А универсального множества Е определяется как множество упорядоченных пар с характеристической функцией принадлежности, принимающей значения в некотором множестве М = {1,0}.

Высота нечеткого множества – верхняя граница значений его функции принадлежности.

Нормальное нечеткое множество – высота равна 1.

Субнормальное нечеткое множество – высота меньше 1.

Пустое нечеткое множество – высота – 0

Унимодальное нечеткое множество – если высота равна 1 только на одном элементе

Элементы нечеткого множества с высотой = 0,5 называются точками перехода множества.

Операции над нечеткими множествами

ЛОГИЧЕСКИЕ ОПЕРАЦИИ

Включение – А содержится в В

Объединение – наименьшее подмножество, включающее А и В

Пересечение – наибольшее подмножество, содержащееся одновременно и в А и в В

Дополнение

Разность

АЛГЕБРАИЧЕСКИЕ ОПЕРАЦИИ

Произведение

Сумма

Умножение на число

Дизъюнктивная сумма

Выпуклая комбинация нечетких множеств

Декартово произведение нечетких множеств

Оператор увеличения нечеткости

Нечеткая и логическая переменные

Лингвистические переменные – средство моделирования нечеткости естественного человеческого языка.

В основе понятия лингвистическая переменная лежит понятие нечеткая переменная

Нечеткая переменная характеризуется тройкой <α, X, A>, где

α – наименование переменной

Х – универсальное множество

А – нечеткое множество на Х, описывающее ограничения на значения нечеткой переменной α.

Лингвистическая переменная – набор <β, Т, Х, G, М>, где

β – наименование лингвистической переменной

Т – множество ее значений, представляющих собой наименования нечетких переменных, областью определения каждой из которых является множество Х

G – синтаксическая процедура, позволяющая оперировать элементами множества Т

М – семантическая процедура, позволяющая превратить каждое новое значение лингвистической переменной в нечеткую переменную.

Нечеткие числа

Нечеткие числа – нечеткие переменные, определенные на числовой оси. То есть нечеткое число определяется как нечеткое множество А на множестве действительных чисел R, при этом µа(х) принадлежит {1,0}.

Нечеткое число А нормально, если мах µа(х)=1

Нечеткое число А выпукло, если для любых чисел х ≤у≤z выполняется условие: µа(х) = min (µа(y), µа(z)).

Нечеткое число А унимодально, если условие µа(х)=1 справедливо только для одной точки.

МАШИННОЕ ОБУЧЕНИЕ НА ОСНОВЕ НЕЙРОННЫХ СЕТЕЙ

Биологический нейрон и его математическая модель

Нейрон – особая биологическая клетка, которая обрабатывает информацию.

Он состоит из тела, дендритов и аксона. Тело нейрона включает ядро и плазму.

На окончаниях нервных волокон находятся синапсисы, которые влияют на величину импульсов.

ИСКУССТВЕННЫЙ НЕЙРОН

ИН обладает группой синапсисов – однонаправленных входных связей, соединенных с выходами других нейронов, а также имеет аксон – выходную связь данного нейрона, с которой сигнал поступает на синапсисы следующих нейронов.

Множество входных сигналов х1, х2, х3 … поступает на искусственный нейрон. Эти сигналы в совокупности обозначаются вектором Х.

Каждый синапсис характеризуется величиной синаптической связи или ее весом w1, w2, w3 …

Каждый сигнал умножается на соответствующий вес и поступает на суммирующий блок. Суммирующий блок складывает входы, создавая величину S.

Т.о., текущее состояние нейрона определяется как взвешенная сумма его входов.

Выход нейрона – функция его состояния , активационная функция f.

Рис. 3. Математический нейрон

Примеры активационных функций:

Рис. 4. Функция единичного скачка

Рис 5. Линейный порог

Рис. 6. Логистическая функция

Рис. 7. Гиперболический тангенс

Нейросети

ОДНОСЛОЙНЫЕ ИСКУССТВЕННЫЕ НЕЙРОННЫЕ СЕТИ

Простейшая сеть состоит из группы нейронов, образующих слой:

Рис. 8. Простейшая однослойная нейронная сеть

МНОГОСЛОЙНЫЕ ИСКУССТВЕННЫЕ НЕЙРОННЫЕ СЕТИ

Образовываются каскадами слоев – выход одного слоя является входом для другого:

Рис. 9. Пример многослойной нейронной сети

ОБУЧЕНИЕ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ

Сеть обучается, чтобы для некоторого множества входов давать требуемое множество выходов. Каждое такое множество рассматривается как вектор.

В процессе обучения веса сети постепенно становятся такими, чтобы каждый входной вектор формировал выходной вектор.

Различают алгоритмы обучения с учителем и без учителя.

Обучения с учителем предполагает, что для каждого входного вектора существует целевой вектор, представляющий собой требуемый выход. Вместе они называются обучающей парой.

Обучение без учителя не нуждается в целевом векторе для выходов и не требует сравнения с предопределенными идеальными ответами. Таким образом, невозможно предсказать, какой выход будет производиться данным классом входных векторов.

Теорема Колмогорова

Любая непрерывная функция F, определенная на n-мерном единичном кубе, может быть представлена в виде суммы 2n+1 суперпозиций непрерывных и монотонных отображений единичных отрезков.

Роль этой теоремы состоит в том, чтобы она показала принципиальную возможность реализации сколь угодно сложных зависимостей с помощью относительно простых автоматов типа нейронных сетей.

Любую непрерывную функцию нескольких переменных можно с любой точностью реализовать с помощью двухслойной нейронной сети с достаточным количеством нейронов в скрытом слое.

Персептрон

Персептрон – однослойная нейронная сеть, при этом каждый персептронный нейрон в качестве активационной функции использует функцию единичного скачка.

Рис. 10. Однонейронный персептрон с n входами.

АЛГОРИТМ ОБУЧЕНИЯ ОДНОНЕЙРОННОГО ПЕРСЕПТРОНА

Шаг 0. Проинициализировать весовые коэффициенты wi, i= 0, 1, …, n , небольшими случайными значениями (например, из диапазона [–0.3, 0.3])

Шаг 1. Подать на вход персептрона один из обучающих векторов и вычислить его выход.

Шаг 2. Если выход правильный, перейти на шаг 4. Иначе вычислить ошибку – разницу между верным значением и полученным значением выхода.

Шаг 3. Модифицируются весовые коэффициенты:

Шаг 4. Шаги 1-3 повторяются для всех обучающих векторов.

АЛГОРИТМ ОБУЧЕНИЯ СЕТИ, ВКЛЮЧАЮЩЕЙ n ПЕРСЕПТРОНОВ

Шаг 0. Проинициализировать элементы весовой матрицы W небольшими случайными значениями.

Шаг 1. Подать на входы один из входных векторов и вычислить его выход.

Шаг 2. Если выход правильный, перейти на шаг 4. Иначе вычислить ошибку – разницу между верным значением и полученным значением выхода.

Шаг 3. Модифицируются весовые коэффициенты:

Шаг 4. Шаги 1-3 повторяются для всех обучающих векторов.

Сеть обратного распространения

Нейронные сети обратного распространения — это современный ин­струмент поиска закономерностей, прогнозирования, качественного анализа. Такое название — сети обратного распространения — они получили из-за исполь­зуемого алгоритма обучения, в котором ошибка распространяется от вы­ходного слоя к входному, т. е. в направлении, противоположном направ­лению распространения сигнала при нормальном функционировании сети.

Нейронная сеть обратного распространения состоит из нескольких слоев нейронов, причем каждый нейрон предыдущего слоя связан с каждым нейроном последующего слоя. В большинстве практических приложе­ний оказывается достаточно рассмотрения двухслойной нейронной сети, имеющей входной (скрытый) слой нейронов и выходной слой.

Сеть Кохонена. Классификация образов

Задача классификации заключается в разбиении объектов на клас­сы, причем основой разбиения служит вектор параметров объекта. Часто бывает так, что сами классы заранее неизвестны, и их приходится фор­мировать динамически. Назовем прототипом класса объект, наиболее ти­пичный для своего класса. Один из самых простых подходов к классифи­кации состоит в том, чтобы предположить существование определенного числа классов и произвольным образом выбрать координаты прототипов. Затем каждый вектор из набора данных связывается с ближайшим к нему прототипом, и новыми прототипами становятся центроиды всех векто­ров, связанных с исходным прототипом.

На этих принципах основано функционирование сети Кохонена, обычно используемой для решения задач классификации. Данная сеть обучается без учителя на основе самоорганизации. По мере обучения векторы весов нейронов становятся прототипами классов — групп век­торов обучающей выборки. На этапе решения информационных задач сеть относит новый предъявленный образ к одному из сформированных классов.

Рассмотрим архитектуру сети Кохонена и правила обучения подроб­нее. Сеть Кохонена состоит из одного слоя нейронов. Число входов каждого нейрона п равно размерности вектора параметров объекта. Ко­личество нейронов т совпадает с требуемым числом классов, на которые нужно разбить объекты (меняя число нейронов, можно динамически менять число классов).

Обучение начинается с задания небольших случайных значений эле­ментам весовой матрицы W. В дальнейшем происходит процесс само­организации, состоящий в модификации весов при предъявлении на вход векторов обучающей выборки. Каждый столбец весовой матрицы представляет собой параметры соответствующего нейрона-классификато­ра. Для каждого у'-го нейрона (/= \, 2, т) определяется расстояние от него до входного вектора X

Далее выбирается нейрон с номером к, 1<£<т, для которого это расстояние минимально (т. е. сеть отнесла входной вектор к классу с номером к). На текущем шаге обучения N будут модифицироваться только веса нейронов из окрестности нейрона к

Первоначально в окрестности любого из нейронов находятся все нейроны сети, но с каждым шагом эта окрестность сужается. В конце этапа обучения подстраиваются только веса нейрона с номером к. Темп обучения aN с течением времени также уменьшается (часто полагают а0 = 0,9, aN+] = aN — 0,001). Образы обучающей выборки предъявляются последовательно, и каждый раз происходит подстройка весов.

Нейроны Гроссберга.Входные и выходные звезды

Входная звезда Гроссберга (S. Grossberg) [45, 46], как показано на рис. 6.14, состоит из нейро­на, на который подается группа входов, умноженных на синапсические веса.

Выходная звезда, показанная на рис. 6.15, являет­ся нейроном, управляющим группой весов. Входные и выходные звезды могут быть взаимно соединены в сети любой сложности.

Двухслойная сеть встречного распространения

Сеть встречного распространения состоит из двух слоев: слоя нейронов Кохонена и слоя нейронов Гроссберга. Автор сети Р. Хехт-Нильсен удачно объединил эти две архитекту­ры, в результате чего сеть приобрела свойства, которых не было у каждой из них в отдельности.

Слой Кохонена классифицирует входные векторы в группы схожих. Это достигается с помощью такой подстройки весов слоя Кохонена, что близкие входные векторы активируют один и тот же нейрон данного слоя. Затем слой Гроссберга дает требуемые выходы.

На рис. 6.16 показана сеть встречного распространения полностью.

В режиме нормального функционирования предъявляются входные век­торы X и Y, и обученная сеть дает на выходе векторы X' и Y', являющиеся аппроксимациями соответственно для X и Y. Векторы X, Y предполагаются здесь нормированными векторами единичной длины, следовательно, по­рождаемые на выходе векторы также должны быть нормированными.

В процессе обучения векторы X и Y подаются одновременно и как входные векторы сети, и как желаемые выходные сигналы.

В результате получается отображение, при котором предъявление пары входных векто­ров порождает их копии на выходе. Это не было бы особенно интересным, если не учитывать способность этой сети к обобщению. Благодаря обобщению предъявление только вектора X (с вектором Y, равным нулю) порождает как вы­ходы X', так и выходы Y'. Если F — функция, отображающая X в К', то сеть аппроксимирует ее. Кроме того, если функция F обратима, то предъяв­ление только вектора Y (при нулевом векторе X) порождает выходы X'.

Уникальная способность порождать функцию и обратную к ней де­лает сеть встречного распространения полезной в ряде приложений. На­пример, в задаче аппроксимации многомерной векторной функции сеть обучается на известных значениях этой функции.