- •Федеральное агентство по образованию
- •Оглавление
- •Глава 1. Основные понятия искусственного интеллекта
- •§ 1.1. Основные термины и определения
- •§ 1.2. История развития систем ии
- •§ 1.3. Направления развития искусственного интеллекта
- •§ 1.4. Основные направления развития и применения
- •Вопросы для самоконтроля
- •Глава 2. Положения теории нечетких множеств
- •§ 2.1. Нечеткое множество. Операции над нечеткими множествами
- •§ 2.1.1. Основные операции над нечеткими множествами.
- •§ 2.2. Построение функции принадлежности
- •§ 2.2.1. Некоторые методы построения функции принадлежности.
- •§ 2.3. Нечеткие числа
- •§ 2.4. Операции с нечеткими числами (l-r)-типа
- •§ 2.5. Нечеткая и лингвистическая переменные
- •§ 2.6. Нечеткие отношения
- •§ 2.7. Нечеткая логика
- •§ 2.8. Нечеткие выводы
- •§ 2.9. Автоматизация обработки информации с использованием
- •Вопросы для самоконтроля
- •Глава 3. Основные интеллектуальные системы
- •§ 3.1. Данные и знания
- •§ 3.2. Модели представления знаний
- •Представление знаний
- •Классификация знаний
- •§ 3.3.1. Продукционные правила.
- •§ 3.3.2. Фреймы.
- •§ 3.3.3. Семантические сети.
- •Вопросы для самоконтроля
- •§ 3.4. Экспертные системы. Предметные области
- •§ 3.5. Назначение и область применения экспертных систем
- •§ 3.6. Методология разработки экспертных систем
- •§ 3.7. Основные экспертные системы
- •§ 3.8. Трудности в разработке экспертных систем и пути их
- •Вопросы для самоконтроля
- •§ 3.9. Назначение, классификация роботов
- •§ 3.10. Примеры роботов и робототехнических систем
- •§ 3.10.1. Домашние (бытовые) роботы.
- •§ 3.10.2. Роботы спасатели и исследовательские роботы.
- •§ 3.10.3. Роботы для промышленности и медицины.
- •§ 3.10.4. Военные роботы и робототехнические системы.
- •§ 3.10.5. Мозг как аналого-цифровое устройство.
- •§ 3.10.6. Роботы – игрушки.
- •§ 3.11. Проблемы технической реализации роботов
- •Вопросы для самоконтроля
- •§ 3.12. Адаптивные промышленные роботы
- •§ 3.12.1. Адаптация и обучение.
- •§ 3.12.2. Классификация адаптивных систем управления
- •§ 3.12.3. Примеры адаптивных систем управления роботами.
- •§ 3.12.4. Проблемы в создании промышленных роботов.
- •Вопросы для самоконтроля
- •§ 3.13. Нейросетевые и нейрокомпьютерные технологии
- •§ 3.13.1. Общая характеристика направления.
- •§ 3.13.2. Нейропакеты.
- •Вопросы для самоконтроля
- •§ 3.14. Нейронные сети
- •§ 3.14.1. Персептрон и его развитие.
- •3.14.1.1. Математический нейрон Мак-Каллока-Питтса.
- •3.14.1.2. Персептрон Розенблатта и правило Хебба.
- •3.14.1.3. Дельта-правило и распознавание букв.
- •3.14.1.4. Адалайн, мадалайн и обобщенное дельта-правило.
- •§ 3.14.2. Многослойный персептрон и алгоритм обратного
- •§ 3.14.3. Виды активационных функций.
- •Вопросы для самоконтроля
- •Список литературы
- •Основы искусственного интеллекта
3.14.1.4. Адалайн, мадалайн и обобщенное дельта-правило.
Рассмотренный персептрон можно использовать и для решения других практических задач выполнять прогноз погоды или ставить диагнозы болезней. Круг решаемых задач значительно расширится, если научить персептрон выдавать не только бинарные выходные сигналы типа ноль и единица, но и аналоговые, т.е. имеющие непрерывные значения. Такое обобщение персептрона было сделано Уидроу и Хоффом, которые вместо ступенчатой ввели непрерывную нелинейную функцию активации:
График функции изображен на рис.3.24. Эту функцию назвали сигмоидой из-за того, что ее графическое изображение напоминает латинскую букву «S». Другое название сигмоиды — логистическая функция.
Рис. 3.24. Сигмоидная активационная функция у =fσ(S).
Подобно обычной пороговой функции активации, сигмоида отображает точки области определения (-, +) на интервал (0, +1). Практически сигмоида обеспечивает непрерывную аппроксимацию классической пороговой функции. Для сигмоиды принято обозначение у =fσ(S).
Персептроны с сигмоидными активационными функциями с одним выходом назвали адалайн, с несколькими выходами — мадалайн (от английских слов ADAptive Linear NEuron и Many ADALINE).
Появление персептронов с непрерывными активационными функциями обусловило и новые подходы к их обучению. Уидроу и Хофф предложили минимизировать среднеквадратичную ошибку, определяемую как разность между требуемыми di и реальными yi выходными сигналами персептрона:
Рассмотрим алгоритм коррекции весовых коэффициентов персептрона, имеющего J входов и I выходов (рис.3.25).
Рис. 3.25. Однослойный персептрон с J входами и I выходами
Среднеквадратичная ошибка ε является многомерной функцией весовых коэффициентов, т.е. ε= ε(wij), и в пространстве координат wij представляется в виде некоторой многомерной поверхности — гиперповерхности. Если оставить только две оси координат, например w11 и w12, то эта поверхность будет иметь вид фигуры, напоминающей параболоид, который, однако, может иметь как один, так и несколько минимумов. Поэтому такую поверхность будем называть псевдопараболоидом. Обучение персептрона можно представить как задачу отыскания такого сочетания весовых коэффициентов wij, которому соответствует самая нижняя точка гиперпсевдопараболоида. Такую задачу называют оптимизационной и говорят, что она состоит в минимизации функционала ε= ε(wij) в пространстве параметров wij.
Существует множество методов решения оптимизационных задач. Наиболее простым является случайный перебор весовых коэффициентов wij с последующими вычислениями и сравнениями между собой соответствующих этим коэффициентам функций ошибок ε. Однако более эффективным является метод градиентного спуска, согласно которому изменение (коррекция) каждого весового коэффициента Δwij производится в сторону, противоположную градиенту поверхности гиперпсевдопараболоида, т.е.
где η - коэффициент скорости обучения.
Среднеквадратичная ошибка ε является сложной функцией, зависящей, в первую очередь, от выходных сигналов персептрона yi поэтому в результате вычислений получим: ,
где yi=fσ(Si), Si=.
Итерационная формула для обучения однослойного персептрона:
в которой
Этот алгоритм называют обобщенным дельта-правилом, преимущество которого состоит в более быстрой сходимости и возможности более точной обработки входных и выходных непрерывных сигналов, т.е. в расширении круга решаемых персептронами задач и возможности получения более точных и качественных решений.
Ограниченность однослойного персептрона.
Персептроны применялись для решения задач диагностики, таких как анализ электрокардиограмм и заключение врача о диагнозе болезни пациента. По мере расширения фронта научных исследований появились трудности. Неожиданно оказалось, что многие новые задачи персептрон решить не мог, причем эти задачи внешне ничем не отличались от тех, с которыми персептрон успешно справлялся ранее. Возникла необходимость объяснения возникших парадоксов, глубокого анализа и создания теоретической базы персептронов.
М. Минский и С. Пайперт математически строго доказали, что использовавшиеся в то время однослойные персептроны в принципе не способны решать многие простые задачи. Одну из таких задач, заключающуюся в реализации логической операции «Исключающее ИЛИ».
«Исключающее ИЛИ» — это булева функция двух аргументов, каждый из которых может иметь значение «истинно» либо «ложно». Сама она принимает значение «истинно», когда только один из аргументов имеет значение «истинно». Во всех остальных случаях функция принимает значение «ложно»:
Задача состоит в том, чтобы реализовать функцию y с помощью однонейронного персептрона с двумя входами х1 и х2 и одним выходом у. При этом на выходе будет 1, если хотя на одном входе будет 0.
Было установлено, что какие бы значения ни придавались весам и порогу, персептрон в принципе не способен воспроизвести соотношение между входами и выходом, требуемое для представления функции «Исключающее ИЛИ». Такие задачи получили название линейно неразделимых.