- •Иллюстрированный самоучитель по экспертным системам
- •Рядовым читателям
- •Студентам и преподавателям
- •Инженерам-программистам
- •Научным работникам
- •Глава 1. Что такое экспертная система?
- •Глава 1.
- •1.1. Смысл экспертного анализа
- •1.2. Характеристики экспертных систем
- •1.3. Базовые функции экспертных систем
- •1.3.1. Приобретение знаний
- •1.1. Забытый пароль
- •1.3.2. Представление знаний
- •1.2. Синтаксис и семантика представления семейных отношений
- •1.3.3. Управление процессом поиска решения
- •1.3. Обслуживание автомобиля
- •1.3.4. Разъяснение принятого решения
- •1.4. Загадка одного портрета
- •1.4. Резюме и структура книги
- •1.4.1. Текущее состояние проблемы
- •1.4.2. Распределение материала книги по главам
- •Рекомендуемая литература
- •Упражнения
- •Глава 2. Обзор исследований в области искусственного интеллекта
- •Глава 2.
- •2.1. Классический период: игры и доказательство теорем
- •2.1.1. Поиск в пространстве состояний
- •2.1. Комбинаторный взрыв
- •2.1.2. Эвристический поиск
- •2.2. Алгоритм а
- •Конец алгоритма
- •2.2. Романтический период: компьютер начинает понимать
- •2.2.1. Система shrdlu
- •2.3. Сценарий посещения ресторана
- •2.2.2. Схемы представления знаний
- •2.4. Летучие мыши и проблема с пингвинами
- •2.3. Период модернизма: технологии и приложения
- •2.3.1. В знании сила
- •2.5. Процедуральное или декларативное знание
- •2.6. Машина логического вывода и база знаний
- •2.3.2. Периоды "зимней спячки" и "пробуждения" в истории искусственного интеллекта
- •Рекомендуемая литература
- •Упражнения
- •Глава 3. Представление знаний
- •Глава 3.
- •3.1. Представление знаний: принципы и методы
- •3.1. Молотки, графины и теоремы
- •3.2. Планировщик strips
- •3.2.1. Таблицы операторов и методика "средство -анализ завершения"
- •3.2.2. Анализ метода представления и управления в strips
- •3.3. Формулировка подцелей в mygin
- •3.3.1. Лечение заболеваний крови
- •3.3.2. База знаний системы mycin
- •3.3.3. Структуры управления в mycin
- •3.2. Комбинация гипотез
- •3.4. Оценка и сравнение характеристик экспертных систем
- •3.4.1. Оценка системы mycin
- •3.4.2. Сравнение mycin и strips
- •Рекомендуемая литература
- •Упражнения
- •Глава 4. Символические вычисления
- •Глава 4.
- •4.1. Символическое представление
- •4.2. Физическая символическая система
- •4.1. Главная гипотеза
- •4.3. Реализация символических структур на языке lisp
- •4.3.1. Структуры данных в языке lisp
- •4.2. Списки и точечные пары
- •4.3.2. Структура lisp-программы
- •4.3. Функции, их вычисление и проблема цитирования в clips
- •4.3.3. Приложение функции и лямбда-исчисление
- •4.3.4. Обработка списков
- •4.4. Примитивы в lisp
- •4.3.5. Сопоставление с образцом
- •4.4. Почему. Lisp не является языком представления знаний
- •4.4.1. Символический уровень и уровень знаний
- •4.4.2. Lisp и разработка программ
- •4.5. Гипотеза Смита
- •4.5. Языки представления знаний
- •Рекомендуемая литература
- •Упражнения
- •Глава 5. Системы, основанные на знаниях
- •Глава 5.
- •5.1. Канонические системы
- •5.1. Смысл порождений
- •5.2. Системы порождающих правил для решения проблем
- •5.2.1. Синтаксис представления правил
- •Листинг 5.1. Оргправило системы mycin, записанное на языке clips
- •Листинг 5.2. Правило, в котором используются переменные
- •5.2.2. Рабочая память
- •Листинг 5.3. Набор правил для проблемы в системе strips
- •5.2. Трассировка программы управления роботом
- •5.3. Управление функционированием интерпретатора
- •5.3.1. Разрешение конфликтов
- •5.3. Разрешение конфликтов в cups
- •5.3.2. Прямая и обратная цепочки рассуждений
- •Листинг 5.4. Набор правил для построения башни из блоков
- •5.4. Трассировка программы строительства башни
- •5.3.3. Правила и метаправила
- •5.5. Свойство выпуклости в clips: пингвины обретают способность летать (или не обретают)
- •Рекомендуемая литература
- •Упражнения
- •Листинг 5.5. Набор диагностических правил заболеваний брюшной полости на языке clips
- •Глава 6. Ассоциативные сети и системы фреймов
- •Глава 6.
- •6.1. Графы, деревья и сети
- •6.2. Ассоциативные сети
- •6.2.1. Разделение видов узлов и когнитивная экономия
- •6.2.2. Анализ адекватности ассоциативных сетей
- •6.3. Представление типовых объектов и ситуаций
- •6.3.1. Основные понятия концепции фреймов
- •6.3.2. Фреймы и графы
- •6.3.3. Значения по умолчанию и демоны
- •6.1. Реализация фреймов и наследования в языке clips
- •6.3.4. Множественное наследование
- •6.3.5. Сравнение сетей и фреймов
- •Рекомендуемая литература
- •Упражнения
- •Глава 7. Объектно-ориентированное программирование
- •Глава 7.
- •7.1. Язык krl
- •7.1. Процедуры и объекты
- •7.2. Языки loops и flavors
- •7.2.1. Передача сообщений
- •7.2. Формирование объекта класса на языке clips
- •7.2.2. Проблема наложения методов
- •7.2.3. Метаклассы
- •7.3. Языки clips и clos
- •7.3.1. Множественное наследование в clos и clips
- •Листинг 7.1. Объявление классов на языке clips
- •7.3.2. Наложение методов в clos и clips
- •7.3. Как сделать людей вежливыми
- •7.3.3. Метаклассы в clos и clips
- •Листинг 7.2. Файл nixon.H. Объявление классов, версия 1
- •Листинг 7.3. Файл nixon.H. Объявление классов, версия 2
- •Листинг 7.4. Файл nixon.H. Объявление классов, версия 3
- •Листинг 7.5. Файл nixon.H. Объявление классов, версия 4
- •7.5. Объектно-ориентированный анализ и конструирование экспертных систем
- •Рекомендуемая литература
- •Упражнения
- •Глава 8. Логическое программирование
- •Глава 8.
- •8.1. Формальные языки
- •8.1.1. Исчисление высказываний
- •8.1.2. Исчисление предикатов
- •8.1. Снова о роботах и комнатах
- •8.2. Язык prolog
- •Листинг 8.1. Простая программа на языке prolog, определяющая отношение on (на)
- •8.3. Опровержение резолюций
- •8.3.1. Принцип резолюций
- •8.3.2. Поиск доказательства в системе резолюций
- •8.4. Процедурная дедукция в системе planner
- •8.5.1. Правила поиска в языке prolog
- •8.5.2. Управление поиском в системе mbase
- •Рекомендуемая литература
- •Упражнения
- •Глава 9. Представление неопределенности знаний и данных
- •Глава 9.
- •9.1. Источники неопределенности
- •9.2. Экспертные системы и теория вероятностей
- •9.2.1. Условная вероятность
- •9.2.2. Коэффициенты уверенности
- •9.2.3. Коэффициенты уверенности и условные вероятности
- •9.3. Сомнительность и возможность
- •9.3.1. Нечеткие множества
- •9.3.2. Нечеткая логика
- •9.3.3. Теория возможности
- •9.4. Неопределенное состояние проблемы неопределенности
- •Рекомендуемая литература
- •Упражнения
- •Глава 10. Приобретение знаний
- •Глава 10.
- •10.1. Теоретический анализ процесса приобретения знаний
- •10.1.1. Стадии приобретения знаний
- •10.1.2. Уровни анализа знаний
- •10.1. Оболочки CommonKads и kastus
- •10.1.3. Онтологический анализ
- •10.2. Оболочки экспертных систем
- •10.2.1. Система emycin
- •10.2.2. Сопровождение и редактирование баз знаний с помощью программы teiresias
- •10.3. Методы приобретения знаний
- •10.3.1. Использование опроса экспертов для извлечения знаний в системе compass
- •10.3.2. Автоматизация процесса извлечения знаний в системе opal
- •10.3.3. Графический интерфейс модели предметной области
- •10.3.4. Эффективность программы opal
- •10.4. Приобретение новых знаний на основе существующих
- •Рекомендуемая литература
- •Упражнения
- •Глава 11. Эвристическая классификация (I)
- •Глава 11.
- •11.1. Классификация задач экспертных систем
- •11.2. Классификация методов решения проблем
- •11.2.1. Эвристическое сопоставление
- •11.2.2. Общность эвристической классификации
- •11.1. Определение понятия "оружие нападения"
- •11.3. Классификация или конструирование?
- •Рекомендуемая литература
- •Упражнения
- •Глава 12. Эвристическая классификация (II)
- •Глава 12.
- •12.1. Инструментальные средства и задачи, решаемые экспертной системой
- •12.2. Эвристическая классификация в системах mud и more
- •12.2.1. Модель предметной области выполнения буровых работ
- •12.1. Диагностические правила в м u d
- •12.2.2. Стратегии приобретения знаний
- •12.2.3. Использование коэффициентов уверенности в программе more
- •12.2.4. Опыт эксплуатации системы more
- •12.3. Совершенствование стратегий
- •12.3.1. Уроки проекта guidon
- •12.3.2. Структура задач в системе neomycin
- •Рекомендуемая литература
- •Упражнения
- •Глава 13. Иерархическое построение и проверка гипотез
- •Глава 13.
- •13.1. Влияние сложности пространства гипотез на организацию работы системы
- •13.1. Обход дерева
- •13.2. Структурированные объекты в centaur
- •13.2.1. Структура фреймов в centaur
- •13.2.2. Правила, включенные в прототипы
- •13.3. Формирование суждений на базе модели в системе internist
- •13.3.1. Представление знаний в дереве заболеваний
- •13.3.2. Методика выделения правдоподобных гипотез в internist
- •13.3.3. Проблемы, обнаруженные в процессе эксплуатации системы internist
- •13.4. Рабочая среда инженерии знаний tde
- •Рекомендуемая литература
- •Упражнения
- •Глава 14. Решение проблем конструирования (I)
- •Глава 14.
- •14.1. Области применения методов конструктивного решения проблем
- •14.2. Система r1/xcon
- •14.2.1. Компоненты и ограничения
- •14.2.2. Использование текущего контекста для управления структурой задачи
- •14.1. Стратегии разрешения конфликтов lex и меа
- •14.2.3. Формирование суждений с учетом ограничений: метод Match
- •14.3. Использование знаний, развитие и расширение системы xcon
- •14.3.1. Извлечение знаний в системе r1/xcon
- •14.3.2. Совершенствование и расширение системы r1/xcon
- •14.2. Совершенствование системы xcon
- •Рекомендуемая литература
- •Упражнения
- •Глава 15. Решение проблем конструирования (II)
- •Глава 15.
- •15.1. Стратегии конструирования
- •15.2. Архитектура систем планирования и метапланирования
- •15.1. Программа планирования мероприятий
- •15.3. Извлечение, представление и применение знаний о проектировании
- •15.3.1. Реализация обратного прослеживания в системе vt
- •15.3.2. Приобретение знаний с помощью системы salt
- •15.4. Итоги анализа систем решения проблем конструирования
- •Рекомендуемая литература
- •Упражнения
- •Глава 16. Средства формирования пояснений
- •Глава 16.
- •16.1. Формирование пояснений на основе знаний
- •16.1.1. Подсистема формирования пояснений в mycin
- •16.1.2. Формирование пояснений в системах, производных от mycin
- •16.1.3. Формирование пояснений на основе фреймов
- •16.1.4. Организация вывода пояснений в системе centaur
- •16.1.5. Использование мультимедийного интерфейса для формирования пояснений
- •16.2. Формирование пояснений и автоматическое программирование
- •16.2.1. Автоматическое программирование в системе xplan
- •16.2.2. Проект Explainable Expert Systems
- •16.2.3. Планирование текстов пояснений и модели пользователей в pea
- •16.3. Перспективы дальнейших исследований методов формирования пояснений
- •Рекомендуемая литература
- •Упражнения
- •Глава 17. Инструментальные средства разработки экспертных систем
- •Глава 17.
- •17.1. Общая характеристика инструментальных средств для построения экспертных систем
- •17.2. Оболочки экспертных систем
- •17.3. Языки программирования высокого уровня
- •17.3.1. Языки описания порождающих правил
- •17.3.2. Объектно-ориентированные языки
- •17.3.3. Языки логического программирования экспертных систем
- •17.3.4. Многофункциональные программные среды
- •17.1. Cups как многофункциональная среда программирования
- •17.3.5. Дополнительные модули
- •17.2. Логический вывод в разных контекстах
- •17.4. Использование инструментальных средств
- •17.4.1. Характерные сложности и способы их избежать
- •17.4.2. Выбор подходящего инструментария для разработки экспертной системы
- •17.4.3. Практическое освоение инструментальных средств
- •17.3. Правила и процедуры в инструментальной среде м.4
- •17.4.4. Стиль программирования
- •17.5. Некоторые максимы разработки экспертных систем
- •Рекомендуемая литература
- •Упражнения
- •Глава 18. Системы с доской объявлений
- •Глава 18.
- •18.1. Принципы организации систем с доской объявлений
- •18.2. Системы hearsay, age и орм
- •18.2.1. Почему для hearsay-II выбрана такая архитектура
- •18.2.2. Использование источников знаний в hearsay-II
- •18.2.3. Система hearsay-III— оболочка для создания систем с доской объявлений
- •18.2.4. Инструментальные среды age и орм
- •18.3. Среда с доской объявлений вв
- •18.3.1. Уровни абстракции в среде вв
- •18.3.2. Системы вв1 и accord
- •18.3.3. Система protean
- •18.3.4. Интеграция стратегий логического вывода
- •18.3.5. Общая характеристика вв
- •18.4. Эффективность и гибкость модели с доской объявлений
- •18.4.1. Организация доски объявлений в системе gbb
- •18.4.2. Компоновка доски объявлений в среде erasmus
- •18.5. Организация параллельных вычислений в системах cage и poligon
- •Рекомендуемая литература
- •Упражнения
- •Глава 19. Система отслеживания истинности предположений
- •Глава 19.
- •19.1. Отслеживание зависимостей
- •19.1.1. Релаксация в сети
- •19.1.2. Пересмотр допущений
- •19.1. Запись информации о связях
- •19.2. Пересмотр теорий высказываний
- •19.3. Немонотонное обоснование
- •19.2. Пара конфликтующих выражений
- •19.4. Работа со множеством контекстов
- •19.4.1. Отслеживание истинности предположений, основанное на анализе допущений
- •19.4.2. Использование систем отслеживания истинности предположений для диагностирования на основе моделей
- •19.5. Сравнение различных вариантов организации систем отслеживания истинности предположений
- •Рекомендуемая литература
- •Упражнения
- •Глава 20. Формирование знаний на основе машинного обучения
- •Глава 20.
- •20.1. Индуктивное обучение
- •20.2. Система Meta-dendral
- •20.2.1. Формирование и уточнение правил
- •20.2.2. Пространство версий
- •20.2.3. Алгоритм отсеивания кандидатов
- •20.2.4. Сопоставление экземпляров с образцами в Meta-dendral
- •20.3. Построение дерева решений и порождающих правил
- •20.3.1. Структура дерева решений
- •20.3.2. Алгоритм формирования дерева решений по обучающей выборке
- •20.4. Уточнение наборов правил
- •Рекомендуемая литература
- •Упражнения
- •Глава 21. Сети доверия
- •Глава 21.
- •21.1. Теория Демпстера—Шефера
- •21.1.1. Функции доверия
- •21.1.2. Применение теории Демпстера—Шефера к системе mycin
- •21.2. Методика Перла
- •21.1. Байесовские сети
- •21.3. Сравнение методов неточных рассуждений
- •21.4. Резюме
- •Рекомендуемая литература
- •Упражнения
- •Глава 22. Рассуждения, основанные на прецедентах
- •Глава 22.
- •22.1. База прецедентов
- •22.1.1. Программа chef
- •22.1.2. Методы извлечения и адаптации прецедентов
- •2. Найти соответственное свойство в хранимых прецедентах.
- •3. Сравнить два значения и вычислить степень близости т.
- •4. Умножить эту оценку на вес свойства с.
- •22.2. Обучение с помощью компьютера: система сато
- •22.2.1. Предметная область программы сато
- •22.2.2. Расследования и рассуждения в юриспруденции
- •22.2.3. Обучение с помощью системы сато
- •22.3. Формирование отчетов в системе frank
- •22.4. Сравнение систем, основанных на правилах и прецедентах
- •Рекомендуемая литература
- •Упражнения
- •Глава 23. Гибридные системы
- •Глава 23.
- •23.1. Методы обучения в системе odysseus
- •23.2. Системы odysseus и minerva
- •23.2.1. Оболочка экспертной системы minerva
- •23.2.2. Обучение в системе odysseus
- •23.3. Использование прецедентов для обработки исключений
- •23.4. Гибридный символический подход и нейронные сети
- •23.4.1. Нейронные сети
- •23.4.2. Scalir — гибридная система для извлечения правовой информации
- •23.4.3. Организация обучения в системе scalir
- •23.5. Будущее гибридных систем
- •Рекомендуемая литература
- •Упражнения
- •Глава 24. Заключение
- •Глава 24.
- •24.1. Загадка искусственного интеллекта
- •24.2. Представление знаний
- •24.3. Языки программирования систем искусственного интеллекта
- •24.4. Решение практических проблем
- •24.5. Архитектура экспертных систем
- •Рекомендуемая литература
- •Приложение.
- •А.1. Краткая история clips
- •А.2. Правила и функции в clips
- •А.2.1. Факты
- •А.2.2. Правила
- •А.2.3. Наблюдение за процессом интерпретации
- •А.2.4. Использование шаблонов
- •A.2.5. Определение функций
- •А.3. Объектно-ориентированные средства в clips
- •А.4. Задача "Правдолюбцы и лжецы"
- •А.4.1. Анализ проблемы
- •А.4.2. Онтологический анализ и представление знаний
- •А.4.3. Разработка правил
- •Листинг а.1. Трассировка решения задачи р0
- •Упражнение 1
- •А.4.4. Расширение набора правил — работа с составными высказываниями
- •Упражнение 2
- •Листинг а.2. Трассировка решения задачи р4
- •A.4.5. Обратное прослеживание и множество контекстов
- •Упражнение 3
- •Выявление противоречий
- •Подготовка рабочей памяти к выполнению отката
- •Выполнение отката
- •Упражнение 4
- •Восстановление контекста
- •Упражнение 5
- •А.4.6. Обработка метавысказываний
- •А.4.7. Полный листинг программы
- •А.5. Стиль программирования на языке clips
- •Упражнения
20.2. Система Meta-dendral
В рамках проекта DENDRAL, который был начат в Станфордском университете в 1965 году, была разработана первая система, продемонстрировавшая, что программа может успешно конкурировать с человеком-экспертом в определенной предметной области. Перед экспертной системой стояла задача определения молекулярной структуры неизвестного органического соединения. В экспертной системе использовался слегка модифицированный вариант метода порождения и проверки. Исходной информацией были показания масс-спектрометра, который бомбардировал образец соединения потоком электронов. В результате происходила перестройка структуры соединения и его компонентов. Перемещение отдельных атомов в структуре соединения соответствует отсоединению узла от одного подграфа и присоединению его к другому. Изменение структуры молекул соединения и улавливалось масс-спектрометром.
Проблема состояла в том, что для любой сложной молекулы существует множество вариантов разделения на фрагменты, поскольку в результате бомбардировки могут разрываться разные связи в молекуле, а соответственно и перемещаться могут разные фрагменты молекулы. В этом смысле теория масс-спектрометрии являетсл неполной— мы можем говорить только о вероятности разрыва определенной связи, но никогда не можем точно предсказать, как разделится молекула на фрагменты.
В рамках проекта DENDRAL была разработана программа CONGEN, которая формировала описание полной химической структуры, манипулируя символами, представляющими атомы и молекулы. В качестве входной информации эта программа получала формулу молекулы и набор ограничений, накладываемых на возможные взаимные связи между атомами. Результатом выполнения программы является список всех возможных комбинаций атомов в структуре молекулы с учетом заданных ограничений.
В состав DENDRAL входят также программы, которые помогают пользователю отбрасывать одни гипотезы и ранжировать другие, используя знания о связях показаний масс-спектрометра со структурой молекул соединения. Например, программа MSPRUNE отсеивает те гипотезы-кандидаты, которые предполагают варианты фрагментации, не совпадающие с полученными от масс-спектрометра данными. Программа MSRANK ранжирует оставшиеся гипотезы-кандидаты в соответствии с тем, какая часть пиков масс-спектрограммы, предсказанных этой гипотезой, была действительно обнаружена в полученных экспериментально данных. Таким образом, в экспертной системе DENDRAL фактически реализована стратегия "формирование гипотез и их последующая проверка". Исходные данные служат для формирования некоторого пространства гипотез, которые предсказывают наличие и отсутствие определенных свойств масс-спектрограммы, а затем эти гипотезы сопоставляются с результатами экспериментов.
20.2.1. Формирование и уточнение правил
Программа Meta-DENDRAL формирует на основе рассуждений правила, которые затем используются программой DENDRAL в процессе определения молекулярной структуры неизвестного органического соединения. В первой версии программы Meta-DENDRAL гипотетические правила (гипотезы о правилах) формировались в процессе эвристического поиска, подобного тому, который использовался в самой программе DENDRAL. Другими словами, для формирования правил в этой версии использовалась та же стратегия, что и в системе, применяющей эти правила. Роль программы Meta-DENDRAL во всем комплексе состояла в хом, чтобы помочь химику выявить взаимосвязи между вариантами фрагментации молекул в процессе получения массового спектра и структурными характеристиками компонентов молекулы. Работая совместно, программа и химик решают, какие данные о структуре компонентов представляют интерес, а затем отыскивают спектрометрический процесс, который может объяснить появление таких данных. В результате формируются правила, связывающие структуру с масс-спектрограммой. Затем программа тестирует эти правила и при необходимости модифицирует их так же, как это сделал бы химик. Те правила масс-спектрометрии, которые химик использует для описания фрагментации молекулы, могут быть символически представлены в виде порождающих правил. Например, следующее правило расщепления позволяет представить в программе связь между определенной структурой молекулы и определенным процессом ее расщепления в процессе масс-спектрометрии. Здесь значком "-" представлена связь в молекуле, а значком "*" — место разрыва под воздействием бомбардировки электронами:
N-C-C-C-> N-C*C-C.
В левой части правила представлены характеристики структуры, а в правой — процесс расщепления при формировании массового спектра. Для обучения Meta-DENDRAL используется набор молекул, структура и массовый спектр которых известны. Для этого набора молекул формируются пары "структура-спектр", которые и включаются в обучающую выборку. Хочу обратить ваше внимание на следующее. Хотя "словарь" атомов в подграфах структуры молекулы и невелик, а "грамматика" конструирования подграфов проста, количество формируемых подграфов может быть довольно велико. Поэтому существует опасность экспоненциального взрыва. Учитывая потенциальную опасность экспоненциального взрыва, в Meta-DENDRAL (как, впрочем, и в DENDRAL) используется стратегия "планирование— формирование гипотез— проверка". Фаза планирования в Meta-DENDRAL выполняется программой INTSUM (сокращение от interpretation and summary — интерпретация и суммирование данных). Эта программа должна предложить набор простых процессов, которые можно включить в обучающую выборку. Процессы
Выходная информация программы INTSUM передается программе эвристического поиска RULEGEN, которая играет в Meta-DENDRAL, ту же роль, что и программа CONGEN в DENDRAL. Но в отличие от CONGEN, она формирует не гипотезы о структурах молекул, а более общие гипотетические правила расщепления, которые, например, могут предполагать и множественные разрывы связей в молекулах. Эти правила должны охватывать все случаи, представленные в обучающей выборке, сформированной программой INTSUM. После того как будет сформировано множество гипотетических правил, в дело вступает программа RULEMOD, на которую возложено выполнение последней фазы процесса, — фазы тестирования и модификации правил.
Разделение нагрузки между программами RULEGEN и RULEMOD следующее: программа RULEGEN выполняет сравнительно поверхностный поиск в пространстве правил и формирует при этом приблизительные и избыточные правила, а программа RULEMOD выполняет более глубокий поиск и уточняет набор гипотетических правил.
Алгоритм работы программы RULEMOD и по сей день представляет определенный интерес, хотя со времени ее создания прошло более 30 лет. Задачи, которые решает эта программа, типичны для всех программ тонкой настройки правил.
(1) Устранение избыточности. Данные, поступающие на вход программы (гипотетические правила), могут быть переопределены, т.е. несколько правил, сформированных на предыдущем этапе, объясняют одни и те же факты. Обычно в окончательный набор правил нужно включить только часть из них. При выполнении этой задачи также удаляются правила, которые вносят противоречие во всю совокупность или порождают некорректные предсказания.
(2) Слияние правил. Иногда несколько правил, взятых в совокупности, объясняют сразу множество фактов, и эту совокупность имеет смысл объединить в одно, более общее правило, которое будет включать все позитивные свидетельства и не содержать ни одного негативного. Если удастся отыскать такое совокупное правило, то им заменяются в окончательном наборе все его исходные компоненты.
(3) Специализация правила. Иногда оказывается, что слишком общее правило порождает некорректные предсказания, т.е. в его "зону охвата" попадают и негативные свидетельства. В таком случае нужно попытаться добавить в правило уточняющие компоненты, которые помогут исключить из "зоны охвата" правила негативные свидетельства, но сохранят охват всех позитивных свидетельств. В результате правило станет более специализированным.
(4) Обобщение правила. Поскольку порождение правил выполняется на основе обучающей выборки ограниченного объема, то среди сформированных правил могут оказаться и такие, в которых специализация выходит за рамки разумного. Программа пытается сохранить только минимальный набор условий в левой части правила, необходимый для обеспечения корректности правила на данной тестовой выборке.
(5) Отбор правил в окончательный набор. После обобщения и специализации правил в наборе вся совокупность может снова стать избыточной. Поэтому программа снова повторяет процедуру устранения избыточности, описанную в п. 1.
Все описанные процедуры могут итеративно повторяться до тех пор, пока пользователь не будет удовлетворен сформированным набором правил. Единственное, что после этого еще остается сделать пользователю — присвоить правилам веса. Ниже в этой главе мы покажем, как на практике выполняется формирование набора правил.
Качество правил, сформированных системой Meta-DENDRAL, проверялось на наборе структур, не включенных в обучающую выборку. Они также сравнивались с теми правилами, которые имеются в опубликованных источниках, и анализировались опытными специалистами по спектрометрии органических соединений. Программа успешно "открыла" опубликованные правила и, более того, нашла новые. Способность сформированных правил предсказать вид спектра соединений, ранее ей неизвестных, поразила специалистов. Однако ни DENDRAL, ни Meta-DENDRAL не стали коммерческими программными продуктами, хотя многие идеи, рожденные в процессе работы над этим проектом, и нашли широкое применение в компьютерной химии. Различные модули этих программ были включены в состав других программных комплексов, в частности в системы управления базой данных химических соединений [Feigenbaum and Buchanan, 1993].
