- •Глава 1. Искусственный интеллект — основа новых информационных технологи……………………………... 17
- •Глава 2. Традиционные способы представления и обработки
- •Глава 3. Нечеткие знания и способы их обработки 112
- •Глава 4. Методы приобретения знаний 158
- •Глава 5. Нейронные сети 231
- •Глава 6. Эволюционные аналогии в искусственных
- •Глава 7. Интеллектуальные мультиагентные системы 306
- •Глава 8, Интеллектуальные методы проектирования
- •Глава 6 содержит описание методов обработки информации, основанных на эволюционных аналогиях. Наличие символьной
- •Глава 1
- •1.2.2. Экспертные системы
- •1.2.3 Самообучающиеся системы
- •Глава 2
- •2.1. Отличия знаний отданных
- •2.2.1. Логическая модель представления знаний
- •2.2.4. Модель семантической сети
- •Глава 3
- •0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.9 0.9
- •Глава 4
- •4.1. Стратегии получения знаний
- •4.1.1. Аспекты извлечения знаний
- •4.1.2. Проблемы структурирования знаний
- •4.1.4. Методы извлечения знаний
- •4.1.5. Выявление «скрытых» структур знаний
- •4.3.1. Индуктивные выводы в логике
4.3.1. Индуктивные выводы в логике
Выводы по индукции позволяют на основе обобщения частных фактов получить общие (для некоторого множества объектов) закономерности. В процессе индуктивного обучения формируются новые правила, теории и структуры. Индуктивные выводы возможны в том случае, когда представление результата частично определяется на основе входной информации. В дедуктивных выводах (см. главу 2) диапазон порождаемых представлений не может быть шире диапазона, заданного априори. Диапазон представлений, порождаемых в процессе индуктивного вывода, шире, чем диапазон, заданный изначально.
Пусть Р — множество известных фактов, имеющихся в БЗ, а Н — некоторая гипотеза (направленная на обобщение этих фактов). Если Р выводится из Н, то будем считать гипотезу Н истинной. Это можно записать в виде
Рассмотрим пример. Пусть множество Р включает факты:
Предикатимеет интерпретацию «Объект X имеет
дом». На основе заданного множества фактов Р выдвигаем гипотезукоторая соответствует обобщению следующего вида: «Любой объект X имеет дом». Гипотеза //является истинной для любого факта из множества Р, следовательно, Р выводимо из Я, и мы вправе считать гипотезу Н истинной. Замена констант «Иванов», «петров» и «сидоров» обобщающей переменной (УХ) расширяет область действия предиката ДОМ(Х) за пределы множества Р. Например, при появлении нового объекта «березкин» можно получить вывод ДОМ(березкин), хотя из Р этого не следует. Следовательно, диапазон объектов расширился по
205
.
сравнению с исходным, а гипотеза Н может быть помещена в БЗ как новый элемент знаний. За счет расширения множества Р появляется возможность вывести новые заключения, которые также можно включить в БЗ. Однако при расширении класса объектов всегда есть возможность совершить ошибку. Например, если в рассмотренном примере появляется объект «береза», то приходим к странному выводу — ДОМ(6ереза). Очевидно, обобщение Я является слишком широким в данном случае. Попытаемся сузить его, ограничив количество объектов. Пусть
что можно интерпретировать фразой
«гипотеза Н истинна, если подмножество Р2 множества Р можно вывести из гипотезы Ни оставшегося подмножества Р{». Допустим, подмножества Р\ и Р2 имеют вид:
На основании нового множества Р можно выдвинуть другую гипотезукоторая накладывает
офаничение на область подстановки объектов в переменную X, так как в данном случае этот объект должен быть человеком. Теперь при появлении объекта «березкин» можно вывести факт , но при появлении объекта «береза» значением предиката ЧЕЛОВЕК(6ереза) будет «ложь» и, следовательно, факт не будет выведен.
Если в множество Р добавить информацию о существовании людей, не имеющих дома, т.е. в множество Рх добавить формулу
то при подстановке объекта «березкин» не сможем вывести предикат ДОМберезкин), так как принадлежность к роду человеческому в данном случае не является достаточным условием для владения недвижимостью. Следовательно, диапазон объектов подстановки необходимо сделать еще уже. Модифицируем подмножество Р1, добавив еще одно условие:
Выдвинем новую гипотезу Н2:
206
Теперь будем получать правдоподобные выводы, так как множество объектов для возможных подстановок в приведенные формулы ограничено людьми — владельцами домов.
Традиционный метод обобщения состоит в выборе гипотезы минимального обобщения среди большого числа возможных гипотез, в которых объекты из заданного множества фактов (Р2) заменяются переменной и которые расширяют диапазон применения исходных логических формул. Гипотеза Н2 в рассмотренном примере называется минимальным обобщением. Для того чтобы формализовать процесс минимального обобщения, необходимо иметь правила, с помощью которых можно выбрать ту или иную гипотезу. Например, чтобы увидеть, какое из офаничений сильнее ЧЕЛОВЕК(Х) или ВЛАДЕЛЕЦ{Х), необходимо иметь правило вида
Если такие правила сформулированы в системе, то процесс замены констант на переменные не представляет особых трудностей. Удаление из БЗ фактов, противоречащих установленным правилам, обычно не вызывает осложнений. Трудной проблемой является создание новых предикатов, поскольку эта операция не-формализуема.
Таким образом, индуктивный вывод — это построение объясняющего правила на основе заданных данных. В системах с индуктивными выводами на каждом шаге необходимо объяснять все данные, полученные к заданному моменту времени. Данные, полученные на последующих шагах, могут не удовлетворять ранее полученным объяснениям. В этом случае следует корректировать полученные ранее объясняющие правила (гипотезы). Следовательно, процесс индуктивного обучения может оказаться весьма длительным, что вполне согласуется с процессом обучения человека.
Для реализации индуктивного вывода необходимо:
сформулировать множество правил — объектов вывода;
выбрать формальный метод представления правил;
определить способ получения информации извне (показ примеров);
задать формальный метод вывода;
• сформулировать критерий правильности вывода. Индуктивные выводы выполняются в процессе бесконечного
повторения цикла, включающего процедуры запроса входных
207
данных, формирования гипотез, получения и проверки результатов. В настоящее время индуктивные выводы часто используются для порождения объясняющих гипотез в системах с правдоподобными рассуждениями абдуктивного типа, в которых могут быть построены различные обобщения базовой теории, соответствующие наблюдаемым фактам.
4.3.2.
ДСМ-МЕТОД
Сокращение ДСМ расшифровывается Джон Стюарт Милль. Этот ученый в середине XIX в. предложил принципы индуктивного вывода, которые положены в основу метода автоматического порождения гипотез. Способы установления причинно-следственных отношений, предложенные Миллем, основываются на идеях выявления сходства и различия в наблюдаемых ситуациях. Способность улавливать сходство и выделять различия — фундаментальная способность, присущая, по-видимому, всем живым существам. Опираясь на эту способность, Милль сформулировал следующие принципы индукции.
1. Принцип единственного различия: «Если после введения какого-либо фактора появляется (или после его удаления исчезает) известное явление, причем мы не вводим и не удаляем никакого другого обстоятельства, которое могло бы иметь влияние, то указанный фактор составляет причину явления» [34]. Этот принцип можно проиллюстрировать схемой:
Знак => трактуется как появление D при наличии А, В, С. При достаточном количестве экспериментов принцип единственного различия позволяет утверждать, что А является причиной, a D — следствием.
2. Принцип единственного сходства, который гласит: «Если все обстоятельства явления, кроме одного, могут отсутствовать, не уничтожая этим явления, то это обстоятельство является причиной данного явления». Схема такова:
208
Из этой схемы следует, что А и D связаны причинно-следственным отношением.
3. Принцип единственного остатка: «Если вычесть из какого-либо явления ту его часть, которая является следствием известных причин, то остаток явления есть следствие остальных причин». Рассмотрим схему:
После того как из примеров А, В, С =>D, Е было «вычтено» причинно-следственное отношение A=>D, были получены наблюдения В, С=>Е, на основании которых можно предположить, что В и С являются возможными причинами явления Е. Для дальнейшего уточнения нужно проверить, приводит ли исключение В к появлению Е, Если так, то причиной явления E служит С, в противном случае - В. Возможно также, что явление Е обусловлено одновременным наличием В и С, т.е. появление некоторого элемента ситуации может определяться не отдельными факторами, а
их совокупностью.
Схемы Милля справедливы лишь при условии, что в описании ситуации присутствует полное множество наблюдаемых фактов и явлений.
Сущность ДСМ-метода заключается в следующем. Пусть задано множество причинмножество следствий и множество оценок. Выражение вида Ai=>Bj называется положительной гипотезой, выражающей утверждение «Aj является причиной Вj с оценкой достоверности. Отрицательной гипотезой называется выражение которое формулируетсяне является причиной В, соценкой достоверности. Положительные гипотезы будем обо-
209
значатьотрицательныеСреди значений выделим дваспециальных, которые можно интерпретировать как «ложь» (0) и «истина» (1). Гипотезы с этими оценками можно рассматривать как явления, истинность или ложность которых твердо установлена. Остальные значения между 0 и 1 будем обозначать рациональными числамиа п характеризует число примеров.
Обобщенный алгоритм ДСМ-метода включает следующие шаги.
1. На основе исходного множества положительных и отрицательных примеров (наблюдений) формируется набор гипотез, которые записываются в матрицыГипотезы формируются на основе выявления сходства и различия в примерах. Матрицы имеют вид:
2. К исходному множеству примеров добавляются новые на блюдения, которые могут либо подтверждать выдвинутые гипо тезы, либо опровергать их, при этом оценки гипотез изменяются следующим образом. Если некоторая гипотезаимела оценку
то при появлении нового примерапроводится проверка на подтверждение этой гипотезы. В случае положительного ответа оценка, иначе. В процессе накопления информации оценки выдвинутыхгипотез могутприближаться к 1 или 0. Изменение оценок может также иметь колебательный характер, что, как правило, ведет к исключению таких гипотез из множествили
3. Циклическое добавление примеров, сопровождающееся изменением оценок достоверности гипотез с периодическим из менением множестви
4. Завершение процесса индуктивного вывода при выполне нии условий окончания цикла. В качестве таких условий могут использоваться меры близости значенийк 0 или 1, а также до-
210
полнительные условия, которые могут быть связаны с офаниче-нием времени (количества новых примеров) вывода и т.п.
В современных модификациях ДСМ-метода используются выводы по аналогии, проводится учет контекста реализации причинно-следственных отношений, применяются нечеткие описания фактов и т.д. [3, 29, 43].
4.4.
СРЕДСТВА КОМПЬЮТЕРНОЙ ПОДДЕРЖКИ
ПРИОБРЕТЕНИЯ ЗНАНИЙ
Проблема автоматизированного приобретения знаний связана с разработкой специальных информационных технологий, обеспечивающих поддержку процедур извлечения и структурирования знаний. К настоящему времени автоматизированные системы приобретения знаний прошли в своем развитии три стадии.
На первой стадии в середине 1980-х гг. появилось первое поколение систем приобретения знаний на базе «оболочек» экспертных систем. Процессы извлечения и структурирования знаний выполнялись человеком. Подсистема приобретения знаний служила для ввода знаний в БЗ и ее корректировки. Экспертные системы заполнялись знаниями по следующей схеме:
создание конкретной экспертной системы;
опустошение базы знаний;
разработка системы приобретения знаний для нового на полнения БЗ;
формирование базы знаний для другой экспертной системы.
На второй стадии в конце 1980-х гг. появились системы приобретения знаний второго поколения, основанные на предварительном детальном анализе предметной области и моделях, позволяющих рассматривать процедуры извлечения, структурирования и формализации знаний как процесс преобразования лингвистических знаний в другие представления и структуры [11]. Существенное влияние на системы второго поколения оказала психосемантика, на базе которой были созданы инструментальные средства многомерного шкалирования, факторного анализа, репертуарных решеток, логического вывода.
Третья стадия развития систем приобретения знаний (с 1990-х гг.) связана с созданием автоматизированных средств
211
приобретения знаний. При этом структура БЗ формируется в процессе приобретения знаний, а не заранее.
Множество существующих и потенциально возможных систем приобретения знаний можно отобразить классификацией, предложенной в работе [11] (табл. 4.6).
Таблица 4.6
Методы и системы приобретения знаний
Метод ■ приобретения знаний |
Наименование системы и авторы |
Характеристика |
Структурированное интервью |
RESIAS (Davis R.) [55] ROGET (Bennet J.) [52] SALT (Markus S.) [70] MOLE (Eshelman L.) [59] OPAL(MuzenM.)[71] МЕДИКС (Ларичев О.И.) [10] |
Формирует новые понятия и правила Производит концептуальную организацию знаний для диагностических ЭС Формирует базы знаний в области конструирования методом пошагового распространения ограничений Обеспечивает контекстное приобретение знаний на основе структурированного интервью Обеспечивает формирование и наращивание БЗ экспертной системы, дающей советы по лечению онкологических больных Использует процедуры экспертной классификации для независимых свойств, признаков и их значений. Повышение эффективности экспертной классификации обеспечивается за счет применения априорно заданного отношения линейного порядка на множестве состояний |
Имитация консультаций |
АРИАДНА (Моргоев В.) [30] ЭСКИЗ (Андриенко Г.) [3] |
Реализует метод многократного решения экспертом проблемы классификации в режиме последовательной вопросно-ответной консультации Включает набор игр для приобретения знаний, являющихся модификациями метода репертуарных решеток |
Продолжение
Метод приобретения знаний |
Наименование системы и авторы |
Характеристика |
Интегрированные среды приобретения знаний |
AQUINAS (Boose J.) [53] KITTEN (Shaw M.) [73] |
Содержит набор программных средств для извлечения экспертных знаний разными методами: средства анализа репертуарных решеток с последующим преобразованием системы конструктов в базу продукционных правил; методы конструирования иерархических структур знаний; средства извлечения и представления неточных знаний; подсистемы тестирования, пополнения и коррекции базы знаний и др. Основана на построении и анализе репертуарных решеток. В отличие от AQUINAS данная интегрированная среда обеспечивает извлечение элементов из тестов, анализирует примеры решения задач экспертом и генерирует продукционные правила |
Приобретение знаний из текстов |
KRITON (Diderich J.) [57] ТАКТ (Kaplan R.) [65] |
Выявляет процедурные знания на основе метода протокольного анализа из книг, документов, описаний, инструкций Выделяет из предварительно подготовленного текста объекты, процессы и отношения каузального характера |
Инструментарий прямого приобретения знаний |
SIMER + MIR (Осипов Г.С.) [33] |
Позволяет формировать модели и базы знаний предметной области с неясной структурой объектов, неполно описанным множеством свойств объектов, большим набором разнородных связей между объектами |
212
213