
- •Архитектуры и модели программ и знаний
- •Классические ЭС и инструменты их построения
- •Система MYCIN (1975)
- •Представление знаний в MYCIN
- •Предикаты в MYCIN
- •Правила в MYCIN
- •Дерево контекстов в MYCIN
- •Стратегия вывода в системе MYCIN
- •Значение системы MYCIN
- •Ограничения системы MYCIN
- •Литература по классическим ЭС
- •Объяснение и извлечение знаний: Подход системы TEIRESIAS
- •Уровни знаний
- •Метазнания в системе TEIRESIAS
- •Возможные проблемы и ошибки в процессе извлечения знаний
- •Литература по извлечению знаний в классических экспертных системах
- •Data mining
- •Применение data mining
- •Вопросы и домашнее задание к лекции 30

Архитектуры и модели программ и знаний
Лекция 30
Классические ЭС, методы и проблемы их разработки.
Извлечение знаний. Концептуализация. Формализация
Сафонов Владимир Олегович
Профессор кафедры информатики Заведующий лабораторией Java-технологии
(http://polyhimnie.math.spbu.ru/jtl)
Санкт-Петербургский государственный университет
Email: vosafonov@gmail.com
WWW: http://www.vladimirsafonov.org

Классические ЭС и инструменты их построения
Системы MYCIN и TEIRESIASСистема PROSPECTOR
Системы AM и EURISKO; Подход Д. ЛенатаСистема и язык EXPERT
Системы и языки OPS5 и OPS83Использование языков LISP и PROLOGСистема GURU
Язык Турбо-Эксперт
Система JESS (Java Expert Systems Shell)Обзор современных систем, основанных на
знаниях
(C) Сафонов В.О. 2012

Система MYCIN (1975)
Stanford University, Knowledge Systems Lab
(KSL)
Научный руководитель проекта – Prof. Ed.
Shortliffe
Первая продукционная ЭС, использующая
также нечеткость, основанную на CFЭС диагностики инфекционных
заболеваний крови; по качеству своих экспертных выводов конкурентноспособна с экспертами-медиками
TEIRESIAS – система объяснения и
приобретения знаний для MYCIN (R. Davis, 1979)
(C) Сафонов В.О. 2012

Представление знаний в MYCIN
Факты – четверки вида (O A V CF), где
A – атрибут, O – объект, V – значение атрибута, CF – коэффициент уверенности данного фактаПравила – конструкции вида
(IF A THEN S1 … Sn); будем записывать их без скобок
A – условие правила; может быть фактом,
предикатом, конъюнкцией или дизъюнкцией фактов и (или) предикатов
Si – заключения правила (действия); в
каждом из них указан свой коэффициент уверенности
(C) Сафонов В.О. 2012

Предикаты в MYCIN
Служат для перехода от нечетких
высказываний к обычным, т.е. оценивают CF заданного факта
Имеют вид (Pred A O V), где Pred – имя
предиката; A, O, V – тройка, характеризующая некоторый факт, но без его CF
Примеры предикатов:
(SAME A O V) – истинно, если в рабочем множестве содержится факт с тройкой (A, O, F) и с CF >= 0.2
(DEFINITE A O V) – истинно, если CF факта равен 1
(C) Сафонов В.О. 2012

Правила в MYCIN
Условия – факты, предикаты, их дизъюнкции или
конъюнкции
Нечеткость основана на CF ( in [-1, 1] )CF (A1 & … & Ak) = MIN [ CF(A1), …, CF(Ak) ]CF (A1 V … V Ak) = MAX [ CF(A1), …, CF(Ak) ]CF заключения = CF условия * CF правилаЗаключение правила – одна или несколько
конструкций вида (CONCLUDE A O V CF) – занесение в рабочее множество указанного факта; итоговый CF получается умножением на CF условия; при
совпадении факта применяется правило комбинации для CF
(C) Сафонов В.О. 2012

Дерево контекстов в MYCIN
По существу, иерархия понятий |
||
Фиксированная структура; соотношение |
||
понятий не может меняться; новые |
||
понятия создаваться не могут; фреймов |
||
для более гибкого выражения |
||
концептуальных знаний в MYCIN нет |
||
PATIENT |
\ |
|
/ |
… |
|
CULTURE1 … CULTUREn |
||
/ |
\ |
… / … \ |
ORGANISM1 … |
ORGANISMk |
Используется в диалоге с пользователем
(C) Сафонов В.О. 2012

Стратегия вывода в системе MYCIN
Обратная цепочка рассужденийВывод всех возможных диагнозов и
методов лечения, со своими CF (а не первого подходящего)
С целью оптимизации вывода сначала
система пытается найти путь вывода, при котором все CF равны единицеЛабораторные данные (LABDATA – свойство
атома, соответствующего имени атрибута) : для таких данных система не пытается найти вывод, а запрашивает их у пользователя (температура, давление и др.)
(C) Сафонов В.О. 2012

Значение системы MYCIN
Практически доказала применимость
продукционного подходаБыла первой системой с нечетким выводом
Стимулировала целый ряд аналогичных
проектов (PUFF, etc.)
Дальнейшее развитие – TEIRESIAS,
NEOMYCIN
Стимулировала создание в дальнейшем
большого числа коммерческих фирм по созданию ЭС (на базе университетских лабораторий)
Показала и ограничения подхода
(C) Сафонов В.О. 2012

Ограничения системы MYCIN
Применимость лишь для диагностических
задачОграниченность способа представления
знаний: отсутствие метазнаний, фреймовОтсутствие возможности выражения
зависимости знаний от времени, характерного для медицинских знаний по их природе)
(C) Сафонов В.О. 2012