- •1.Введение в экспертные системы. Основные понятия и определения Общие сведения о соз
- •1.1.Назначения и основные свойства экспертных систем
- •1.2.Состав и взаимодействие участников построения и эксплуатации экспертных систем
- •1.3.Преимущества использования экспертных систем
- •1.4.Особенности построения и организации экспертных систем
- •1.5.Основные режимы работы экспертных систем
- •1.6.Отличие экспертных систем от традиционных программ
- •1.7.Технология разработки экспертных систем
- •1.8. Классификация экспертных систем
- •1.9 База знаний как элемент экспертной системы
- •1.10. Необходимые условия представления знаний
- •Элементы экспертной системы
1.9 База знаний как элемент экспертной системы
База знаний содержит факты и правила. Факты – это фразы без условий, они содержат утверждения, которые всегда абсолютно верны. Правила содержат утверждения, истинность которых зависит от некоторых условий, образующих тело правила.
Факты содержат краткосрочную информацию в том смысле, что они могут меняться, например, в ходе время консультации.
Правила представляют собой долговременную информацию о том, как порождать новые факты или гипотезы из того, что сейчас известно.
Чем такой подход отличается от обычной методики использования БД?
О
сновное
различие состоит в том, что БЗ обладает
большими «творческими» возможностями.
Факты в БД обычно пассивны: они там либо там есть, либо их нет.
БЗ, с другой стороны, активно пытается пополнить недостающую информацию.
1.10. Необходимые условия представления знаний
Одной из основных проблем, характерных для СОЗ, является проблема представления знаний. Это объясняется тем, что форма представления знаний оказывает существенное влияние на характеристики и свойства системы.
Представление знаний изображено на рис.
Для возможности оперирования знаниями из реального мира с помощью ПК, необходимо осуществить их моделирование (по аналогии с построением концептуальных и логических моделей БД). При этом необходимо отличать знания, предназначенные для обработки компьютером от знаний, используемых человеком.
При проектировании модели представления знаний следует учитывать такие факторы, как:
однородность представления и
простота понимания
Однородность представления приводит к упрощению механизма управления логическим выводом и управлением знаниями.
Простота понимания предполагает доступность понимания представления знаний и экспертам, и пользователем системы. В противном случае затрудняется приобретение знаний и их оценка.
Однако выполнить эти требования в равной степени, как для простых, так и сложных задач довольно трудно. В настоящее время для представления знаний используют следующие виды моделей:
модель на базе логики;
продукционная модель;
модель семантической сети;
модель, основанная на использовании фреймов и др.
Иллюстрацией логической модели является приведенный выше пример.
Основная идея логического подхода состоит в том, чтобы рассматривать всю систему знаний необходимую для решения прикладных задач, как совокупность фактов (утверждений).
Факты представляются как формулы в некоторой логике (первого или высшего порядка, многозначной, нечеткой или др.) Система знаний отображается совокупностью таких формул и, представленная в ЭВМ, она образует БЗ.
Формулы неделимы и при модификации БЗ могут лишь добавляться или удаляться.
Логические методы обеспечивают развитый аппарат вывода новых фактов из тех, которые явно представлены в БЗ.
О
сновным
примитивом манипуляции знаниями является
операция вывода.
Реальный мир
Мир СОЗ (ЭС)
Модель
представления
знаний
Требования:
однородность
представления;
простота
понимания
Знания
используемые
человеком
Знания
используемые
компьютером для обработки
Модели на базе логики (логические)
Продукционные
модели
Модели
семантической сети
Фреймовые модели
Рис. Представление знаний
Пять форм знаний
Z1 Знания в памяти человека.
Z2 Материализованные знания:
монографии
статьи
учебники
Z3 Поле знаний. (Полуформализованное описание Z1 и Z2.)
Z4 Формализация Z3. (Знания на языках представления знаний.)
Z5 База знаний в ЭВМ. (На машинных носителях информации.)
Z2
Z3
Z1
Z4
Z5
Человек часто решает трудные и интересные проблемы, используя не четкие алгоритмы, а исключительно свой опыт в форме накопленных знаний Z1; часть своего опыта человечество материально запечатлевает в форме книг, статей, заметок, таблиц (Z2). Совокупность Z1 и Z2 образуют знания о предметной области (ПО), не связанные с машинной обработкой. Существуют различные определения Z1 и Z2.
Можно называть Z2 канонизированными знаниями, поскольку это признанная специалистами часть знаний Z1, которые называются концептуальными.
В ЭС используется
экстракт того, что извлекли из Z1
и Z2,
то есть знания
и
.
При этом соотношение эмпирического
опыта
и его формализованной теоретической
основы
в разных областях различно.
Принято считать, что чем больше вес Z1 в процессе принятия решения, тем более пригодна для внедрения экспертной системы предметная область. Для разработки ЭС принципиально важным оказывается разработка поля знаний Z3, когда создается некоторое полуформализованное описание понятий ПО и связи между ними. Это описание может иметь форму таблиц, рисунка, схемы, сети и др. В дальнейшем Z3 переписывается на некотором языке представления знаний (ЯПЗ) для получения модели знаний Z4.
Современные теории ИИ представляют разработчикам много возможностей для описания базы знаний на стадии Z4:
Математическая логика первого порядка
Процедурные языки типа OPS5
Семантические сети и волновые языки
Фреймы и языки типа FRL
Объектно-ориентированные языки, например SMALLTALK и др.
Со многими из них мы познакомимся при изучении данного курса.
Z4 заносится на магнитные носители – в базу знаний Z5.
Следует сразу ограничить сферу предметных областей, где имеет смысл выделять знания. Это предметные области с преобладанием эмпирических знаний, где накопление фактов опережает развитие теории (юриспрудениция, финансы, медицина, биология). Такие хорошо структурированные ПО, как математика, физика, теоретическая механика имеют богатый математический аппарат для описания своих закономерностей, который позволяет проводить математическое моделирование с использованием традиционного алгоритмического программирования (без выделения знаний). Поэтому, например, в точных науках ЭС не получили развития (кроме вывода доказательства теорем).
Знания важны там, где определения размыты, понятия меняются (курс $ с течением времени – колебания имеют разное значение), ситуация зависит от множества контекстов, где велика неопределенность, нечеткость информации.
В качестве рабочего понятия примем следующее определение знаний:
Знания – это основные закономерности предметной области, позволяющие человеку решать конкретные научные, производственные и другие задачи, то есть факты, понятия, взаимосвязи, оценки, правила, эвристики (фактические знания), а также стратегии принятия решений в этой области (иначе стратегия знаний).
Многие правила ЭС являются эвристическими т.е. эмпирическими правилами или упрощениями, которые эффективно ограничивают поиск решения. ЭС использует эвристики, потому что задачи, которые она решает, будь то поиск новых месторождений или согласование исков, как правило трудны и не до конца понятны. Эти задачи не поддаются строгому математическому анализу или алгоритмическому решению. Эвристики уменьшают время решений задачи путем сокращения числа переборов в заданном пространстве поиска. Их можно сравнивать с фильтрами в процессе сопоставления по образу, которые дают возможность системе сфокусировать внимание лишь на нескольких основных образцах.
Алгоритмический же метод гарантирует корректное или оптимальное решение задачи.
Использование эвристических правил делает поиск решения намного более легким и практичным.
Рассмотрим в чем же различия между знаниями и данными.
По аналогии со знаниями можно выделить ряд форм данных, а именно:
D1 – результат наблюдения над объектами (температура, дата рождения и тд.)
D2 – фиксация данных на материальном носителе (таблицы, графики).
D3 – модель данных: некоторая схема, описание, связывающее несколько объектов (температура и дата ее измерения).
D4 – данные на языке описания данных (ЯОД).
D5 – база данных на машинном носителе информации.
У Z и D много общего, но знания обычно имеют более сложную структуру, их иногда называют “хорошо структурированными данными или метаданными, или данными о данных”.
Можно отметить еще один аспект, отражающий различие данных и знаний. Любое понятие, используемое человеком имеет как бы две стороны – экстенсионал и интенсионал.
Экстенсионал – набор конкретных фактов, соответствующих данному понятию.
Интенсионал – определение или описание некоторого понятия представленное через его свойства .
