Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Петрова / Учебное пособие ТЭС.doc
Скачиваний:
314
Добавлен:
09.02.2015
Размер:
7.29 Mб
Скачать

5. Представление знаний.

Первый и основной вопрос, который надо решить при представлении знаний, - это вопрос определения состава знаний, т.е. определение того, "ЧТО ПРЕДСТАВЛЯТЬ" в экспертной системе. Второй вопрос касается того, "КАК ПРЕДСТАВЛЯТЬ" знания. Необходимо отметить, что эти две проблемы не являются независимыми. Действительно, выбранный способ представления может оказаться непригодным в принципе либо неэффективным для выражения некоторых знаний.

Вопрос "КАК ПРЕДСТАВЛЯТЬ" можно разделить на две в значительной степени независимые задачи: как организовать (структурировать) знания и как представить знания в выбранном формализме.

Стремление выделить организацию знаний в самостоятельную задачу вызвано, в частности, тем, что эта задача возникает для любого языка представления и способы решения этой задачи являются одинаковыми (либо сходными) вне зависимости от используемого формализма.

Итак, в круг вопросов, решаемых при представлении знаний, будем включать следующие:

  • определение состава представляемых знаний;

  • организацию знаний;

  • представление знаний, т.е. определение модели представления. Состав знаний ЭС определяется следующими факторами:

  • проблемной средой;

  • архитектурой экспертной системы;

  • потребностями и целями пользователей;

  • языком общения.

В соответствии с общей схемой статической экспертной системы для ее функционирования требуются следующие знания:

  • знания о процессе решения задачи (т.е. управляющие знания), используемые интерпретатором (решателем);

  • знания о языке общения и способах организации диалога, используемые лингвистическим процессором (диалоговым компонентом);

  • знания о способах представления и модификации знаний, используемые компонентом приобретения знаний;

  • поддерживающие структурные и управляющие знания, используемые объяснительным компонентом.

Для динамической ЭС, кроме того, необходимы следующие знания:

1) знания о методах взаимодействия с внешним окружением;

2) знания о модели внешнего мира.

Зависимость состава знаний от требований пользователя проявляется в следующем:

  • какие задачи (из общего набора задач) и с какими данными хочет решать пользователь;

  • каковы предпочтительные способы и методы решения;

  • при каких ограничениях на количество результатов и способы их получения должна быть решена задача;

  • каковы требования к языку общения и организации диалога;

  • какова степень общности (конкретности) знаний о проблемной области, доступная пользователю;

  • каковы цели пользователей.

Состав знаний о языке общения зависит как от языка общения, так и от требуемого уровня понимания.

С учетом архитектуры экспертной системы знания целесообразно делить на интерпретируемые и не интерпретируемые. К первому типу относятся те знания, которые способен интерпретировать решатель (интерпретатор). Все остальные знания относятся ко второму типу. Решатель не знает их структуры и содержания. Если эти знания используются каким-либо компонентом системы, то он не "осознает" этих знаний. Не интерпретируемые знания подразделяются на вспомогательные знания, хранящие информацию о лексике и грамматике языка общения, информацию о структуре диалога, и поддерживающие знания. Вспомогательные знания обрабатываются естественно-языковой компонентой, но ход этой обработки решатель не осознает, так как этот этап обработки входных сообщений является вспомогательным для проведения экспертизы. Поддерживающие знания используются при создании системы и при выполнении объяснений. Поддерживающие знания выполняют роль описаний (обоснований) как интерпретируемых знаний, так и действий системы. Поддерживающие знания подразделяются на технологические и семантические. Технологические поддерживающие знания содержат сведения о времени создания описываемых ими знаний, об авторе знаний и т.п. Семантические поддерживающие знания содержат смысловое описание этих знаний. Они содержат информацию о причинах ввода знаний, о назначении знаний, описывают способ использования знаний и получаемый эффект. Поддерживающие знания имеют описательный характер.

Интерпретируемые знания можно разделить на предметные знания, управляющие знания и знания о представлении. Знания о представлении содержат информацию о том, каким образом (в каких структурах) в системе представлены интерпретируемые знания.

Предметные знания содержат данные о предметной области и способах преобразования этих данных при решении поставленных задач. Отметим, что по отношению к предметным знаниям знания о представлении и знания об управлении являются метазнаниями. В предметных знаниях можно выделить описатели и собственно предметные знания. Описатели содержат определенную информацию о предметных знаниях, такую, как коэффициент определенности правил и данных, меры важности и сложности. Собственно предметные знания разбиваются на факты и исполняемые утверждения. Факты определяют возможные значения сущностей и характеристик предметной области. Исполняемые утверждения содержат информацию о том, как можно изменять описание предметной области в ходе решения задач. Говоря другими словами, исполняемые утверждения - это знания, задающие процедуры обработки. Однако мы избегаем использовать термин "процедурные знания", так как хотим подчеркнуть, что эти знания могут быть заданы не только в процедурной, но и в декларативной форме.

Управляющие знания можно разделить на фокусирующие и решающие. Фокусирующие знания описывают, какие знания следует использовать в той или иной ситуации. Обычно фокусирующие знания содержат сведения о наиболее перспективных объектах или правилах, которые целесообразно использовать при проверке соответствующих гипотез (см. п. 9.2). В первом случае внимание фокусируется на элементах рабочей памяти, во втором - на правилах базы знаний. Решающие знания содержат информацию, используемую для выбора способа интерпретации знаний, подходящего к текущей ситуации. Эти знания применяются для выбора стратегий или эвристик, наиболее эффективных для решения данной задачи.

Качественные и количественные показатели экспертной системы могут быть значительно улучшены за счет использования метазнаний, т.е. знаний о знаниях. Метазнания не представляют некоторую единую сущность, они могут применяться для достижения различных целей. Перечислим возможные назначения метазнаний :

1) метазнания в виде стратегических метаправил используются для выбора релевантных правил;

2) метазнания используются для обоснования целесообразности применения правил из области экспертизы;

3) метаправила используются для обнаружения синтаксических и семантических ошибок в предметных правилах;

4) метаправила позволяют системе адаптироваться к окружению путем перестройки предметных правил и функций;

5) метаправила позволяют явно указать возможности и ограничения системы, т.е. определить, что система знает, а что не знает.

Вопросы организации знаний необходимо рассматривать в любом представлении, и их решение в значительной степени не зависит от выбранного способа (модели) представления.

Выделим следующие аспекты проблемы организации знаний:

  • организация знаний по уровням представления и по уровням детальности;

  • организация знаний в рабочей памяти;

  • организация знаний в базе знаний.

Рассмотрим особенности знаний, которые отличают их от данных.

Д

Интерпретируемость

анные, помещенные в ЭВМ, могут содержательно интерпретироваться лишь соответствующей программой. В отрыве от программы данные не несут никакой содержательной информации. Знания отличаются тем, что в них возможность содержательной интерпретации всегда присутствует.

Н

Наличие классифицирующих отношений

есмотря на разнообразие форм хранения данных, ни одна из них не обеспечивает возможности компактного описания всех связей между различными типами данных.

При работе с данными, характеризующими как отдельные элементы множества, так и все множество в целом, приходится многократно описывать одни и те же сведения, общие для элементов и множества. При переходе к знаниям между отдельными единицами знаний можно установить отношения типа "элемент-множество","тип-подтип" и т.д.

Это позволяет записать и хранить отдельно информацию, одинаковуб для всех элементов множества.

Э

Наличие ситуативных связей

ти связи определяют ситуативную совместимость отдельных событий или фактов, хранимых или вводимых в память, а также такие отношения, как одновременность, расположение в одной области пространства, нахождение в состоянии механического взаимодействия. Они помогают строить процедуры анализа знаний на совместимость, противоречивость и другие, которые трудно реализовать в традицтонных массивах данных.

Появление знаний как информационных объектов определило переход от баз данных к базам знаний.

Базы знаний содержат сведения, отражающие закономерности данной предметной области и позволяющие прогнозировать и выводить новые факты, не отраженные в базе данных.

База данных включает фактографические, количественные данные, характеризующие предметную область.

Знания , представленные в форме структуры знаний называют экстенсионалыми знаниями, а знания, представленные в форме таблиц понятий и описывающие абстрактные объекты, события, отношения называют интенсиональными знаниями.

В качестве примеров можно привести таблицу 5.1

Таблица 5.1

Интенсиональные знания

Данные

Производительность оборудования

56000 изд/час

Энергоемкость оборудования

281 квт/час

Трудоемкость выполнения операции

24

и т. д.

Экстенсиональные знания представлены на рис.5.1

Рис.5.1

Можно выделить три типа знаний, представленные в таблице 5.2.:

Таблица 5.2

Синтаксические

Характеризуют синтаксическую структуру

описываемого объекта или явления, которая не зависит от смысла или содержания используемых при этом понятий.

Семантические

Содержат информацию, непосредственно связанную со значениями и смыслом описываемых явлений или объектов.

Прагматические

Описывают явления или объекты с точки зрения решаемой задачи, на пример, с учетом действующих в данной задаче специфических критериев.

Трем типам знаний соответствуют три типа моделей для их представления: синтаксические, семантические и прагматические. Наличие семантических и прагматических моделей является наиболее существенным признаком, отличающим ЭС от других программно-аппаратных средств.

Как уже отмечалось ранее, основным вопросом при представлении или описании знаний является выбор способа представления или описания знаний. Рассмотрим более подробно различные типы моделей представления знаний и опишем используемый при этом математический аппарат.

Для описания внешнего мира и поиска решений в ЭС широко используются ЯЗЫК И АППАРАТ ИСЧИСЛЕНИЯ ПРЕДИКАТОВ. Знакомство с исчислением предикатов начнем с рассмотрения исчисления высказываний.

В математической логике высказыванием называется такое предложение, которое истинно или ложно. Условимся высказывания обозначать прописными латинскими буквами без индексов и с индексами А, В, С ... и называть ПРОПОЗИЦИОНАЛЬНЫМИ.

Так как высказывания могут быть ИСТИННЫМИ и ЛОЖНЫМИ, пропозициональные буквы могут принимать

истинные значения - И ( 1 )

ложные значения - Л ( 0 )

Более сложные высказывания можно получить, используя истинностно-функциональные зависимости

F ( А , В , С , . . .),

которые определяются истинностными значениями А,В,С,... и задаются с помощью истинностных таблиц.

Истинностной функией от n аргументов называется всякая функция от n истинностных аргументов, принимающая истинностные значения И или Л.

Сложные высказывания образуются с помощью логических операций (табл. 5.3)

Таблица 5.3

отрицание или дополнение к А

-А (не А)

конъюнкция или логическое умножение А и В

А&В (А И В)

дизъюнкция или логическое сложение А и В

АvВ (А или В)

импликация или следование В из А

А ->В (если А,то В)

эквивалентция или эквивалентность

А = В (А тогда и только тогда, когда В)

Ниже приведена истинностная таблица 5.4, определяющая элементарные составные высказывания.

Таблица 5.4

А

В

А&В

АvВ

А->В

А=В

Л

Л

И

И

Л

И

Л

И

И

И

Л

Л

Л

Л

Л

И

Л

И

И

И

И

И

Л

И

И

Л

Л

И

Каждое сложное высказывание, составленное из некоторых исходных высказываний посредством логических операций, называют формулой алгебры логики или пропозиционной формой.

Логические операции обладают свойствами ассоциативности, коммутативности, идемпотентности, дистрибутивности и т.д. Более подробно со свойствами логических операций, а также с теоремами и правилами образований тавтологий и противоречий, формами представления функции, синтезом конечных автоматов и т.д. можно познакомиться в соответствующей литературе.

Теперь в рассмотрим язык исчисления предикатов. ПРЕДИКАТОМ или логической функцией называется функция от любого числа аргументов, принимающая истинностные значения И и Л. Аргументы принимают значения из произвольного конечного или бесконечного множества М, называемого ПРЕДМЕТНОЙ ОБЛАСТЬЮ. Предикат от n аргументов называется n-местным предикатом.

Если F ( Х ), G ( X , Y ), P ( X1 , X2 , . . . XN) предикаты, то F, G, P, обозначающие функции, называются предикатными буквами, а аргументы X, Y, X1, X2... - предметными переменными.

Принято говорить, что предикат F ( Х ) получен в результате применения предикатной буквы F и предметной переменной Х.

Предикат F ( Х ) , определенный на предметной области М, задает определенное свойство элементам множества М и интерепретируется как обозначение высказывания "Х обладает свойством F", причем F ( Х ) принимает значение И, если высказывание ИСТИННО, и значение Л, если оно ЛОЖНО.

С формулами исчисления предикатов, их интерпретацией, с кванторами и связанными переменными рекомендуется ознакомиться в соответствующей литературе.

В ЭС, основанных на правилах, знания предметной области представляются набором правил, которые проверяются на группе фактов или знаний о текущей ситуации. Когда часть правила ЕСЛИ удовлетворяет фактам, то действие, указанное в части ТО выполняется. Когда это происходит, то говорят, что правило выполнено. Интерпретатор правил сопоставляет части правил ЕСЛИ с фактами и выполняет то правило, часть ЕСЛИ которого согласуется с фактами, как показано на рисунке 5.2.

ФАКТЫ

Сопоставить

Выполнить

ПРАВИЛА

Рис.5.2

Процесс сопоставления с фактами частей ЕСЛИ правил может порождать то, что называется цепочкой выводов. Цепочка выводов, полученная в результате последовательного выполнения правил 1 и 2, показана на рисунке 5.3.

Рис. 5.3

Существует два важных способа использования правил в ЭС, основанной на правилах (рис.5.4).

Рис. 5.4

Предыдущий рисунок 5.3 является примером прямой цепочки рассуждений. Прямая цепочка рассуждений хорошо работает в случае простого набора правил.

П

ЕСЛИ атомный вес = А & плотность = В & температура плавления = С & температура испарения = Е & т.д.

ТО ТИП МАТЕРИАЛА ДЛЯ ИСПАРИТЕЛЯ - М

ример обратной цепочки рассуждений приведен на рисунке 5.5.

Это соответствует типу испарителя - Т;

электронно-лучевому испарению;

термовакуумному методу получения тонких пленок.

Рис. 5.5

Атомный вес, плотность, температура плавления, температура испарения и т.д. в данном случае являются ФАКТАМИ, которые представляют экстенсиональные знания (их можно с большой осторожностью назвать ДАННЫМИ ).

Экстенсиональные знания - это явные, количественные значения.

Основой формализации знаний о предметной области часто является направленный граф с помеченными вершинами и дугами, называемый СЕМАНТИЧЕСКОЙ СЕТЬЮ. Узлы в семантической сети соответствуют объектам, концепциям или событиям. Дуги могут быть определены разными методами, зависящими от вида представляемых знаний. Дуги, используемые для представления ИЕРАРХИИ включают дуги двух типов (рис. 5.6).

Рис.5.6

В семантических сетях для описания естественных языков используются дуги трех типов (рис.5.7).

Рис.5.7

В

Проволочные испарители являются типом испарителя при термовакуумном методе получения тонких пленок.

качестве простого примера рассмотрим предложение

Простая семантическая сеть с использованием отношения ЯВЛЯЕТСЯ представлена на

рисунке 5.8.

ЯВЛЯЕТСЯ

ЯВЛЯЕТСЯ

Рис.5.8

Общая структура семантической сети приведена на рисунке 5.9.

Узел 1

Узел 2

Дуга 2

Дуга 1

Дуга 3

Узел 4

Узел 3

Дуга 7

Дуга 4

Дуга 5

Дуга 6

Узел 5

Узел 6

Рис. 5.9

В семантических сетях используется три основных типов объектов (рис.5.10).

Рис.5.10

Понятия представляют собой сведения об абстрактных или физических объектах предметной области. Общие понятия интерпретируются как множество параметров или констант (доменов).

События - это действия, которые могут внести изменения в предметную область. Результатом события является некоторое новое состояние предметной области. Можно задать некоторое целевое состояние предметной области и поставить задачу отыскания на семантической сети последовательности событий, приводящей к целевому состоянию. Свойства используются для уточнения понятий, событий или других свойств. Применительно к понятиям свойства описывают их особенности или характеристики (размеры, показатели качества, параметры и т.п.).

Применительно к событиям свойства описывают продолжительность, место, время и т.п.

Фреймы (рис.5.11) для представления знаний были предложены для описания какого-либо объекта или явления, обладающего тем свойством, что удаление из этого описания любой его части приводит к потери свойств, характеризующих объект описания.

Рис.5.11

Фреймы чаще всего определяют как структуру знаний для представления стереотипных ситуаций. При этом способ группирования множества конкретных ситуаций в стереотипную, как правило, не может быть определен строго. Чаще всего стереотипные для данной предметной области ситуации выделяет инженер знаний по окончанию процесса извлечения знаний от эксперта, опираясь на извлеченные знания и опыт технолога и инженера знаний. Неформальные знания предметной области можно рассматривать как системы понятий, определяющих представление о конкретных ситуациях. Каждое понятие связывается с конкретной ситуацией, а конкретная ситуация согласуется с соответствующей стереотипной.

Если понятия представляют собой неформальные знания о стереотипных ситуациях, то фреймы - это формализованные знания.

Таким образом, фреймы соответствуют понятиям, отражающим объекты, явления, характеристики предметной области. Это дает основания рассматривать фрейм как семантический блок или модуль модели представления знаний. Модель представления знаний строится в виде сети фреймов, системы определенным образом взаимосвязанных фреймов.

Понятие в каждом узле фрейма определяется набором атрибутов, называемых слотами, и значениями этих атрибутов. С каждым слотом можно связать любое число процедур. Используется три типа процедур (рис.5.12).

Процедура, если добавлено

Выполняется, когда новая информация помещается в слот.

Процедура, если удалено

Выполняется, когда информация удаляется из слота.

Процедура, если-нужно

Выполняется, когда запрашивается яинформация из слота, а он пустой.

Рис.5.12

Пример узла во фреймовой структуре приведен на рисунке 5.13.

Процедура 1

Слот 1

Значение 1

П

О

Н

Я

Т

И

Е

Слот 2

Значение 2

Процедура 2

Процедура 3

Слот 3

Значение 3

Рис.5.13

Процедуры, включаемые в слот принято делить на ПРОЦЕДУРЫ-ДЕМОНЫ и ПРОЦЕДУРЫ-СЛУГИ.

Процедуры-демоны активизируются автоматически, когда данные попадают в соответствующий фрейм-пример или удаляются из него. Процедуры-слуги активизируются только по запросу.

Существует ряд разновидностей фреймов:

  • фрейм-соединение;

  • фрейм-назначение;

  • фрейм-закон.

Более подробно со всеми разновидностями фреймов, математическим аппаратом, используемом при представлении знаний на основе фреймов необходино ОЗНАКОМИТЬСЯ по рекомендуемой литературе [ ].