
- •Инженерия знаний
- •Инженерия знаний
- •Введение
- •Методические указания
- •Содержание отчета о лабораторной работе
- •Контрольные вопросы
- •Методические указания
- •Методические указания
- •1. Построение er-диаграммы
- •2. Построение сетевой модели представления знаний
- •3. Построение логической модели представления знаний
- •Содержание отчета о работе
- •Контрольные вопросы
- •2. Представление фактов
- •3. Многозначные объекты
- •4. Разрешенные значения
- •5. Вопросы
- •6. Правила
- •7. Выполнение логических выводов в оболочке Expert
- •8. Вычисление коэффициентов доверия в процессе выполнения логических выводов
- •Содержание отчета о работе
- •Контрольные вопросы
- •Библиографический список
- •Содержание
Методические указания
Одним из основных понятий в области инженерии знаний является понятие «объект». В словаре русского языка приводится следующее объяснение слова «объект»: то, что существует вне нас и независимо от нашего сознания, явления внешнего мира, материальной действительности. Обычно считается, что быть объектом – значит быть дискретным и различимым, то есть под объектом понимается то, что существует или воспринимается существующим в качестве отдельной сущности. Объектами являются не только материальные объекты, но и объекты мышления, такие как понятия, имена, ситуации и т.д. Примеры объектов: студент, группа студентов, аудитория, время занятий, слова, числа и т.д.
Слово «предмет» используется в том случае, когда объект становится носителем определенных свойств и входит в различные взаимоотношения. Так человек является носителем одних свойств, участвуя в учебном процессе, и других свойств, становясь пациентом поликлиники. Следовательно, один и тот же объект рассматривается в различных системах как разные предметы.
Предмет является результатом абстракции реального объекта, результатом огрубления действительности, при котором игнорируется многообразие свойств и взаимоотношений объекта. Таким образом, предмет – это модель реального объекта.
Понятие «предметная область», как и понятие «предмет», соответствует определенному огрублению, абстракции реальности. При этом выделяются те свойства объектов и взаимосвязей между ними, которые представляют определенную прагматическую ценность и которые должны фиксироваться в базе знаний. Например, студент и преподаватель института совместно участвуют в учебном процессе. Будучи людьми, они имеют много общих характеристик. Однако не все эти характеристики требуются для построения модели учебного процесса.
В то же время роли студентов и преподавателей различны, поэтому они имеют не только общие, но и различные характеристики, которые существенны в учебном процессе. Выделение этих характеристик определяет «точку зрения» на студентов и преподавателей в соответствии с выбранной предметной областью – учебным процессом.
Различие между студентами и преподавателями в значительной мере исчезает, если их рассматривать как жителей одного города или пациентов поликлиники.
Знания о материальных объектах и понятиях обычно представляются совокупностью характеризующих их свойств или совокупностью составляющих их компонент. Например, если в качестве объекта рассматривается студент, то знания о нем можно представить следующими характеристиками: фамилия, имя, отчество, шифр студенческого билета, шифр группы. Дата представляется совокупностью трех компонент: число, месяц, год.
При представлении знаний о ситуациях могут использоваться как характеристики ситуаций, так и роли, которые играют объекты в данной ситуации. Например, для представления знаний о ситуации "находиться" необходимо указать роль "участник ситуации" (кто находится) и характеристики "место ситуации" (где находится) и "время ситуации" (когда находится).
В моделях представления знаний понятия "характеристика", "компонента", "роль" обычно объединяются одним общим понятием "атрибут".
Разработка системы, основанной на знаниях (СОЗ), начинается с постановки задач, которые должна решать создаваемая система. Именно с позиции этих задач следует осуществлять анализ предметной области.
При анализе предметной области важно выделить классы объектов, знания о которых необходимы для решения задач, и для каждого из классов объектов выбрать необходимый набор атрибутов.
Знания об объектах могут быть представлены на двух уровнях: верхний уровень представляет знания о классах объектов, нижний уровень представляет знания о конкретных объектах. Знания о конкретных объектах обычно называют фактами или данными.
Знания о классе объектов могут быть представлены в виде
(К: А1D1, А2 D2, …, Аn Dn), |
(1) |
или в виде множества троек
(К, Аi, Di), |
(2) |
где К – имя класса объектов, для которого задается представление;
Аi – имя i-го атрибута;
Di– имя класса объектов, являющихся значениями атрибута Аi;
i = 1,...,n;
n – количество атрибутов в представлении объектов класса К.
Например, знания о кафедральной лаборатории могут быть представлены классом объектов "Лаборатория" в соответствии с ф.(1):
(Лаборатория:
номер |
Номер лаборатории, |
вместимость |
Количество мест, |
кафедра |
Название кафедры). |
Имена атрибутов могут оказаться похожими или даже одинаковыми с именами классов объектов, являющихся значениями атрибутов. Для того, чтобы их различать, имена классов объектов начинаются с заглавной буквы.
Представление знаний о классе объектов "Лаборатория" в соответствии с ф.(2) задается тремя тройками:
{(Лаборатория, номер, Номер лаборатории),
(Лаборатория, вместимость, Количество мест),
(Лаборатория, кафедра, Название кафедры)}.
В представлении знаний о классах объектов имена классов объектов, являющихся значениями атрибута, иногда опускаются и представление задается в виде
K(A 1, A 2, …, A n), |
(3) |
например:
Лаборатория (номер, вместимость, кафедра).
Знания о конкретных объектах могут быть представлены в виде структур данных:
(К: А1d1, А2 d2, …, Аn dn), |
(4) |
где К – имя класса объектов;
Аi – имя i-го атрибута;
d i – значение i-го атрибута.
Такое представление соответствует представлению знаний о классе объектов К в виде (1).
В качестве примера можно рассмотреть конкретную лабораторию, знания о которой представляются следующей структурой данных:
(Лаборатория:
номер |
Г307, |
вместимость |
15, |
кафедра |
ИТС). |
Представлению знаний о классе объектов в виде множества троек (2) соответствует представление знаний о конкретных объектах в виде отдельных фактов, представленных тройками
(к, Аi, di),
где к – элемент класса К;
Аi – имя i-го атрибута;
di – значение i-го атрибута.
О таком представлении обычно говорят, что факты представляются тройками <объект, атрибут, значение>.
Например, знания о конкретной лаборатории могут быть представлены следующими фактами:
{(лаборатория 1, номер, Г307),
(лаборатория 1, вместимость, 15),
(лаборатория 1, кафедра, ИТС)}.
Если значения некоторых атрибутов не удается установить точно, то для них может быть задана степень уверенности в значении атрибута. Степень уверенности в значении атрибута представляется коэффициентом уверенности, который добавляется к тройке (к, Аi, di), в результате чего факты представляются четверками
<объект, атрибут, значение, коэффициент уверенности>.
Диапазон возможных значений коэффициентов уверенности может задаваться по-разному. Это могут быть целые числа от 0 до 100, действительные числа от 0 до 1 или от -1 до 1. В любом случае максимальное значение коэффициента уверенности соответствует абсолютной достоверности данного факта, а отрицательные значения коэффициента уверенности (если они используются) означают степень уверенности в невозможности данного значения атрибута.
Некоторые атрибуты могут иметь несколько значений, например у пациента может быть установлено несколько диагнозов, каждый со своим коэффициентом уверенности. В этом случае значения атрибутов могут быть представлены либо списком, например:
(пациент 1, диагноз, гастрит КУ=60, колит КУ=70),
либо несколькими фактами:
(пациент 1, диагноз, гастрит КУ=60),
(пациент 1, диагноз, колит КУ=70).
Иногда вместо рассмотренного выше атрибутивного формата записи фактов используется позиционный формат: имена атрибутов в представлении (4) заменяются на числа (1,2,...), которые в явном виде в фактах не указываются, а на соответствующих позициях в фактах фигурируют их значения:
К (d1, d2, …, dn), |
(5) |
например:
Лаборатория (Г307, 15, ИТС).
Это представление соответствует представлению знаний о классе объектов К в виде (3).
Факты, относящиеся к одному и тому же классу объектов, можно объединить в таблицу. При этом имя класса объектов становится названием соответствующей таблицы, имена атрибутов становятся названиями столбцов, а строка таблицы представляет собой факт, записанный в позиционном формате. Такая форма представления знаний об объектах используется в реляционных базах данных.