Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МУ к лаб работам по инженерии знаний.doc
Скачиваний:
1
Добавлен:
01.03.2025
Размер:
131.07 Кб
Скачать

Методические указания

Одним из основных понятий в области инженерии знаний является понятие «объект». В словаре русского языка приводится следующее объяснение слова «объект»: то, что существует вне нас и независимо от нашего сознания, явления внешнего мира, материальной действительности. Обычно считается, что быть объектом – значит быть дискретным и различимым, то есть под объектом понимается то, что существует или воспринимается существующим в качестве отдельной сущности. Объектами являются не только материальные объекты, но и объекты мышления, такие как понятия, имена, ситуации и т.д. Примеры объектов: студент, группа студентов, аудитория, время занятий, слова, числа и т.д.

Слово «предмет» используется в том случае, когда объект становится носителем определенных свойств и входит в различные взаимоотношения. Так человек является носителем одних свойств, участвуя в учебном процессе, и других свойств, становясь пациентом поликлиники. Следовательно, один и тот же объект рассматривается в различных системах как разные предметы.

Предмет является результатом абстракции реального объекта, результатом огрубления действительности, при котором игнорируется многообразие свойств и взаимоотношений объекта. Таким образом, предмет – это модель реального объекта.

Понятие «предметная область», как и понятие «предмет», соответствует определенному огрублению, абстракции реальности. При этом выделяются те свойства объектов и взаимосвязей между ними, которые представляют определенную прагматическую ценность и которые должны фиксироваться в базе знаний. Например, студент и преподаватель института совместно участвуют в учебном процессе. Будучи людьми, они имеют много общих характеристик. Однако не все эти характеристики требуются для построения модели учебного процесса.

В то же время роли студентов и преподавателей различны, поэтому они имеют не только общие, но и различные характеристики, которые существенны в учебном процессе. Выделение этих характеристик определяет «точку зрения» на студентов и преподавателей в соответствии с выбранной предметной областью – учебным процессом.

Различие между студентами и преподавателями в значительной мере исчезает, если их рассматривать как жителей одного города или пациентов поликлиники.

Знания о материальных объектах и понятиях обычно представляются совокупностью характеризующих их свойств или совокупностью составляющих их компонент. Например, если в качестве объекта рассматривается студент, то знания о нем можно представить следующими характеристиками: фамилия, имя, отчество, шифр студенческого билета, шифр группы. Дата представляется совокупностью трех компонент: число, месяц, год.

При представлении знаний о ситуациях могут использоваться как характеристики ситуаций, так и роли, которые играют объекты в данной ситуации. Например, для представления знаний о ситуации "находиться" необходимо указать роль "участник ситуации" (кто находится) и характеристики "место ситуации" (где находится) и "время ситуации" (когда находится).

В моделях представления знаний понятия "характеристика", "компонента", "роль" обычно объединяются одним общим понятием "атрибут".

Разработка системы, основанной на знаниях (СОЗ), начинается с постановки задач, которые должна решать создаваемая система. Именно с позиции этих задач следует осуществлять анализ предметной области.

При анализе предметной области важно выделить классы объектов, знания о которых необходимы для решения задач, и для каждого из классов объектов выбрать необходимый набор атрибутов.

Знания об объектах могут быть представлены на двух уровнях: верхний уровень представляет знания о классах объектов, нижний уровень представляет знания о конкретных объектах. Знания о конкретных объектах обычно называют фактами или данными.

Знания о классе объектов могут быть представлены в виде

(К: А1D1, А2 D2, …, Аn Dn),

(1)

или в виде множества троек

(К, Аi, Di),

(2)

где К – имя класса объектов, для которого задается представление;

Аi – имя i-го атрибута;

Di– имя класса объектов, являющихся значениями атрибута Аi;

i = 1,...,n;

n – количество атрибутов в представлении объектов класса К.

Например, знания о кафедральной лаборатории могут быть представлены классом объектов "Лаборатория" в соответствии с ф.(1):

(Лаборатория:

номер

Номер лаборатории,

вместимость

Количество мест,

кафедра

Название кафедры).

Имена атрибутов могут оказаться похожими или даже одинаковыми с именами классов объектов, являющихся значениями атрибутов. Для того, чтобы их различать, имена классов объектов начинаются с заглавной буквы.

Представление знаний о классе объектов "Лаборатория" в соответствии с ф.(2) задается тремя тройками:

{(Лаборатория, номер, Номер лаборатории),

(Лаборатория, вместимость, Количество мест),

(Лаборатория, кафедра, Название кафедры)}.

В представлении знаний о классах объектов имена классов объектов, являющихся значениями атрибута, иногда опускаются и представление задается в виде

K(A 1, A 2, …, A n),

(3)

например:

Лаборатория (номер, вместимость, кафедра).

Знания о конкретных объектах могут быть представлены в виде структур данных:

(К: А1d1, А2 d2, …, Аn dn),

(4)

где К – имя класса объектов;

Аi – имя i-го атрибута;

d i – значение i-го атрибута.

Такое представление соответствует представлению знаний о классе объектов К в виде (1).

В качестве примера можно рассмотреть конкретную лабораторию, знания о которой представляются следующей структурой данных:

(Лаборатория:

номер

Г307,

вместимость

15,

кафедра

ИТС).

Представлению знаний о классе объектов в виде множества троек (2) соответствует представление знаний о конкретных объектах в виде отдельных фактов, представленных тройками

(к, Аi, di),

где к – элемент класса К;

Аi – имя i-го атрибута;

di – значение i-го атрибута.

О таком представлении обычно говорят, что факты представляются тройками <объект, атрибут, значение>.

Например, знания о конкретной лаборатории могут быть представлены следующими фактами:

{(лаборатория 1, номер, Г307),

(лаборатория 1, вместимость, 15),

(лаборатория 1, кафедра, ИТС)}.

Если значения некоторых атрибутов не удается установить точно, то для них может быть задана степень уверенности в значении атрибута. Степень уверенности в значении атрибута представляется коэффициентом уверенности, который добавляется к тройке (к, Аi, di), в результате чего факты представляются четверками

<объект, атрибут, значение, коэффициент уверенности>.

Диапазон возможных значений коэффициентов уверенности может задаваться по-разному. Это могут быть целые числа от 0 до 100, действительные числа от 0 до 1 или от -1 до 1. В любом случае максимальное значение коэффициента уверенности соответствует абсолютной достоверности данного факта, а отрицательные значения коэффициента уверенности (если они используются) означают степень уверенности в невозможности данного значения атрибута.

Некоторые атрибуты могут иметь несколько значений, например у пациента может быть установлено несколько диагнозов, каждый со своим коэффициентом уверенности. В этом случае значения атрибутов могут быть представлены либо списком, например:

(пациент 1, диагноз, гастрит КУ=60, колит КУ=70),

либо несколькими фактами:

(пациент 1, диагноз, гастрит КУ=60),

(пациент 1, диагноз, колит КУ=70).

Иногда вместо рассмотренного выше атрибутивного формата записи фактов используется позиционный формат: имена атрибутов в представлении (4) заменяются на числа (1,2,...), которые в явном виде в фактах не указываются, а на соответствующих позициях в фактах фигурируют их значения:

К (d1, d2, …, dn),

(5)

например:

Лаборатория (Г307, 15, ИТС).

Это представление соответствует представлению знаний о классе объектов К в виде (3).

Факты, относящиеся к одному и тому же классу объектов, можно объединить в таблицу. При этом имя класса объектов становится названием соответствующей таблицы, имена атрибутов становятся названиями столбцов, а строка таблицы представляет собой факт, записанный в позиционном формате. Такая форма представления знаний об объектах используется в реляционных базах данных.