Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ТЭИС пособие конспект лекций.doc
Скачиваний:
8
Добавлен:
10.11.2019
Размер:
1.05 Mб
Скачать

Глава 4. Моделирование предметных областей в экономике.

Базы знаний

4.1. Семантические модели данных

Средства описания данных ориентируются либо на формы представления информации (это синтаксические модели данных, например, реляционная, сетевая, иерархическая) либо на смысловые характеристики информации (семантические модели).

Семантические модели данных представляют собой средство представления структуры предметной области.

Эталоном семантической полноты является естественный язык. Простейшей конструкцией естественного языка является высказывание, имеющее смысл. Элементами высказываний служат атомарные факты. Атомарный факт представляется тремя компонентами:

(x, y, t), где

x – это один или множество объектов;

y – свойство или связь объектов;

t – время.

Атомарный объект – это любой объект в рамках данной предметной области.

Объекты могут вступать в отношения двух типов – обобщения, когда один объект определяется в виде множества других объектов, и агрегации, когда объект соотносится с именем действия, в котором он может участвовать. Например, объект Личность обобщает такие объекты, как Рабочий, Служащий, Студент; объект Транспорт агрегируется с действием Перевозка.

Информация о том, что объект имеет некоторые свойства, или что несколько объектов взаимосвязаны, представляется в виде высказывания. Существуют правила вывода новых свойств и связей из ранее определенных свойств и связей.

Семантические модели данных обычно предполагают два уровня интерпретации:

- уровень объектов предметной области и

- уровень атрибутов базы данных.

Оба уровня при необходимости можно совместить в одном представлении.

Известно достаточно большое число семантических моделей данных. Наиболее характерные из них – это модель "сущность-связь" и модель «семантическая сеть». Рассмотрим эти две модели.

4.2. Модель сущностей и связей

Эта модель использует графическое представление всех компонентов. Базовыми элементами в модели "сущность-связь" служат типы сущностей. Многие сущности, рассматриваемые в этой модели, соответствуют физическим объектам предметной области.

Структура предметной области в модели "сущность-связь" изображается в форме диаграммы. Дуги на диаграмме соединяют тип сущности с типом связи.

Рис.4.1. Варианты соответствий между сущностями и связями:

Представление предметной области с помощью модели "сущность-связь" позволяет:

-однозначно разработать структуру многоуровневой сетевой базы данных;

-обеспечить одинаковое понимание всеми пользователями содержимого базы данных.

Модель "сущность-связь" характеризуется рядом недостатков:

- не содержит организационной иерархии процессов управления;

- принятое в модели правило формирования множества отношений базы данных создает слишком много отношений для объектов и связей. В результате диаграмма быстро становится громоздкой и необозримой.

4.3. Модель семантических сетей

Семантические сети представляют собой ориентированные графы с помеченными дугами. Аппарат семантических сетей является естественной формализацией ассоциативных связей, которыми пользуется человек при извлечении каких-то новых фактов из имеющихся. Построение сети способствует осмыслению информации и знаний, поскольку позволяет установить противоречивые ситуации, недостаточность имеющейся информации и т. п.

Обычно в семантической сети предусматриваются четыре категории вершин:

- понятия (объекты),

- события,

- свойства,

- значения.

Понятия представляют собой константы или параметры, которые определяют физические или абстрактные объекты.

События представляют действия, происходящие в реальном мире, и определяются указанием типа действия и ролей, которые играют объекты в этом действии.

Свойства используются для представления состояния или для модификации понятий и событий.

Сведения семантической сети образуют сценарий, который является набором понятий, событий и причинно-следственных связей.

Необходимо различать вершины, обозначающие экземпляры объектов, и вершины, представляющие классы объектов. Например, Новиков - экземпляр типа Студент. В семантической сети экземпляр может принадлежать более чем одному классу (Новиков – и Студент, и Спортсмен).

В других моделях в отличие от семантической сети типы объектов указаны в схеме, а экземпляры объектов представлены значениями в базе данных. В семантической сети один и тот же экземпляр объекта может быть соотнесен с несколькими типами.

В синтаксических моделях (реляционной, сетевой или иерархической) для обеспечения такой связи потребуется дублирование информации об объекте.

Все семантические отношения предметной области можно разделить на следующие:

- лингвистические,

- логические,

- теоретико-множественные,

- квантификационные.

Лингвистические отношения бывают глагольные (время, вид, род, число, залог, наклонение) и атрибутивные (модификация, размер, форма).

Логические отношения подразделяются на конъюнкцию (и), дизъюнкцию (или), отрицание (не) и импликацию (если – то).

Теоретико-множественные отношения - это отношение подмножества, отношение части и целого, отношение множества и элемента.

Квантификационные отношения делятся на логические кванторы общности и существования («каждый», «все»), нелогические кванторы («много», «несколько») и числовые характеристики.

При установлении структуры понятий существуют две обязательные связи

  1. связь "есть-нек" (от слов "есть некоторый"). Направлена от частного понятия к более общему и показывает принадлежность элемента к классу;

  2. связь "есть-часть". Показывает, что объект содержит в своем составе разнородные компоненты (объекты), не подобные данному объекту.

Пример семантической сети для описания структуры понятия "юридическое лицо" приведен на следующем рисунке.

Рисунок 4.2 Элементы семантической сети

Связь "есть-нек" обозначается одной линией, связь "есть-часть" – двумя.

Рассмотрим представление событий и действий с помощью семантической сети. Выделяются простые отношения, которые характеризуют основные компоненты события. В первую очередь из события выделяется действие, которое обычно описывается глаголом. Далее необходимо определить объекты, которые действуют, объекты, над которыми эти действия производятся, и т. д. Все эти связи предметов, событий и качеств с глаголом называются падежами. Обычно рассматривают следующие падежи:

  1. агент - предмет, являющийся инициатором действия;

  2. объект - предмет, подвергающийся действию;

  3. источник - размещение предмета перед действием;

  4. приемник - размещение предмета после действия;

  5. время - указание на то, когда происходит событие;

  6. место - указание на то, где происходит событие;

  7. цель - указание на цель действия.

Рассмотрим пример: Директор завода "САЛЮТ" остановил 25.03.90 цех № 4, чтобы заменить оборудование

Рисунок 4.3 Пример семантической сети

Преимущества семантических сетей:

  1. описание объектов и событий на уровне, очень близком к естественному языку;

  2. обеспечивается возможность сцепления различных фрагментов сети;

  3. возможные отношения между понятиями и событиями образуют достаточно небольшое и хорошо формализованное множество;

  4. можно выделить из полной сети, представляющей все знания, некоторый участок семантической сети, который необходим в конкретном запросе.