Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
КЛ_СИИ-Часть1.doc
Скачиваний:
4
Добавлен:
01.04.2025
Размер:
2.52 Mб
Скачать

Лекция 12 сетевые семантические модели представления знаний

План лекции

1. Основные понятия семантических сетей

2. Типы отношений в семантических сетях

3. Принципы обработки информации в семантических сетях

1. Основные понятия семантических сетей

В основе этих моделей лежит понятие сети. Семантическая сеть (СС) представляет собою теоретико-графовую структуру с помеченными вершинами и дугами.

Вершины сети представляют некоторые сущности (объекты, события, процессы, явления), а дуги - отношения между сущностями, которые они связывают. Вершинами могут быть понятия (предметы), события (действия), свойства (места), а дугами отношения, которые делятся на лингвистические, логические, теоретико-множественные, квантификационные. В свою очередь, лингвистические отношения делятся на глагольные (время, вид, род, число, залог, наклонение) и атрибутивные (цвет, размер, форма, модификация); логические — на дизъюнкцию, конъюнкцию, отрицание, импликацию; теоретико-множественные — на подмножества, а квантифицированные отношения делятся на логические кванторы общности и существования, нелогические кванторы («много», «несколько») и числовые характеристики. Наложив ограничения на описание вершин и дуг, можно получить сети различного вида. Если вершины не имеют собственной внутренней структуры, то соответствующие сети называют простыми сетями. Если вершины обладают некоторой структурой, то такие сети называют иерархическими сетями. На начальном этапе разработки интеллектуальных систем использовались только простые сети, сейчас в большинстве приложений, иерархические.

Рис.12.1. Фрагмент семантической сети

На рис. 12.1 изображен фрагмент простой семантической сети, выражающий примерно следующую информацию: "Михаилу в течение интервала времени [t1, t2) принадлежат ЖИГУЛИ № 25-15''. Михаил есть агент (собственник) в событии B1. Михаил является элементом (э) множества ЧЕЛОВЕК. ЖИГУЛИ № 25-15 является элементом множества МАШИНЫ. Событие B1 является элементом множества всех событий ВЛАДЕТЬ, которое является подмножеством (п) множества СИТУАЦИИ и т.д. Использованные на рис. 3.2 дуги "э" (элемент) и "п" (подмножество) служат для выражения таксономии понятий, представленных вершинами. Важность таксономии заключается в том. что множества обычно имеют свойства, присущие всем элементам данного множества. Эти свойства связываются в сети не с конкретными элементами, а с вершинами, сопоставляемыми всему множеству. Так, дуга "п" указывает отношение быть "подмножеством". В связи с тем, что большинство подмножеств являются различными, т.е. непересекающимися, для их представления удобно ввести дугу специального вида "пр" (подмножество различное). Дуга "пр", идущая из вершины х в вершину z, указывает, что множество, представленное вершиной х, есть подмножество множества, представленного вершиной г, и что х не пересекается ни с каким другим подмножеством, представляемым вершиной r и имеющем дугу "пр" из r в z. По аналогии можно ввести и отношение "эр".

Одно из основных отличий иерархических семантических сетей от простых семантических сетей состоит в возможности разделить сеть на подсети (пространства) и устанавливать отношения не только между вершинами, но и между пространствами [Хендрикс, 1975; Попов. 1982.].

Рис. 12.2. Разбиение сети на пространства

Все вершины и дуги являются элементами по крайней мере одного пространства. Отметим, что понятие пространства аналогично понятию скобок в математической нотации. Различные пространства, существующие в сети, могут быть упорядочены в виде дерева пространств, вершинам которого соответствуют пространства, а дугам - отношения "видимости". На рис. 2 приведен пример дерева пространств, в соответствии с которым, например, из пространства Р6 (пространство-потомок) видимы все вершины и дуги, лежащие в пространствах-предках, P4, Р2, Р0, а остальные пространства "невидимы". Отношение "видимости" позволяет сгруппировать пространства в упорядоченные множества — "перспективы". Перспектива обычно используется для ограничения сетевых сущностей, "видимых" некоторой процедурой, работающей с сетью. Обычно в перспективу включают не любые, а иерархически сгруппированные пространства. При графическом изображении иерархических сетей обычно используют следующие соглашения: 1) вершины и дуги, лежащие в одном пространстве, ограничиваются на рисунках многоугольником (обычно прямоугольником) ; 2) дуга принадлежит тому пространству, в котором находится имя дуги; 3) пространство Pi (точнее, ограничивающий его многоугольник) изображаемое внутри пространства Pj, считается потомком (внутренним уровнем), т.е. из Pi "видимо" Рj,. Отметим, что пространство Рi может рассматриваться как супервершина, которая лежит в Pj. Свойство "невидимости" позволяет повысить эффективность операции поиска в сети. Например, при поиске конкретных фактов информация из кванторных утверждений и правил невидима, так как она заключена в пространствах, ограничивающих эти утверждения и правила.

При решении многих конкретных задач представление знаний только в виде семантических сетей оказывается неудобным или неэффективным. По этой причине в семантических сетях вводят механизм процедурных присоединений [Попов, 1982, § 3.5] (подробнее о семантических сетях см. обзор Лозовского [1984] и статью Брэчмена [1976] . В общем, использование семантических сетей в ЭС обусловлено тем, что они позволяют расширить возможности продукционных моделей, являющихся наиболее распространенным способом представления знаний в экспертных системах.

2. Типы отношений в семантических сетях

Одна из первых концепций семантической сети для описания структуры знаний, содержащихся в естественном языке, предложена Квилианом. Каждый узел сети представляет одно понятие, смысловое содержание которого определяется совокупностью его связей с другими понятиями. Квилиан различает три основных типа связей между узлами:

родовидовую связь (связь определенного понятия с более широким по объему понятием);

определительную связь (содержание понятия конкретизируется с помощью прилагательного или наречия);

предикативную или любую другую синтаксическую связь, выражаемую с помощью глагола или предлога.

Более дифференцированная система описания семантико-синтаксической структуры естественного языка была предложена Филмором.

По Филмору каждое высказывание содержит в своем составе сведения о его модальности (время, залог, наличие или отсутствие отрицания и т.п.) и собственно суждение.

Суждение состоит из глагола и его дополнений, называемых также актантами или аргументами. Актанты в соответствии с их функциональной ролью в предложении могут иметь следующие шесть глубинных (семантических) падежей:

  1. Агентивный падеж (агентив) — одушевленный субъект действия, выраженного предикатом.

  2. Инструментальный падеж (инструмент) — неодушевленная сила или предмет, с помощью которых совершается действие, выраженное предикатом.

  3. Дательный падеж (датив) — функциональная роль одушевленного существа, на которое оказывает влияние действие.

  4. Фиктивный падеж: (фактив) — одушевленное существо или предмет, которые изменяются в результате действия или состояния.

  5. Локативный падеж — местоположение или пространственные размеры действия или состояния, выраженные предикатом.

  6. Объектный падеж: — функциональная роль его определяется предикатом.

Семантическая сеть, предложенная Сименсом, предусматривает, что предикат и его актанты образуют первую группу связей, кроме того, при анализе высказывания выделяются актанты: агент, инструмент, тема, источник, цель, место. С помощью второй группы связей актанты соединяются с атрибутами: определительная связь, часть — целое, обладание, ассоциативная, форма размер.

Третья группа связей: нечисловые квантификаторы («некоторые»), количество, исчисляемость, подчиненное понятие, тождество, часть целого.

Узел в семантической сети Симонса помечается индексом и связями. Каждая связь состоит из двух компонент: тип связи и индекс узла, к которому она идет.

Шенк различает в семантическом представлении (описании) текста:

  1. действие (оператор);

  2. источник описания (в сознании) - физический объект;

  3. модификатор описания - прилагательное;

  1. модификатор действия («кредитование» как вид финансирования и перемещения денежных средств).

В основе описания лежит взаимодействие актора, причем в действии выделяются падежи: объектный, реципиентный и директивный.

Все действия могут быть представлены как примитивные действия (модификаторы отношения): У передача владения («поставлять», «покупать», «дарить», «продавать»);

- движение объекта от одного места к другому («доставлять», «везти», «отправлять»);

- прикладывание силы («толкать», «запускать», «двигать»);

- самодвижение;

- захват;

- помещение внутрь («вводить (данные)», «приходовать»);

- выделять из себя («выводить (данные)», «выпускать (продукцию)»);

- обмен идеями;

- порождение умозаключений;

- коммуникативный акт;

- воздействие на объект.

В основе понятия семантической сети лежит граф. Вершины графа представляют, с одной стороны, некоторые сущности (объекты, события, процессы, явления), а с другой — отношения между сущностями, которые они связывают. Наложив ограничения на описания вершин, можно получить сети различного вида. Если вершины не имеют собственной внутренней структуры, такие сети называются иерархическими. Каждый узел сети представляет некоторое понятие, а дуга — отношение между парами понятий. Дуги помечаются именем соответствующего отношения. В общем случае семантическая сеть определяется как кортеж

N = <A,B,P,P1, С>,

где А — множество вершин, В — множество имен вершин, Р — множество промежуточных дуг, Р1 — множество помеченных входных и выходных дуг, инцедентных вершинам — источникам и вершинам — срокам, С — множество имен дуг. Объекты (сущности) отображаются вершинами семантиче ской сети, а отношения (взаимосвязи) — дугами. Имена, приписываемые вершинам и дугам семантической сети, отвечают именам соответствующих объектов отношений, используемых в естественном языке. Выделяют два класса семантических сетей. Интенсиональные (абстрактные) и экстенсиональные (конкретные). Интенсиональная семантическая сеть, отображающая абстрактное знание предметной области. Такие знания оперируют не конкретными фактами, а общими высказываниями, содержащими переменные, которые «означиваются» в конкретных ситуациях и превращаются в константные факты. Экстенсиональная семантическая сеть, в которой вершины соответствуют конкретным объектам, операциям, субъектам и ситуациям, а дуги — конкретным взаимосвязям между ними.

Рассмотрим формальное определение СС. Дано конечное множество символов: А = {А1 ..., Ап}, называемых атрибутами. Схемой или интенсионалом некоторого отношения Ri,■ в атрибутивном формате называют набор пар INT(Ri) = {...Aj, Dom(Aj)...}, где Ri,— имя отношения; Aj, § A, j = 1, ..., ni, — атрибуты отношения Ri,-, ni,- — целое положительное число, его местность (арность); Dom(Aj) — множество значений атрибута Aj отношения Ri,-, т.е. домен Aj.

Домен — это совокупность значений некоторой информационной единицы, помещенная в БД и маркируемая своим атрибутом. Объединение всех доменов W — базовое множество модели — набор объектов, на которых задаются отношения Ri,; т — число различных отношений.

Экстенсионалом отношения Ri,- называют множество EXT(Ri) = {...Fk …I, k = 1,..., pi}, где pi — кординальность множества EXT(Ri); Fk EXT(Ri) — факты отношения Ri,-, записываемые в виде:

Fk=(Ri …Aj §Vijk Dom(Aj)...)

Vijk — значение j-го атрибута k-го факта экстенсионала отношения Ri,. Последовательность из двух элементов вида «атрибут-значение», называют атрибутивной парой. Порядок записи атрибутивных пар и фактов не играет роли. Все факты и атрибутивные пары внутри каждого факта попарно различны. Тогда семантическая связь — это совокупность

{...<INT(Ri) ЕХT(Ri)…(для i = 1,..., m),

записываемая в виде ассоциативной структуры данных.

В семантических сетях используют различные типы структур, но требование ассоциативности, т.е. группирования информации вокруг фактов, атрибутов и/или объектов является обязательным. Экстенсиональные семантические сети соответствуют базе данных, интенсиональные — базе знаний. Их объединение образует систему представления данных и знаний в интеллектуальной информационной системе. Частным случаем семантических сетей являются сценарии или однородные семантические сети. В однородных семантических сетях вершины, отображающие объекты, связаны между собой однонаправленными дугами, которые отображают отношение строгого или частичного порядка с различной семантикой. Если, например, объектами-понятиями будут виды заданий, а единственным отношением строгого порядка будет отношение следования, то получают сетевой график комплекса работ.

На примере семантической сети общего вида можно установить различие между базой данных и базой знаний. Предметная область есть множество допустимых состояний своих компонентов. Это множество, представленное через общие понятия и предложения между ними, образует базу знаний в виде интенсиональной семантической сети. В зависимости от ситуации, компоненты предметной области будут иметь конкретные значения, свойства, характеристики. Все эти конкретные данные предметной области будут отображаться в экстенсиональной семантической сети БД сетевой структуры.

При построении семантической сети для представления знаний важны классификации типов объектов и некоторых фундаментальных видов связей между объектами. Независимо от особенностей предметной области можно предполагать, что семантическая сеть содержит обобщенные, конкретные или агрегатные информационные объекты.

Обобщенный объект — это некоторое известное и хорошо используемое в данной предметной области понятие, например «межбанковский кредит», «опцион». Обобщенный объект фактически представляет определенным образом класс объектов предметной области. Конкретный или индивидуальный объект — это некоторым образом выделенная единичная (индивидуальная) сущность, например, банк «ОВК», магазин «Седьмой Континент».

Агрегатом называют объект предметной области, тем или иным образом составленный из других объектов, являющихся его частями.

В соответствии с классификацией типов объектов предметной области при построении семантических сетей используют следующие типы семантических отношений: синтаксические и парадигматические.

Синтаксические отношения далее подразделяют на субъектные и объектные, а также пространственные, временные и др.

Парадигматические отношения отражают постоянно существующие связи между понятиями. Среди парадигматических выделяют отношения подчинения и ассоциативности. Отношение подчинения чаще всего соответствует связям типа «род—вид», «класс—подкласс», «целое—часть». Между двумя обобщенными объектами предметной области может существовать родовая связь. Например, наличие ее между обобщенными объектами А и В означает, что любой объект, отображаемый понятием В, отображается и понятием А и что существует такой объект, который отображается понятием А, но не отображается В. Иными словами, понятие А является более общим, чем В.

Видовая связь обратна родовой. Если объект А является родом В, то говорят, что В — вид А, и наоборот. Из приведенных примеров видно, что родовое понятие не охватывает всех свойств видового, так как видовое понятие богаче содержанием. Все свойства родового понятия, как правило, присущи и видовому (наследование свойств). Это позволяет более компактно представить систему знаний семантической сети.

Между обобщенным и конкретным объектами может существовать связь «является представителем», экземпляром отношения is-a, instance-of. Она имеет место в том случае, когда конкретный объект принадлежит классу, отображаемому соответствующим обобщенным объектом. Важно отметить, что один и тот же конкретный объект может рассматриваться как представитель нескольких обобщенных объектов в одной и той же предметной области. Между агрегатным объектом и каким-либо другим объектом предметной среды может существовать отношение «является частью».

Ассоциативные отношения, отображающие любые устойчивые взаимосвязи между объектами, подразделяют на следующие виды: причинно-следственные (каузальные), пространственные, временные, отношения действия.

Причинно-следственные отношения описывают различные виды причинно-следственных связей между объектами. Причинно-следственные отношения являются нерефлексивными, антисимметричными и транзитивными. Пространственные отношения описывают пространственные связи между объектами (например, «вблизи», «в центре города», «далеко»). Временные отношения описывают связи объектов, фактов, событий и явлений во времени (например, «двигаться к», «приближаться», «взаимодействовать»).

Процедурой поиска знаний в семантической сети является поиск по образцу. Он может представлять собой либо полностью определенный фрагмент знаний, либо содержать свободные переменные. Информационная потребность, определяющее содержание и цель запроса и БЗ описывается автономной базой знаний — сетью запроса, построенной по тем же правилам и отображающей те же объекты и отношения, которые представлены в системе знаний. Поиск ответа на запрос реализуется сопоставлением сети запроса с фрагментами семантической сети, представляющей систему знаний. Положительный результат сопоставления позволяет получить один из ответов на запрос. Все ответы можно получить путем обнаружения всех сопоставляемых с сетью запроса фрагментов. Операция сопоставления в основе опирается на установление изоморфизма графов и сводится к следующему. Для семантической сети, представляющей систему знаний, задается набор допустимых преобразований, переводящих исходную семантическую сеть или ее фрагменты в логически эквивалентную ей. Операция сопоставления выявляет все фрагменты исходной или эквивалентных сетей, изоморфные сети запроса. Набор допустимых преобразований для семантических сетей дополняет сети новыми связями, полученными из транзитивности фундаментальных отношений и наследования свойств. В зависимости от специфики решаемых задач набор эквивалентных преобразований может существенно расширяться.

Теория и технология семантических сетей позднее получила развитие в виде диаграмм «сущность—связь», диаграммы потоков данных в рамках CASE-технологии проектирования баз данных.