Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие(А4).doc
Скачиваний:
0
Добавлен:
01.03.2025
Размер:
3.19 Mб
Скачать

8.2.2 Модели представления знаний

Принято говорить не о «знаниях вообще», а о знаниях, зафиксированных с помощью той или иной модели знаний.

Представление знаний в СИИ — это не только фундаментальное понятие, но и решающий аспект их разработки. Выбор модели представления знаний (МПЗ) очень сложен ввиду их многообразия и размытости критериев выбора и важен, ибо он оказывает огромное влияние на любую часть СИИ и предопределяет их возможности (свойства и характеристики). Последствия неудачного решения проблемы представления знаний могут быть катастрофическими. Кроме того, используемый в СИИ формализм представления знаний определяет характер их получения и накопления, в результате которого создается БЗ, ориентированная на определенную структуру представления, а не на сущность самих знаний. Выбор модели, не адекватной типам знаний, приводит к потере многих существенных деталей прикладной задачи и порождает тривиальный интеллект.

Проблемы представления знаний в компьютерных системах решаются на трех уровнях:

1) техническом — реализация сложных представлений знаний, требующая электронной вычислительной техники с чрезвычайно сложной функциональной архитектурой, обеспечивающей параллельные вычисления и гарантирующей протекание процесса представления знаний в режиме реального времени, а также мощными запоминающими устройствами;

2) программном (логическом) — создание программ, которые обеспечивают выполнение всех алгоритмов, необходимых для представления знаний;

3) концептуальном — выработка концепций, моделей, образующих методологию искусственного интеллекта.

Под представлением знаний подразумевают соглашение о том, как описывать реальную ПрО (понятия и отношения). Иногда такое соглашение называют нотацией. Каждая модель знаний определяет форму представления знаний и является формализмом, призванным отобразить объекты, связи между ними и отношения, иерархию понятий ПрО и изменение отношений между объектами.

Для решения проблемы представления знаний разработаны разнообразные модели представления знаний (МП'З). В системах искусственного интеллекта используются в основном четыре типа МПЗ: логические, продукционные, семантические сети и фреймы.

Логические модели представляют знания в виде формул, которые состоят из констант, переменных, функций, предикатов, логических связок и кванторов. Каждая логическая формула дает частичное описание состояния предметной области.

В основе всех логических моделей представления знаний лежит понятие формальной системы М, задаваемой четверкой:

M = <T, P, A, F>,

где T — множество базовых элементов (алфавит формальной системы);

Р — множество синтаксических правил, позволяющих строить синтаксически правильные выражения А из Т;

А — множество априорно истинных аксиом (любое множество синтаксически правильных выражений);

F — правила вывода, позволяющие расширять множество аксиом.

Среди реализаций логических моделей представления знаний различают системы дедуктивного типа (имеют фиксированную систему правил вывода) и индуктивного типа (правила вывода порождаются системой на основе конечного числа обучающих примеров).

В логических моделях синтаксис задается набором правил построения правильных синтаксических выражений, а семантика — набором правил преобразования выражений и разрешающей процедурой, позволяющей однозначным образом и за конечное число шагов определить, является ли данное выражение семантически правильным. Преимуществами логических схем представления знаний являются: высокий уровень модульности знаний, лаконичность представления, наличие тела анализа и определение понятия логического вывода, позволяющее получить формальным путем новые знания.

Недостатки логической модели знаний чрезмерный уровень формализации знаний; слабая наглядность, трудность прочтения логических формул и сложность их понимания; низкая производительность СИИ при обработке знаний и большая требуемая память; отсутствие выразительных средств для отражения особенностей ПрО и структурирования знаний; громоздкость при описании больших объемов знаний.

Логические модели в силу присущих им недостатков самостоятельно применяются в СИИ крайне редко.

Обычно они используются в сочетании с другими МПЗ.

Продукционные модели. Продукционные правила (продукции) задаются в виде выражений:

ЕСЛИ условие ТО действие;

ЕСЛИ причина ТО следствие;

ЕСЛИ ситуации ТО решение.

Суть этих выражений заключается в том, что если выполняется условие, то нужно произвести некоторое действие. Продукционные модели могут быть реализованы как процедурно, так и декларативно.

Продукционная модель состоит из трех основных компонентов. Первым компонентом является база данных — набор правил, состоящих из условий и действий. В базе данных хранятся известные факты выбранной ПрО. Вторым компонентом служит рабочая память, в которой хранятся исходные факты и результаты выводов, полученных из этих фактов. Третьим компонентом является интерпретатор — механизм логического вывода, использующий правила в соответствии с содержимым рабочей памяти и формирующий новые факты.

Каждое правило содержит условную и заключительную части. В условной части правила находится одиночный факт либо несколько фактов (условий), соединенных логической операцией «И».

В заключительной части правила находятся факты, которые необходимо дополнительно сформировать в рабочей памяти, если условная часть правила является истинной.

Если для получения вывода правила применяются к фактам, записанным в рабочей памяти, и в результате применения правил добавляются новые факты, то такой способ действий называется прямым выводом.

Возможен также обратный вывод целей. В качестве цели выступает подтверждение истинности факта, отсутствующего в рабочей памяти. При обратном выводе исследуется возможность применения правил, подтверждающих цель, необходимые для этого дополнительные факты становятся новыми целями, и процесс повторяется.

В случае обратного вывода условием завершения работы системы является окончание списка правил, которые относятся к доказываемым целям. При прямом выводе завершение работы происходит по окончании списка применимых правил. Следует отметить, что на каждом шаге вывода количество одновременно применимых правил может быть любым.

Последовательность выбора подходящих правил не влияет на однозначность получаемого ответа, однако может существенно увеличить требуемое число шагов вывода. В реальных базах знаний с большим числом правил это может существенно снизить быстродействие системы.

В системах с обратным выводом есть возможность исключить из рассмотрения правила, не имеющие отношения к выводу требуемых целей, и тем самым несколько ослабить указанный отрицательный эффект. По этой причине системы с обратным выводом целей получили большее распространение.

Продукционные правила (продукции) содержат специфические знания предметной области о том, какие еще дополнительные факты могут быть учтены, есть ли специфические данные в базе данных. В системах искусственного интеллекта, построенных на использовании продукционных моделей представления знаний, база данных представляет собой переменную часть, а правила и интерпретатор не изменяются. Благодаря свойству модульности, присущему продукционным моделям представления знаний, можно добавлять и изменять знания (правила, факты). Поэтому продукционные модели представления знаний применяются в ПрО, где нет четкой логики и задачи решаются на основе независимых правил (эвристик).

Правила продукции несут информацию о последовательности целенаправленных действий.

Продукционные модели благодаря причинно-следствен-ному характеру правил (продукций) хорошо отражают прагматическую составляющую знаний.

СИИ продукционного типа проявляют свои сильные стороны, если решается небольшая задача. При увеличении объема знаний эффективность СИИ падает.

Представление знаний в виде набора правил имеет следующие преимущества:

  1. простота создания и понимания отдельных правил;

  2. простота механизма логического вывода.

К недостаткам этого способа организации базы знаний относятся:

  1. неясность взаимных отношений правил;

  2. отличие от человеческой структуры знаний.

Модель фреймов. В основе теории фреймов лежит фиксация знаний путем сопоставления новых фактов с рамками, определенными для каждого объекта в сознании человека. Структура в памяти ЭВМ, представляющая эти рамки, называется фреймом. С помощью фреймов представляют процесс систематизации знаний в форме, максимально близкой к принципам систематизации знаний человеком.

Фреймы — это особые познавательные структуры, дающие целостное представление о явлениях и их типах. Фреймы отражают концептуальную основу организации памяти человека.

Фрейм представляет собой таблицу, структура и принципы организации которой являются развитием понятия отношения в реляционной модели данных.

Новизна фреймов определяется двумя условиями:

  1. имя атрибута может в ряде случаев занимать в фрейме позицию значения;

  2. значением атрибута может служить имя другого фрейма или имя программно реализованной процедуры.

Структура фрейма имеет вид (таблица 8.1):

I:{<V1, q1, p1>,<V2, q2, p2>,...,<Vk, qk, pk>},

где I — имя фрейма;

<Vk, qk, pk>}, k =1,nслот;

Vkимя слота;

qkзначение слота;

ркпроцедура (необязательный элемент).

Слотыэто некоторые структурные элементы фрейма, заполнение которых приводит к тому, что фрейм ставится в соответствие некоторой ситуации, явлению, объекту или процессу. В качестве слота может быть указано имя другого фрейма.

Слотом фрейма называется элемент данных, предназначенный для фиксации знаний об объекте, которому отведен данный фрейм.

Таблица 8.1

Имя слота. Каждый слот должен иметь уникальное имя во фрейме, к которому он принадлежит. Имя слота в некоторых случаях может быть служебным. Среди служебных имен отметим имя пользователя, определяющего фрейм; дату определения или модификации фрейма; комментарий.

Значениями слота могут быть конкретные данные, процедуры и даже продукция. Слот может быть пустым (незаполненным).

Указатель наследования. Он показывает, какую информацию об атрибутах слотов во фрейме верхнего уровня наследуют слоты с теми же именами во фрейме нижнего уровня.

Типичными указателями наследования являются:

S (тот же). Слот наследуется с теми же значениями данных;

U (уникальный). Слот наследуется, но данные в каждом фрейме могут принимать любые значения;

I (независимый). Слот не наследуется.

Указатель типа данных. К типам данных относятся:

FRAME (указатель) —указывает имя фрейма верхнего уровня;

ATOM (переменная);

TEXT (текстовая информация);

LIST (список);

LISP (присоединенная процедура).

С помощью механизма управления наследованием по отношениям «есть-нек» осуществляются автоматический поиск и определение значений слотов фрейма верхнего уровня и присоединенных процедур.

Преимущества фреймовых систем по сравнению с продукционной моделью представления знаний:

  1. знания организованы на основе концептуальных объектов;

  2. допускается комбинация представления декларативных (как устроен объект) и процедурных (как взаимодействует объект) знаний;

  3. иерархия фреймов соответствует классификации понятий, привычной для восприятия человеком;

  4. система фреймов легко модифицируется и расширяется.

Следующим шагом на пути выявления структуры, присущей знаниям, являются модели, в которых в явной форме выделяются все отношения, образующие эту структуру, с описанием их семантики.

Модель семантических сетей. Особенность семантической сети как модели знаний состоит в единстве базы знаний и механизма вывода новых фактов. На основании вопроса к базе знаний строится семантическая сеть, отображающая структуру вопроса, и ответ получается в результате сопоставления общей сети для базы знаний в целом и сети для вопроса.

Семантические сети основываются на результатах изучения организации долговременной памяти человека. Характерной особенностью для семантических сетей является то, что они для образования своей структуры используют два компонента — понятия и отношения. Вершинам сети соответствуют понятия (объекты, события, процессы, явления), а дугам, их соединяющим, — отношения между понятиями.

В зависимости от структуры узлов и характера отношений между ними различают следующие сети: простые, иерархические, однородные и неоднородные. Последние делятся на функциональные сети, сценарии и семантические сети.

В семантических сетях знания представлены в терминах естественного языка и отношений между ними (элемент — класс; класс — подкласс; функциональные дуги).

Основные характеристики семантических сетей:

  • объекты описываются на естественном языке;

  • все знания накапливаются в относительно однородной структуре памяти;

  • на сетях определяются унифицированные отношения между объектами, которым соответствуют унифицированные методы вывода;

  • методы вывода в соответствии с запросами определяют участки семантического знания, имеющего отношение к поставленной задаче, формулируя акт понимания запроса и некоторую цепь выводов, соответствующих решению задачи.

Семантические сети обладают следующими достоинствами: повышенной гибкостью за счет наличия свойств ассоциативности и иерархичности; гармоничным и естественным сочетанием декларативного и процедурного, синтаксического и семантического знания; наглядностью отображения объектов, связей отношений в силу присущей им возможности графической нотации; легкой читаемостью и понимаемостью знаний; высокой степенью структуризации знаний. Преимущества семантических сетей состоят в том, что это достаточно понятный способ представления знаний на основе отношений между вершинами и дугами сети.

Среди недостатков сетевого представления выделяют сложность и трудность разработки алгоритмов их анализа ввиду нерегулярности структуры и большого количества дуг, несущих синтаксическую информацию; пассивность структуры сети, для обработки которой необходим сложный аппарат формального вывода и планирования; разнообразие типов вершин и связей, произвольность структуры, требующей большого разнообразия процедур обработки; трудность представления и обработки неточных и противоречивых знаний. Однако с увеличением размеров сети ухудшается ее обозримость и увеличивается время вывода новых фактов с помощью механизма сопоставления.

В целом семантические сети позволяют представлять семантику ПрО, а также осуществлять за счет наличия связей и отношений между понятиями целевую ориентацию и таким образом отражать прагматическую составляющую знаний.

В связи с указанными недостатками предприняты попытки усовершенствования семантических сетей, которые в основном нацелены на организацию процессов обобщения в сети, решение проблемы поиска и повышение их изобразительных возможностей.

Например, семантическая сеть, отображающая подчиненность преподавателей на кафедре в вузе, приведена на рис. 8.5, а. Приводятся связи, показывающие подчиненность первого преподавателя. Остальные преподаватели кафедры вуза связываются через вершины сети «руководит 2», «руководит 3» и т.д.

Вопрос «Кто руководит Петровым?» представлен в виде подсети, показанной на рис. 8.5, б.

Рис. 8.5 — Примеры семантической сети (а)

и сети логического вывода для запроса (б)

Сопоставление общей сети с сетью запроса начинается с фиксации вершины «руководит», имеющей ветвь «объект», направленную к вершине «Петров Г.З.». Затем производится переход по ветви «руководит», что и приводит к ответу «Иванов П.А.».

Модели знаний — продукционная, фреймовая и модель семантических сетей — обладают практически равными возможностями представления знаний, использующих отношения «есть-нек» и «есть-часть».

Кроме того, каждая модель знаний содержит средства усиления этой «базовой» конфигурации, а именно:

  1. продукционная модель позволяет легко расширять и усложнять множество правил вывода;

  2. фреймовая модель позволяет усилить вычислительные аспекты обработки знаний за счет расширения множества присоединенных процедур;

  3. модель семантических сетей позволяет расширять список отношений между вершинами и дугами сети, приближая выразительные возможности сети к уровню естественного языка.

Из всех ранее рассмотренных моделей представления знаний только фреймам свойственны высокая структурируемость, внутренняя интерпретируемость посредством имен и значений и связность слотов и их значений. Кроме того, фреймы обладают высокой наглядностью и модульностью, объединяют достоинства декларативного и процедурного представления знаний. Однако фреймы наиболее эффективны при обработке семантической составляющей знаний. У фреймов, как и у семантических сетей, отсутствуют универсальные процедуры их обработки, что приводит к неэффективному использованию ресурсов вычислительной техники (памяти и быстродействия).

Рассмотренные модели представления знаний наследуют ряд структур данных и являются в некотором смысле их разновидностями, хотя и используются в СИИ для обработки знаний.

Общими слабыми сторонами моделей представления знаний являются ограниченные выразительные возможности для описания экспертных знаний, невозможность описания знаний сложной структуры, недостаточная эффективность нотации (вычислительная эффективность).

Одной из попыток расширения возможностей СИИ является использование сочетания различных моделей представления знаний: фреймов и продукций (продукционные правила в слотах фрейма являются формой присоединения к фрейму процедурных знаний); семантических сетей и логических моделей; семантических сетей и продукций. Однако простое объединение в одной базе знаний нескольких моделей представления знаний, получивших название комбинированных или смешанных, как правило, малоэффективно. Различные МПЗ не обязательно несовместимы друг с другом, однако они отличаются по степени соответствия конкретным внутренним представлениям эксперта.

В настоящее время ведется поиск новых моделей представления знаний, базирующихся на идеях, отличных от формальной системы или сети понятий, ориентирующихся на языковые конструкции (семантику естественного языка).