Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ТПР. Всё в 1 файле / Прикладные Инст сист.pdf
Скачиваний:
299
Добавлен:
15.09.2014
Размер:
1.43 Mб
Скачать

Лекция 2. Представление знаний в интеллектуальных системах

В круг вопросов, решаемых при представлении знаний, включают следующие:

определение состава представляемых знаний;

организация знаний,

представление знаний, т.е. определение модели представления.

Для ее функционирования интеллектуальной системы (ИС) требуются следующие

знания:

знания о процессе решения задачи (т.е. управляющие знания), используемые решателем;

знания о языке общения и способах организации диалога, используемые в интерфейсных компонентах;

знания о способах представления и модификации знаний, используемые интеллектуальным редактором баз знаний;

поддерживающие структурные и управляющие знания, используемые объяснительной компонентой.

Для динамических ИС, кроме того, необходимы следующие знания:

1)знания о методах взаимодействия с внешним окружением;

2)знания о модели внешнего мира.

2.1. Модели представления знаний

Модели представления знаний обычно делят на логические (формальные) и

эвристические (формализованные) [6, 8, 10, 22]. В основе логических моделей

представления знаний лежит понятие формальной системы (теории). Примерами формальных теорий могут служить исчисление предикатов. В логических моделях, как правило, используется исчисление предикатов первого порядка, дополненное рядом эвристических стратегий. Эти методы являются системами дедуктивного типа, т.е. в них используется модель получения вывода из заданной системы посылок с помощью фиксированной системы правил вывода. Дальнейшим развитием предикатных систем являются системы индуктивного типа, в которых правила вывода порождаются системой на основе обработки конечного числа обучающих примеров.

Влогических моделях представления знаний отношения, существующие между отдельными единицами знаний, выражаются только с помощью тех небогатых средств, которые предоставляются синтаксическими правилами используемой формальной системы.

Вотличие от формальных, эвристические модели имеют разнообразный набор средств, передающих специфические особенности той или иной проблемной области. Именно поэтому эвристические модели превосходят логические как по возможности адекватно представить проблемную среду, так и по эффективности используемых правил вывода. К эвристическим моделям, используемым в экспертных системах, можно отнести

сетевые, фреймовые, продукционные и объектно-ориентированные модели.

Все указанные выше типы моделей представления знаний подробно рассмотрены в [6, 8, 22].

Семантические модели. Термин семантическая означает "смысловая", а сама

семантика это наука, устанавливающая отношения между символами и объектами, которые они обозначают, т.е. наука, определяющая смысл знаков.

Семантическая сеть – это ориентированный граф, вершины которого – понятия, а дуги – отношения между ними [6].

12

В качестве понятий обычно выступают абстрактные или конкретные объекты, а отношения это связи типа: "это" ("АКО – A KIND OF", "IS A"), "состоит из" ("HAS A PART"), "принадлежит". Характерной особенностью семантических сетей является обязательное наличие трех типов отношений:

класс элемент класса;

свойство значение;

пример элемента класса).

Можно предложить несколько классификаций семантических сетей, связанных с

типами отношений между понятиями. По количеству типов отношений:

однородные (с единственным типом отношений);

неоднородные (с различными типами отношений). По типам отношений:

бинарные (в которых отношения связывают два объекта);

n-арные (в которых есть специальные отношения, связывающие более двух понятий). Наиболее часто в семантических сетях используются следующие отношения:

связи типа часть целое (класс – подкласс, элемент – множество и т.п.);

функциональные связи (определяемые обычно глаголами "производит", "влияет");

количественные (больше, меньше, равно);

пространственные (далеко от, близко от, за, под, над);

временные (раньше, позже, в течение);

атрибутивные связи (иметь свойство, иметь значение);

логические связи (И, ИЛИ, НЕ);

лингвистические связи и др.

Проблема поиска решения в базе знаний типа семантической сети сводится к задаче

поиска фрагмента сети, соответствующего некоторой подсети, отражающей поставленный запрос к базе.

Основным преимуществом данной модели является то, что она более других соответствует современным представлениям об организации долговременной памяти человека. Недостатком этой модели является сложность организации процедуры поиска вывода на семантической сети.

Фреймы. Фрейм – структура данных (т.е. декларативное представление), предназначенная для представления некоторой стандартной ситуации. С каждым фреймом ассоциируется разнообразная информация (в том числе и процедуры), например о том, как пользоваться данным фреймом, каковы ожидаемые результаты выполнения фрейма, что делать, если ожидания не оправдались, и т.п.

Различают фреймы-образцы, или прототипы, хранящиеся в базе знаний, и фреймыэкземпляры, которые создаются для отображения реальных фактических ситуаций на основе поступающих данных. Модель фрейма является достаточно универсальной, поскольку позволяет отобразить все многообразие знаний о мире через:

фреймы-структуры, использующиеся для обозначения объектов и понятий;

фреймы-роли;

фреймы-сценарии;

фреймы-ситуации и др.

Важнейшим свойством теории фреймов является заимствование из теории семантических сетей так называемое наследование свойств. И во фреймах, и в семантических сетях наследование происходит по АКО-связям ("A KIND OF" или "IS A" – это). Слот АКО указывает на фрейм более высокого уровня иерархии, откуда неявно наследуются, т.е. переносятся значения аналогичных слотов.

13

Продукционная модель. Продукционная модель или модель, основанная на правилах, позволяет представить знания в виде предложений типа

"ЕСЛИ (условие), ТО (действие)".

Под "условием" (антецедентом) понимается некоторое предложение-образец, по которому осуществляется поиск в базе знаний, а под "действием" (консеквентом) действия, выполняемые при успешном исходе поиска (они могут быть промежуточными, выступающими далее как условия и терминальными или целевыми, завершающими работу системы).

Чаще всего вывод на такой базе знаний бывает прямой (от данных к поиску цели) или обратный (от цели для ее подтверждения к данным). Данные это исходные факты, хранящиеся в базе фактов, на основании которых запускается машина вывода или интерпретатор правил, перебирающий правила из продукционной базы знаний.

Достоинства продукционной модели: наглядность, высокая модульность, легкость внесения дополнений и изменений, простота механизма логического вывода.

2.2. Системы, основанные на правилах

Примерами интеллектуальных систем, основанных на правилах, являются следующие:

1.Системы продукционных правил (типа «если выполняются условия …, то делай…»).

2.Системы нечетких правил (формулируемых в удобных для человека качественных терминах, а именно нечетких понятий: много, мало,…).

3.Системы логического программирования.

Системы продукционных правил. Под системой продукций понимается система управления множеством правил, срабатывающих только при выполнении некоторых определенных условий. Условия применимости могут меняться в процессе функционирования продукционной системы в зависимости от получения той или иной информации во время вывода. Условие применимости правила специфицирует некоторые требования к текущему состоянию, а действие содержит описание тех операций, которые надо произвести, если эти требования выполняются.

Применяется и другое определение системы продукций. Продукционной системой (ПС) называется определенный метод организации вычислительного процесса, при котором программа преобразования некоторой информационной структуры задается в виде множества правил – продукций, каждое из которых представляет собой пару «условие применимости – действие». Такому содержательному определению соответствует весьма широкий спектр формальных систем (формальные грамматики, асинхронные программы, потоковые системы). Сюда же можно отнести все формальные системы вывода и доказательств, в которых продукциями являются аксиомы и правила вывода. Как правило, в ПС обрабатываемая структура содержит информацию о конкретной задаче, а правила представляют знания о предметной области.

Общая постановка задач при использовании ПС формулируется следующим образом. Задаются исходное и целевое состояние задачи. Система на основе заложенных в нее продукционных знаний ищет возможные пути перевода исходного состояния в целевое.

Система по исходной постановке на основе заложенных в ней знаний ищет возможные пути решения, используя методы эвристического поиска. Задача эвристического поиска решается либо методами поиска в пространстве состояний, либо методами сведения задачи к совокупности подзадач.

Продукционные системы состоят из трех частей: базы знаний (БЗ), совокупности правил – продукций и интерпретатора. В общем случае база знаний представляет собой ассоциативную память, ориентированную на размещение определенного типа структур. В

14

БЗ реализуются процедуры проверки условий применимости продукций, т.е. процедуры поиска по образцу [6, 8].

Совокупность продукций отражает процедурное содержание знаний, заложенных экспертом данной предметной области в систему. Каждая из продукций имеет вид «условие – действие», где условие – это образец, по которому осуществляется поиск в БЗ, а оператор определяет действия, выполняемые при успешном исходе поиска.

Нечеткие правила. Нечеткие правила также имеют семантику <условие – действие> и являются частным случаем продукционных правил. В нечетких правилах используются нечеткие понятия, а логические заключения делаются с помощью нечеткой логики [8].

Системы логического программирования. В системах логического программирования правила также имеют вид импликаций, но в них используются логические модели. Примером систем этого типа является язык Пролог. В логических системах не разрешается использовать отрицание, дизъюнкции и/или равенства. Здесь

правила имеют вид "Конъюнкция атомов &Ai влечет атом B", где атомы могут содержать не

i

только константы, но и переменные.

 

Импликация &Ai B понимается как процедура, тело которой

&Ai состоит из

i

i

процедурных вызовов Ai. В отличие от продукционных систем и систем нечетких правил, в системах логического программирования осуществляется обратный вывод: для атомов, входящих в запрос, отыскивается правило, условие которого следует из этого множества атомов. По этому правилу выводится его заключение, добавляемое затем в виде атома в используемое множество атомов.

На практике для повышения эффективности поиска вывода используют нелогические процедуры, что позволяет работать не только с задачами логического, но и числового характера.

2.3. Системы, основанные на автоматическом доказательстве теорем

Среди систем, основанных на автоматическом доказательстве теорем, наиболее часто применяются системы: 1) резолюционного и 2) генценовского типов. В системах первого типа реализуются различные модификации метода резолюций. Этот метод является теоретической основой языков логического программирования типа Пролог. Системы второго типа бывают с естественным выводом (напоминающим манеру рассуждения человека) или с секвенциональным выводом. Здесь вывод представляет многошаговую процедуру декомпозиции (разделения) задач на подзадачи до получения тривиальных подзадач. Системы автоматического доказательства теорем сегодня значительно превосходят другие средства искусственного интеллекта с точки зрения сложности доказываемых ими теорем. Областью применения автоматического доказательства теорем является автоматизация строгих рассуждений, допускающих формализацию, в условиях отсутствия ресурсных ограничений на проведение процедуры доказательства. Это означает, что методы автоматического доказательства теорем не применимы к задачам, решаемым в реальном времени.

2.4. Системы, основанные на автоматическом порождении (выдвижении) гипотез

Автоматическое порождение (выдвижение) гипотез, или автоматическое гипотезирование в интеллектуальных системах происходит различными методами. Наибольшую известность приобрели методы обучения, GUHA-метод и ДСМ-метод.

Обучение в частично или полностью неизвестной среде сводится к нахождению некоторой функции. Обучение на основе множества предъявляемых учителем примеров в виде пар (аргумент, значение) называется индуктивным обучением, а конкретные предположения о виде неизвестной функции – гипотезой. В зависимости от выбранного

15

представления для нахождения этой неизвестной функции может использоваться математический аппарат булевых функций, логических формул, вероятностностатистических методов, нейронных сетей, деревьев решений и др. Существует и другой тип обучения, когда обучаемый не получает примеров. Он начинает действовать самостоятельно и временами получает поощрения. Возникающие в таких условиях проблемы автоматического выдвижения гипотез реализуются в области коллективного поведения автоматов и адаптивного управления. Накопленные в интеллектуальных системах знания (помимо примеров и подкреплений) позволяют улучшить способность к обучению. Эта особенность используется при обучении на основе объяснения примеров. Объяснение примеров – это метод извлечения общих правил (гипотез) из индуктивных наблюдений и некоторой общей теории.

GUHA-метод – это общий метод автоматического выдвижения унарных гипотез.

Он представляет собой систему процедур порождения и оценки элементарных высказываний-гипотез об одновременной выполнимости заданного набора свойств на имеющихся эмпирических данных. Такие гипотезы называются эмпирическими высказываниями. Априорная информация о структуре обрабатываемых данных представлена в виде так называемых теоретических высказываний. В GUHA-методе использованы специфические средства для формализации индукции: обобщенные кванторы, эмпирические реляционные системы и соответствующие им эмпирические исчисления, имеющие лишь конечные модели, логики неполной информации и т. д. Существенная часть GUHA-метода образована статистическими процедурами проверки порожденных гипотез. Рациональные правила вывода позволяют с помощью имеющихся эмпирических и теоретических высказываний (входящих в посылки вывода) выводить новые теоретические высказывания относительно обрабатываемых данных.

ДСМ–метод. В ДСМ–методе формализованы и программно реализованы методы сходства и различия Д. С. Милля, в честь которого и назван рассматриваемый метод автоматического порождения гипотез. В отличие от GUHA-метода ДСМ-метод не опирается на идеи, характерные для теории вероятностей и математической статистики. ДСМ-метод предназначен для выявления причинно-следственных эмпирических зависимостей на множестве нечисловых фактов в условиях неполноты информации.

Формирование гипотез в ДСМ-методе, как и в системах автоматического обучения, происходит на основе имеющихся в распоряжении системы наборов примеров, подтверждающих и отрицающих формируемую гипотезу (положительные и отрицательные примеры). Гипотезы о закономерностях выдвигаются в результате таких обобщений положительных примеров, которые не являются обобщениями отрицательных примеров.

Допущениями для применимости ДСМ-метода автоматического порождения гипотез являются следующие утверждения:

исходные события представляют собой множества двух сортов;

исследуемые явления представляют собой отношения между множествами;

в данных существуют эмпирические корреляции;

существуют как причины наличия корреляций (положительные причины), так причины отсутствия корреляций (отрицательные причины).

Введем два множества: множество причин С = {c1, c2,…, cn, …} и множество следствий

A = {a1, a2, …, am…} [3]. Гипотезой будем называть выражение вида

Jm+ (ci

+ ai), где

Jm+ –специальный квантификатор оценки обоснованности гипотезы

о том,

что ci есть

причина ai. Одновременно с положительной гипотезой Jm+ (ci + ai) будем рассматривать отрицательные гипотезы Jm(ci ai), в которых с обоснованностью Jmсчитается, что ci

16