Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

978-5-7764-0767-3

.pdf
Скачиваний:
28
Добавлен:
05.06.2015
Размер:
3.57 Mб
Скачать

Пользователь

Инженер по

Эксперт

знаниям

 

 

 

Интерфейс СОЗ

Рабочая

 

Механизм

 

Подсистема

 

Редактор Базы

 

логического

 

 

память

 

 

объяснения

 

Знаний

 

вывода

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

БАЗА ЗНАНИЙ

Рис. 4.3. Структура системы, основанной на знаниях

Основой СОЗ является база знаний (БЗ) из предметной области, в кото-

рой решаются задачи. Для работы с БЗ необходимо управление процессами решения прикладных задач, которое осуществляется самой прикладной про-

граммой, что делает трудоемким разработку новых ИИС. Снижение затрат на разработку новых СОЗ возможно, если использовать готовые решения в спе-

циально выделяемых в СОЗ системах управления базами знаний (СУБЗ).

141

4.2. Структура системы управления базами эволюционирующих знаний

Совершенствование технологий по созданию и использованию прило-

жений в таких областях как CAD-системы, разработка программного обеспе-

чения, управление процессами в реальном времени, базы данных и электрон-

ные библиотеки требуют структурированности, эффективного доступа и управления большими базами знаний. Такие базы знаний не могли быть со-

зданы при использовании существовавших инструментов (языков програм-

мирования высокого уровня, оболочек экспертных систем) потому, что они не расширяются. Базы знаний не могли создаваться и использоваться с точки зрения существовавшей технологии баз данных, так как ее не поддерживает-

ся богатая выразительная структура и механизмы вывода, требуемые для си-

стем, основанных на знаниях. Кроме того, имеющиеся механизмы оптимиза-

ции не ориентированы на использование богатой структуры и семантических свойств баз знаний.

Для решения рассмотренных проблем, в конце прошлого столетия, с 1985 по 1995 годы, в университете Торонто (Канада), разрабатывался проект

KBMS (Knowledge Base Management System) [49,63]. Основной целью этого проекта было создание универсальной архитектуры системы управления ба-

зой знаний, предназначенной для развивающихся компьютерных приложе-

ний.

К настоящему времени нет общепризнанных определений понятиям

«база данных» и «база знаний». Автор принимает точку зрения, изложенную в работе [49], где отмечается, что технических различий между терминами

«База знаний» и «База данных» нет, в связи с тем, что многофункциональные

(расширенные) системы управления базами данных, такие как управление объектно-ориентированными, активными и дедуктивными базами данных,

поддерживают некоторый дедуктивный и не дедуктивный механизмы выво-

дов и средства структурирования, аналогичные с базами знаний. Разница в значении этих двух терминов, если она имеется, в основном в том, в какой

142

степени системы поддерживают представление, структурирование и возмож-

ность вывода.

В основу разработанной СУБЗ положена расширяемая, многоуровневая архитектура. Расширяемая архитектура позволяет СУБЗ работать как с меха-

низмами вывода общего назначения, так и со специальными механизмами вывода. Специальные механизмы вывода, например, механизм простран-

ственного мышления или механизм на основе доказательной аргументации,

встраиваются в зависимости от потребностей специальных приложений, в то время как механизмы вывода общего назначения являются одинаковыми для всех приложений. Многоуровневая архитектура поддерживает проектирова-

ние кода, основанное на повышении уровня абстракции, что позволяет раз-

бивать общую задачу проектирования СУБЗ на несколько подзадач. В такой архитектуре использован стандартный интерфейс для каждого уровня и его компонентов, что позволяет многократно их использовать в различных СУБЗ. Разработанная архитектура системы управления базой знаний (рис. 4.4), включает три уровня:

уровень интерфейсов, который предлагает различные виды пользова-

тельских интерфейсов;

логический уровень, который выполняет примитивные операции по из-

влечению знаний и обновлению базы знаний;

физический уровень, который управляет структурами данных для хра-

нения баз знаний, различных показателей и другой вспомогательной инфор-

мации.

Уровень интерфейсов предлагает множество пользовательских служб баз знаний, включая гипертекстовый интерфейс для оперативного взаимо-

действия с пользователем и интерфейс языков программирования (PL), кото-

рый поддерживает выполнение прикладных программ, включающих опера-

ции базы знаний. Кроме того, уровень интерфейсов может включать инстру-

менты системы управления базой знаний для сбора знаний, проверки базы знаний, проверки ограничений, развития и обмена знаниями [54,37]. Службы

143

уровня интерфейсов соединяются с логическим уровнем через интерпретатор языка представления знаний, управление сеансами и компилятор.

Гипертекстовый

 

Интерфейс языков

 

Инструменты

 

 

управления базой

интерфейс

 

программирования

 

 

 

знаний

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Управление Интерпретатор Компилятор

сессиями

 

Менеджер

 

 

объектов

 

Диспетчер

 

БЗ операций

схемы

 

процессов

 

 

 

УРОВЕНЬ ИНТЕРФЕЙСОВ

ЛОГИЧЕСКИЙ УРОВЕНЬ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пространствен

 

 

 

 

Управление

 

 

 

 

 

 

 

 

Темпоральные

 

журналами

 

Управлениер

 

Оптимизация

 

ные

 

 

 

 

 

 

рассуждения

 

(Менеджер

 

транзакций

 

доступа

 

рассуждения

 

 

 

 

 

 

 

 

 

правил)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

УПРАВЛЕНИЕ ПАМЯТЬЮ

ФИЗИЧЕСКИЙ УРОВЕНЬ

Рис. 4.4. Общая архитектура системы управления БЗ

Логический уровень поддерживает информацию об определениях клас-

сов, включая правила и ограничения, и поддерживает примитивные операции базы знаний [48]. Его службы реализованы поверх физического уровня

(набора модулей), которые предусматривают функции управления исходны-

ми данными: трассировка пути доступа, планирование эффективной обра-

ботки запроса и параллельное выполнение протоколов, блоки рассуждений специального назначения для временных, пространственных или других ти-

144

пов обоснования (логик), а также компонент управления правилами, который поддерживает дедуктивный вывод и проверку ограничений.

Физический уровень отвечает за управление: структурами данных,

находящимися на диске, и на которых база знаний сохранена; индексами,

поддерживаемыми архитектурой; политикой кэширования, и т.д.

Функциональность нижней части этого уровня, обеспечена ядром хра-

нения баз данных, таким же, как разработанные для объектно-ориентиро-

ванных и вложенных реляционных баз данных [38,56,35].

Созданная в рамках проекта KBMS архитектура системы управления знаниями, используемые технологий и подходы к представлению и исполь-

зованию знаний нашли применения во многих приложениях ИИ, использу-

ющих БЗ [63].

При решении задач реальной сложности система управления БЗ должна иметь возможности для концептуального представления действительности,

хранения и использования высокоструктурированных знаний. Наличие в ар-

хитектуре СУБЗ проекта KBMS [63] на уровне интерфейсов модуля инстру-

ментов управления БЗ позволяет иметь блоки управления БЗ для решения различных задач. Но современные приложения являются сложными ориен-

тированными на меняющиеся задачи и методы их решения, что требует больших затрат на их актуализацию и даже перепроектирование интеллекту-

альной системы. Проектирование и перепроектирование ресурсоемким меро-

приятием из-за необходимости создания в каждом приложении своих, уни-

кальных модулей инструментов управления БЗ. Для уменьшения ресурсов на создание новых СОЗ необходимо в СУБЗ наличие готовых оболочек различ-

ных инструментов не только для управления БЗ, но и решения прикладных задач.

Для непрерывного образования в авиакосмической области необходимо решать ряд задач связанных с созданием и использованием индивидуальной среды обучения и тестирования, с актуализацией знаний об учебных объек-

тах, валидностью БЗ. Например, в летной практике имеется множество задач

145

формирования навыков и знаний, которые меняются быстро, Заготовки ре-

шений для этих задач могут составить основу СУБЗ интеллектуальных си-

стем в области непрерывного образования пилотов. Важным моментом для СУБЗ является метод представления знаний, позволяющий описывать мета-

данные об учебных объектах и обеспечивающий решение различных задач.

Основными из этих задач являются:

создание и использование индивидуальной среды обучения, тестирова-

ния,

формирование последовательности учебных, тестовых объектов,

актуализация знаний с помощью процедур обучения.

проверка валидности БЗ на основе их моделирования сетями Петри.

В каждой предметной области содержание задач и необходимых реше-

ний может несколько изменяться. Так, например, в авиакосмической области,

для решения задач непрерывного образования, СУБЗ необходимы следую-

щие решения:

интегрированный метод представления знаний,

блок для формирования и реализации планов обучения,

блок для обучения на собственном опыте и успешных решениях,

блок Моделирования БЗ сетями Петри,

блок оценки знаний обучаемых.

146

4.3. Методы и операции, используемые в СУБЗ, для решения задач непрерывного образования

Интеллектуальные обучающие системы, построенные на основе СУБЗ,

ориентированы на решение большого круга задач. Для их эффективного ре-

шения необходимо использовать определенные методы и операции, основ-

ными из которых являются:

методы машинного обучения,

прогнозирование,

планирование,

формирование и валидация баз знаний.

Методы машинного обучения. Важной особенностью систем, исполь-

зующих знания, является их способность к обучению. Эти способности дают системам возможность изменяться при взаимодействии с окружающим ми-

ром, а также в процессе приобретения опыта на основе своих внутренних со-

стояний и действий. В работе [53] обучение определяется, как «…любое из-

менение в системе, приводящее к улучшению решения задачи при ее повтор-

ном предъявлении или к решению другой задачи на основе тех же данных».

Знания о реальном мире имеют важное значение для эффективного решения различных задач и реализуется с помощью двух функций: получения инфор-

мации об организации процессов и ее систематизации (структурирования).

Многие практические подходы к структуризации данных предполагают уча-

стие эксперта, что связано с динамичностью и неполнотой данных использу-

емых для решения задач. При формировании закономерностей могут учиты-

ваться оценки сходства (полезности) рассматриваемых и существующих мо-

делей сущностей через обобщенную близость (комбинацию близостей, вы-

численных на множестве частичных описаний). В качестве основных направ-

лений решения этой задачи можно отметить [15,22,24,34]:

основанные на символьном представлении знаний, информации;

на основе взвешенных связей;

использующие принципы генетики или эволюционного моделирование;

147

интегрированный подход к обучению.

При символьном представлении действительности знания и информация

опроблемной области задаются в явном виде. Сущности и взаимосвязи между ними в области их определения представляются наборами символов. Алго-

ритмы обучения, использующие символьное представление, обеспечивают возможность корректного обобщения, которое тоже можно выразить в терми-

нах этих символов. Алгоритмы символьного обучения включают несколько важных позиций [15]. Первая позиция содержит данные и цели задачи обуче-

ния. Вторая позиция связана с представлением получаемых знаний. Третья по-

зиция включает набор операций. Четвертая позиция отражает пространство понятий. Пятая позиция связана с организацией эвристического поиска.

Цель обучения и имеющиеся данные являются одной из главных харак-

теристик обучения. Так, в рассмотренных ранее задачах индуктивного обу-

чения входные данные представлялись набором положительных/отрица-

тельных примеров целевого класса, а целью являлось формирование общего определения, позволяющего в дальнейшем распознавать ситуации (преце-

денты) данного класса.

В задачах обучения могут использоваться многие представления знаний.

При обучении классификации объектов реального мира, например, могут ис-

пользоваться выражения из теории предикатов, фреймы, объекты, деревья решений и др. Планы решения могут представляться последовательностями выполняемых действий, треугольными таблицами, а эвристики – правилами вывода.

Для достижения цели обучения необходимо уметь оперировать пред-

ставлениями. Наиболее используемыми операциями над символьными пред-

ставлениями являются обобщение и специализация.

Пространство возможных определений понятий во многом определяют-

ся языком представления и набором операций. Это пространство должно вы-

деляться обучаемой системой и его сложность во многом определяет слож-

ность задачи обучения. Для больших пространств поиска должны учитывать-

148

ся направление и порядок поиска, которые определяются на основе обучаю-

щих данных и эвристик.

В системах обучения, использующих взвешенные связи, не предпола-

гается явное использования символьного представления в задаче обучения.

Интеллектуальные свойства этих систем обеспечиваются взаимодействием простых компонентов (моделей сущностей, биологических или искусствен-

ных нейронов) и настройкой связей между ними в процессе обучения или адаптации. Данные системы являются распределенными. Информация в них обрабатывается параллельно. Например, в искусственных нейронных сетях все нейроны одного слоя одновременно и независимо друг от друга получают и преобразуют входные данные. В нейросетевых моделях символьное пред-

ставление, вместе с тем, играет важную роль в формировании входных дан-

ных и интерпретации выходных значений. В настоящее время результаты ис-

следований искусственных нейронных сетей стали основой инженерного направления по разработке и применению нейрокомпьютерных систем.

Другим примером приобретения знаний (решений новых задач), с ис-

пользованием взвешенных связей, является алгоритм муравья [8]. В основе этого алгоритма – умение муравьев находить пищу на большом расстоянии от муравейника и возвращаться обратно. Муравьи, выделяя ферменты во время перемещения, изменяют окружающую среду, обеспечивают коммуни-

кацию, а также отыскивают обратный путь к муравейнику. В ходе своей дея-

тельности муравьи находят самый оптимальный путь, между муравейником и внешними точками. Чем больше муравьев используют один и тот же путь,

тем выше концентрация фермента на этом пути. Впоследствии муравьи вы-

бирают пути с более высокой концентрацией фермента.

Алгоритм муравья может быть представлен следующим образом. Пусть внешняя среда для муравьев представляет собой двухмерную сеть, состоя-

щую из узлов (точки с пищей и муравейник) и дуг между узлами (каждая ду-

га – это возможный путь для муравья). Каждая дуга имеет вес, который ин-

терпретируется как расстояние между двумя узлами, соединенными данной

149

дугой. Граф двунаправленный, поэтому муравей может перемещаться по ду-

ге в любом направлении.

Программный муравей – агент является является частью большой си-

стемы (колонии муравьев) и используется для решения каких-либо проблем.

Он руководствуется набором простых правил, при выборе пути в графе. Му-

равей поддерживает список узлов которые он уже посетил, поэтому он дол-

жен проходить через каждый узел только один раз. Узлы в списке «текущего путешествия» располагаются в том порядке, в котором они посещались. С

помощью этого списка определяется расстояние между узлами. В алгоритме муравья агент оставляет фермент на дугах сети после завершения путеше-

ствия (настоящий муравей это делает во время перемещения).

Для решения задачи по алгоритму муравья создается популяция муравь-

ев (агентов), которые равномерно распределяются между узлами, чтобы все узлы имели одинаковые шансы стать отпраной точкой. В ходе движения му-

равья ему приходится определять дуги, покоторым он еще не проходил.

Пройденный путь муравья отображается, когда он посетит все узлы сети, и

подсчитывается длина пути. Для каждой пройденной дуги определяется ко-

личество фермента, оставленного на ней (количество фермента на все путе-

шествие для каждого муравья есть константа, которая обновляется по завер-

шению путешествия). Это позволяет оценивать пройденный путь – короткий путь характеризуется высокой концентрацией фермента, а длинный путь – более низкой. После этого увеличивается количество фермента вдоль прой-

денного муравьем пути. Кроме того вводится процедура испарения фермен-

та, для постепенного удаления дуг, которые входят в худшие пути в сети.

После того как закончился обход всех узлов сети, для всех дуг опреде-

лено количество фермента и выполнена процедура испарения фермента на всех гранях, алгоритм запускается повторно. Список узлов, которые посетил муравей очищается, а длина пути обнуляется. Муравьи-агенты перемещают-

ся по сети выбирают грани с более высокой концентрацией фермента. В ито-

ге будет сформирован лучший путь.

150

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]