
978-5-7764-0767-3
.pdf
Пользователь |
Инженер по |
Эксперт |
|
знаниям |
|||
|
|||
|
|
Интерфейс СОЗ
Рабочая |
|
Механизм |
|
Подсистема |
|
Редактор Базы |
|
логического |
|
|
|||
память |
|
|
объяснения |
|
Знаний |
|
|
вывода |
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
БАЗА ЗНАНИЙ
Рис. 4.3. Структура системы, основанной на знаниях
Основой СОЗ является база знаний (БЗ) из предметной области, в кото-
рой решаются задачи. Для работы с БЗ необходимо управление процессами решения прикладных задач, которое осуществляется самой прикладной про-
граммой, что делает трудоемким разработку новых ИИС. Снижение затрат на разработку новых СОЗ возможно, если использовать готовые решения в спе-
циально выделяемых в СОЗ системах управления базами знаний (СУБЗ).
141
4.2. Структура системы управления базами эволюционирующих знаний
Совершенствование технологий по созданию и использованию прило-
жений в таких областях как CAD-системы, разработка программного обеспе-
чения, управление процессами в реальном времени, базы данных и электрон-
ные библиотеки требуют структурированности, эффективного доступа и управления большими базами знаний. Такие базы знаний не могли быть со-
зданы при использовании существовавших инструментов (языков програм-
мирования высокого уровня, оболочек экспертных систем) потому, что они не расширяются. Базы знаний не могли создаваться и использоваться с точки зрения существовавшей технологии баз данных, так как ее не поддерживает-
ся богатая выразительная структура и механизмы вывода, требуемые для си-
стем, основанных на знаниях. Кроме того, имеющиеся механизмы оптимиза-
ции не ориентированы на использование богатой структуры и семантических свойств баз знаний.
Для решения рассмотренных проблем, в конце прошлого столетия, с 1985 по 1995 годы, в университете Торонто (Канада), разрабатывался проект
KBMS (Knowledge Base Management System) [49,63]. Основной целью этого проекта было создание универсальной архитектуры системы управления ба-
зой знаний, предназначенной для развивающихся компьютерных приложе-
ний.
К настоящему времени нет общепризнанных определений понятиям
«база данных» и «база знаний». Автор принимает точку зрения, изложенную в работе [49], где отмечается, что технических различий между терминами
«База знаний» и «База данных» нет, в связи с тем, что многофункциональные
(расширенные) системы управления базами данных, такие как управление объектно-ориентированными, активными и дедуктивными базами данных,
поддерживают некоторый дедуктивный и не дедуктивный механизмы выво-
дов и средства структурирования, аналогичные с базами знаний. Разница в значении этих двух терминов, если она имеется, в основном в том, в какой
142
степени системы поддерживают представление, структурирование и возмож-
ность вывода.
В основу разработанной СУБЗ положена расширяемая, многоуровневая архитектура. Расширяемая архитектура позволяет СУБЗ работать как с меха-
низмами вывода общего назначения, так и со специальными механизмами вывода. Специальные механизмы вывода, например, механизм простран-
ственного мышления или механизм на основе доказательной аргументации,
встраиваются в зависимости от потребностей специальных приложений, в то время как механизмы вывода общего назначения являются одинаковыми для всех приложений. Многоуровневая архитектура поддерживает проектирова-
ние кода, основанное на повышении уровня абстракции, что позволяет раз-
бивать общую задачу проектирования СУБЗ на несколько подзадач. В такой архитектуре использован стандартный интерфейс для каждого уровня и его компонентов, что позволяет многократно их использовать в различных СУБЗ. Разработанная архитектура системы управления базой знаний (рис. 4.4), включает три уровня:
уровень интерфейсов, который предлагает различные виды пользова-
тельских интерфейсов;
логический уровень, который выполняет примитивные операции по из-
влечению знаний и обновлению базы знаний;
физический уровень, который управляет структурами данных для хра-
нения баз знаний, различных показателей и другой вспомогательной инфор-
мации.
Уровень интерфейсов предлагает множество пользовательских служб баз знаний, включая гипертекстовый интерфейс для оперативного взаимо-
действия с пользователем и интерфейс языков программирования (PL), кото-
рый поддерживает выполнение прикладных программ, включающих опера-
ции базы знаний. Кроме того, уровень интерфейсов может включать инстру-
менты системы управления базой знаний для сбора знаний, проверки базы знаний, проверки ограничений, развития и обмена знаниями [54,37]. Службы
143

уровня интерфейсов соединяются с логическим уровнем через интерпретатор языка представления знаний, управление сеансами и компилятор.
Гипертекстовый |
|
Интерфейс языков |
|
Инструменты |
|||
|
|
управления базой |
|||||
интерфейс |
|
программирования |
|
||||
|
|
знаний |
|||||
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Управление Интерпретатор Компилятор
сессиями
|
Менеджер |
|
|
объектов |
|
Диспетчер |
|
БЗ операций |
схемы |
|
процессов |
|
|
|
УРОВЕНЬ ИНТЕРФЕЙСОВ
ЛОГИЧЕСКИЙ УРОВЕНЬ
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Пространствен |
|
|
|
|
Управление |
|
|
|
|
|
|
|
|||
|
Темпоральные |
|
журналами |
|
Управлениер |
|
Оптимизация |
||||||||
|
ные |
|
|
|
|
||||||||||
|
|
рассуждения |
|
(Менеджер |
|
транзакций |
|
доступа |
|||||||
|
рассуждения |
|
|
|
|
||||||||||
|
|
|
|
|
правил) |
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
УПРАВЛЕНИЕ ПАМЯТЬЮ
ФИЗИЧЕСКИЙ УРОВЕНЬ
Рис. 4.4. Общая архитектура системы управления БЗ
Логический уровень поддерживает информацию об определениях клас-
сов, включая правила и ограничения, и поддерживает примитивные операции базы знаний [48]. Его службы реализованы поверх физического уровня
(набора модулей), которые предусматривают функции управления исходны-
ми данными: трассировка пути доступа, планирование эффективной обра-
ботки запроса и параллельное выполнение протоколов, блоки рассуждений специального назначения для временных, пространственных или других ти-
144
пов обоснования (логик), а также компонент управления правилами, который поддерживает дедуктивный вывод и проверку ограничений.
Физический уровень отвечает за управление: структурами данных,
находящимися на диске, и на которых база знаний сохранена; индексами,
поддерживаемыми архитектурой; политикой кэширования, и т.д.
Функциональность нижней части этого уровня, обеспечена ядром хра-
нения баз данных, таким же, как разработанные для объектно-ориентиро-
ванных и вложенных реляционных баз данных [38,56,35].
Созданная в рамках проекта KBMS архитектура системы управления знаниями, используемые технологий и подходы к представлению и исполь-
зованию знаний нашли применения во многих приложениях ИИ, использу-
ющих БЗ [63].
При решении задач реальной сложности система управления БЗ должна иметь возможности для концептуального представления действительности,
хранения и использования высокоструктурированных знаний. Наличие в ар-
хитектуре СУБЗ проекта KBMS [63] на уровне интерфейсов модуля инстру-
ментов управления БЗ позволяет иметь блоки управления БЗ для решения различных задач. Но современные приложения являются сложными ориен-
тированными на меняющиеся задачи и методы их решения, что требует больших затрат на их актуализацию и даже перепроектирование интеллекту-
альной системы. Проектирование и перепроектирование ресурсоемким меро-
приятием из-за необходимости создания в каждом приложении своих, уни-
кальных модулей инструментов управления БЗ. Для уменьшения ресурсов на создание новых СОЗ необходимо в СУБЗ наличие готовых оболочек различ-
ных инструментов не только для управления БЗ, но и решения прикладных задач.
Для непрерывного образования в авиакосмической области необходимо решать ряд задач связанных с созданием и использованием индивидуальной среды обучения и тестирования, с актуализацией знаний об учебных объек-
тах, валидностью БЗ. Например, в летной практике имеется множество задач
145
формирования навыков и знаний, которые меняются быстро, Заготовки ре-
шений для этих задач могут составить основу СУБЗ интеллектуальных си-
стем в области непрерывного образования пилотов. Важным моментом для СУБЗ является метод представления знаний, позволяющий описывать мета-
данные об учебных объектах и обеспечивающий решение различных задач.
Основными из этих задач являются:
создание и использование индивидуальной среды обучения, тестирова-
ния,
формирование последовательности учебных, тестовых объектов,
актуализация знаний с помощью процедур обучения.
проверка валидности БЗ на основе их моделирования сетями Петри.
В каждой предметной области содержание задач и необходимых реше-
ний может несколько изменяться. Так, например, в авиакосмической области,
для решения задач непрерывного образования, СУБЗ необходимы следую-
щие решения:
интегрированный метод представления знаний,
блок для формирования и реализации планов обучения,
блок для обучения на собственном опыте и успешных решениях,
блок Моделирования БЗ сетями Петри,
блок оценки знаний обучаемых.
146
4.3. Методы и операции, используемые в СУБЗ, для решения задач непрерывного образования
Интеллектуальные обучающие системы, построенные на основе СУБЗ,
ориентированы на решение большого круга задач. Для их эффективного ре-
шения необходимо использовать определенные методы и операции, основ-
ными из которых являются:
методы машинного обучения,
прогнозирование,
планирование,
формирование и валидация баз знаний.
Методы машинного обучения. Важной особенностью систем, исполь-
зующих знания, является их способность к обучению. Эти способности дают системам возможность изменяться при взаимодействии с окружающим ми-
ром, а также в процессе приобретения опыта на основе своих внутренних со-
стояний и действий. В работе [53] обучение определяется, как «…любое из-
менение в системе, приводящее к улучшению решения задачи при ее повтор-
ном предъявлении или к решению другой задачи на основе тех же данных».
Знания о реальном мире имеют важное значение для эффективного решения различных задач и реализуется с помощью двух функций: получения инфор-
мации об организации процессов и ее систематизации (структурирования).
Многие практические подходы к структуризации данных предполагают уча-
стие эксперта, что связано с динамичностью и неполнотой данных использу-
емых для решения задач. При формировании закономерностей могут учиты-
ваться оценки сходства (полезности) рассматриваемых и существующих мо-
делей сущностей через обобщенную близость (комбинацию близостей, вы-
численных на множестве частичных описаний). В качестве основных направ-
лений решения этой задачи можно отметить [15,22,24,34]:
основанные на символьном представлении знаний, информации;
на основе взвешенных связей;
использующие принципы генетики или эволюционного моделирование;
147
интегрированный подход к обучению.
При символьном представлении действительности знания и информация
опроблемной области задаются в явном виде. Сущности и взаимосвязи между ними в области их определения представляются наборами символов. Алго-
ритмы обучения, использующие символьное представление, обеспечивают возможность корректного обобщения, которое тоже можно выразить в терми-
нах этих символов. Алгоритмы символьного обучения включают несколько важных позиций [15]. Первая позиция содержит данные и цели задачи обуче-
ния. Вторая позиция связана с представлением получаемых знаний. Третья по-
зиция включает набор операций. Четвертая позиция отражает пространство понятий. Пятая позиция связана с организацией эвристического поиска.
Цель обучения и имеющиеся данные являются одной из главных харак-
теристик обучения. Так, в рассмотренных ранее задачах индуктивного обу-
чения входные данные представлялись набором положительных/отрица-
тельных примеров целевого класса, а целью являлось формирование общего определения, позволяющего в дальнейшем распознавать ситуации (преце-
денты) данного класса.
В задачах обучения могут использоваться многие представления знаний.
При обучении классификации объектов реального мира, например, могут ис-
пользоваться выражения из теории предикатов, фреймы, объекты, деревья решений и др. Планы решения могут представляться последовательностями выполняемых действий, треугольными таблицами, а эвристики – правилами вывода.
Для достижения цели обучения необходимо уметь оперировать пред-
ставлениями. Наиболее используемыми операциями над символьными пред-
ставлениями являются обобщение и специализация.
Пространство возможных определений понятий во многом определяют-
ся языком представления и набором операций. Это пространство должно вы-
деляться обучаемой системой и его сложность во многом определяет слож-
ность задачи обучения. Для больших пространств поиска должны учитывать-
148
ся направление и порядок поиска, которые определяются на основе обучаю-
щих данных и эвристик.
В системах обучения, использующих взвешенные связи, не предпола-
гается явное использования символьного представления в задаче обучения.
Интеллектуальные свойства этих систем обеспечиваются взаимодействием простых компонентов (моделей сущностей, биологических или искусствен-
ных нейронов) и настройкой связей между ними в процессе обучения или адаптации. Данные системы являются распределенными. Информация в них обрабатывается параллельно. Например, в искусственных нейронных сетях все нейроны одного слоя одновременно и независимо друг от друга получают и преобразуют входные данные. В нейросетевых моделях символьное пред-
ставление, вместе с тем, играет важную роль в формировании входных дан-
ных и интерпретации выходных значений. В настоящее время результаты ис-
следований искусственных нейронных сетей стали основой инженерного направления по разработке и применению нейрокомпьютерных систем.
Другим примером приобретения знаний (решений новых задач), с ис-
пользованием взвешенных связей, является алгоритм муравья [8]. В основе этого алгоритма – умение муравьев находить пищу на большом расстоянии от муравейника и возвращаться обратно. Муравьи, выделяя ферменты во время перемещения, изменяют окружающую среду, обеспечивают коммуни-
кацию, а также отыскивают обратный путь к муравейнику. В ходе своей дея-
тельности муравьи находят самый оптимальный путь, между муравейником и внешними точками. Чем больше муравьев используют один и тот же путь,
тем выше концентрация фермента на этом пути. Впоследствии муравьи вы-
бирают пути с более высокой концентрацией фермента.
Алгоритм муравья может быть представлен следующим образом. Пусть внешняя среда для муравьев представляет собой двухмерную сеть, состоя-
щую из узлов (точки с пищей и муравейник) и дуг между узлами (каждая ду-
га – это возможный путь для муравья). Каждая дуга имеет вес, который ин-
терпретируется как расстояние между двумя узлами, соединенными данной
149
дугой. Граф двунаправленный, поэтому муравей может перемещаться по ду-
ге в любом направлении.
Программный муравей – агент является является частью большой си-
стемы (колонии муравьев) и используется для решения каких-либо проблем.
Он руководствуется набором простых правил, при выборе пути в графе. Му-
равей поддерживает список узлов которые он уже посетил, поэтому он дол-
жен проходить через каждый узел только один раз. Узлы в списке «текущего путешествия» располагаются в том порядке, в котором они посещались. С
помощью этого списка определяется расстояние между узлами. В алгоритме муравья агент оставляет фермент на дугах сети после завершения путеше-
ствия (настоящий муравей это делает во время перемещения).
Для решения задачи по алгоритму муравья создается популяция муравь-
ев (агентов), которые равномерно распределяются между узлами, чтобы все узлы имели одинаковые шансы стать отпраной точкой. В ходе движения му-
равья ему приходится определять дуги, покоторым он еще не проходил.
Пройденный путь муравья отображается, когда он посетит все узлы сети, и
подсчитывается длина пути. Для каждой пройденной дуги определяется ко-
личество фермента, оставленного на ней (количество фермента на все путе-
шествие для каждого муравья есть константа, которая обновляется по завер-
шению путешествия). Это позволяет оценивать пройденный путь – короткий путь характеризуется высокой концентрацией фермента, а длинный путь – более низкой. После этого увеличивается количество фермента вдоль прой-
денного муравьем пути. Кроме того вводится процедура испарения фермен-
та, для постепенного удаления дуг, которые входят в худшие пути в сети.
После того как закончился обход всех узлов сети, для всех дуг опреде-
лено количество фермента и выполнена процедура испарения фермента на всех гранях, алгоритм запускается повторно. Список узлов, которые посетил муравей очищается, а длина пути обнуляется. Муравьи-агенты перемещают-
ся по сети выбирают грани с более высокой концентрацией фермента. В ито-
ге будет сформирован лучший путь.
150