- •Проектирование онтологий в среде Protégé
- •Курск 2007
- •Введение
- •1. Теоретические аспекты построения онтологий
- •1. 1. Определение онтологии
- •1. 2. Модели онтологии и онтологической системы
- •1. 3. Применение онтологий
- •1. 4. Инструменты инженерии онтологий
- •2. Создание онтологии предметной области в Protégé
- •2. 1. Предварительные замечания
- •2. 2. Основные сведения о Protégé
- •2. 3. Создание онтологии предметной области в Protégé
- •3. Методические указания по выполнению лабораторной работы.
- •3. 1. Порядок выполнения проекта:
- •3. 2. Содержание отчета о проделанной работе
- •Литература
1. 3. Применение онтологий
Суммируя различные типизации онтологии можно выделить классификации по:
-
степени зависимости от конкретной задачи или предметной области;
-
уровню детализации аксиоматизации;
-
«природе» предметной области и т. д.
Дополнительно к этим измерениям можно ввести и классификации, связанные с разработкой, реализацией и сопровождением онтологии.
По степени зависимости от конкретной задачи или предметной области обычно различают:
-
онтологии верхнего уровня;
-
онтологии, ориентированные на предметную область;
-
онтологии, ориентированные на конкретную задачу;
-
прикладные онтологии.
Онтологии верхнего уровня описывают очень общие концепты, такие как пространство, время, материя, объект, событие, действие и т. д., которые независимы от конкретной проблемы или области. Поэтому представляется разумным, по крайней мере в теории, унифицировать их для больших сообществ пользователей.
Примером такой общей онтологиии является CYC®. Одноименный проект — CYC® — ориентирован на создание мультиконтекстной базы знаний и специальной машины вывода, разрабатываемой Сусогр. Основная цель этого гигантского проекта — построить базу знаний всех общих понятий (начиная с таких, как время, сущность и т. д.), включающую семантическую структуру терминов, связей между ними и аксиом. Предполагается, что такая база знаний может быть доступна разнообразным программным средствам, работающим со знаниями, и будет играть роль базы «начальных знаний». В онтологии, по некоторым данным, уже представлены 106 концептов и 105 аксиом. Для представления знаний в рамках этого проекта разработан специальный язык CYCL.
Другим примером онтологии верхнего уровня является онтология системы Gene-railized Upper Model, ориентированная на поддержку процессов обработки естественного языка: английского, немецкого и итальянского. Уровень абстракции этой онтологии находится между лексическими и концептуальными знаниями, что определяется требованиями упрощения интерфейсов с лингвистическими ресурсами. Модель Generalized Upper Model включает таксономию, организованную в виде иерархии концептов (около 250 понятий) и отдельной иерархии связей.
Создание достаточно общих онтологии верхнего уровня представляет собой очень серьезную задачу, которая еще не имеет удовлетворительного решения.
Предметные онтологии и онтологии задач описывают, соответственно, словарь, связанный с предметной областью (медицина, коммерция и т. д.) или с конкретной задачей или деятельностью (диагностика, продажи и т. п.) за счет специализации терминов, введенных в онтологии верхнего уровня. Примерами онтологии, ориентированных на определенную предметную область и конкретную задачу, являются TOVE и Plinius соответственно.
Онтология в системе TOVE (Toronto Virtual Enterprise Project) предметно ориентирована на представление модели корпорации. Основная цель ее разработки — отвечать на вопросы пользователей по реинжинирингу бизнес-процессов, извлекая эксплицитно представленные в онтологии знания. При этом система может проводить дедуктивный вывод ответов. В онтологии нет средств для интеграции с другими онтологиями. Формально онтология описывается с помощью фреймов.
В настоящее время построены онтологии некоторых разделов молекулярной биологии, которые предлагают терминологию для определения множества химических элементов, описания процессов внутри клетки. Онтология TAMBIS (TaO) описывает биоинформатику, покрывает основные понятия молекулярной биологии и биоинформатики: макромолекулы, их предназначение, структуру, функции, клеточное расположение и процессы, в которых они взаимодействуют. ТаО онтологии построена с использованием языка OIL.
Существует также экспериментальная онтология для бионеорганических центров, известная под именем СОМЕ. СОМЕ состоит из сущностей трех видов: Молекула (MOL), Бионеорганический Мотив (BIM) и Бионеорганические Протеины (PRX).
Так же построены онтологии, представляющие понятия и отношения в более узко направленных областях – таких как химические кристаллы, керамические материалы, биоэнергетические центры. Примером таких онтологий может служить онтология Chemical-Crystals. Онтология Chemical-Crystals описывает различные типы кристаллической структуры веществ. Эта онтология построена с использованием методологии, известной как METHONTOLOG.
Другой пример онтологии – онтология чистых веществ. Определение чистых веществ дано через химический состав, т.е. через структурные правила, которые определяют чистые вещества в терминах химических веществ и натуральных чисел. Разработана иерархическая модель онтологии физической химии. Модульная онтология физической химии определяет множество разделов предметной области и связи между ними, описывает систему понятий каждого раздела и задает связи между понятиями разделов. Онтология физической химии состоит из восьми связанных друг с другом разделов: «Элементы», «Вещества», «Реакции», «Основы термодинамики», «Термодинамика. Химические свойства», «Термодинамика. Физические свойства», «Термодинамика. Связь физических и химических свойств», «Химическая кинетика». В основе онтологии данной предметной области лежит метаонтология, которая определяет метапонятия, используемые при определении систем понятий каждого раздела.
Прикладные онтологии описывают концепты, зависящие как от конкретной предметной области, так и от задач, которые в них решаются. Концепты в таких онтологиях часто соответствуют ролям, которые играют объекты в предметной области в процессе, выполнения определенной деятельности. Пример такой онтологии — онтология системы Plinius, предназначенная для полуавтоматического извлечения знаний из текстов в области химии. В отличие от других, упомянутых выше онтологии, здесь нет явной таксономии понятий.
Вместо этого определено несколько множеств атомарных концептов, таких как, например, химический элемент, целое число и т. п., и правила конструирования остальных концептов. В онтологии описано около 150 концептов и 6 правил. Формально онтология Plinius тоже описывается с помощью фреймов.