- •Проектирование онтологий в среде Protégé
- •Курск 2007
- •Введение
- •1. Теоретические аспекты построения онтологий
- •1. 1. Определение онтологии
- •1. 2. Модели онтологии и онтологической системы
- •1. 3. Применение онтологий
- •1. 4. Инструменты инженерии онтологий
- •2. Создание онтологии предметной области в Protégé
- •2. 1. Предварительные замечания
- •2. 2. Основные сведения о Protégé
- •2. 3. Создание онтологии предметной области в Protégé
- •3. Методические указания по выполнению лабораторной работы.
- •3. 1. Порядок выполнения проекта:
- •3. 2. Содержание отчета о проделанной работе
- •Литература
1. 2. Модели онтологии и онтологической системы
Понятие онтологии предполагает определение и использование взаимосвязанной и взаимосогласованной совокупности трех компонент: таксономии терминов, определений терминов и правил их обработки. Введем следующее определение понятия модели онтологии:
Под формальной моделью онтологии О понимается
где
Х – конечное множество концептов (понятий, терминов) предметной области, которую представляет онтология О;
R – конечное множество отношений между концептами (понятиями, терминами) заданной предметной области;
F – конечное множество функций интерпретации (аксиоматизации), заданных на концептах и/или отношениях онтологии О.
Естественным ограничением, накладываемым на множество X, является его конечность и непустота. Иначе обстоит дело с компонентами F и R в определении онтологии О. Понятно, что и в этом случае F и R должны быть конечными множествами. Укажем, граничные случаи, связанные с их пустотой.
1. Пусть и . Тогда онтология О трансформируется в простой словарь:
.
Такая вырожденная онтология может быть полезна для спецификации, пополнения и поддержки словарей ПО, но онтологии-словари имеют ограниченное использование, поскольку не вводят эксплицитно смысла терминов. Хотя в некоторых случаях, когда используемые термины принадлежат очень узкому (например, техническому) словарю и их смыслы уже заранее хорошо согласованы в пределах определенного (например, научного) сообщества, такие онтологии применяются на практике. Известными примерами онтологии этого типа являются индексы машин поиска информации в сети Интернет.
2. , . Тогда каждому элементу множества терминов из X может быть поставлена в соответствие функция интерпретации f из F. Формально это утверждение может быть записано следующим образом.
причем
где — множество интерпретируемых терминов;
— множество интерпретирующих терминов.
Тогда
такие что
где
Пустота пересечения множеств и исключает циклические интерпретации, а введение в рассмотрение функции k аргументов призвано обеспечить более полную интерпретацию. Вид отображения f из F определяет выразительную мощность и практическую полезность этого вида онтологии. Если функция интерпретации задается оператором присваивания значений (), где — имя интерпретации ), то онтология трансформируется в пассивный словарь :
Такой словарь пассивен, так как все определения терминов из берутся из уже существующего и фиксированного множества . Практическая ценность его выше, чем простого словаря, но явно недостаточна, например, для представления знаний в задачах обработки информации в Интернете в силу динамического характера этой среды.
Для того чтобы учесть последнее обстоятельство, предположим, что часть интерпретирующих терминов из множества задается процедурно, а не декларативно и вычисляется каждый раз при интерпретации термина из множества . В этом случае онтология преобразуется в активный словарь определений
причем
Ценность такого словаря для задач обработки информации в среде Интернет выше, чем у предыдущей модели, но все еще недостаточна, так как интерпретируемые элементы из никак не связаны между собой и, следовательно, играют лишь роль ключей входа в онтологию.
Для представления модели онтологии, которая нужна для решения задач обработки информации в Интернете .
Рассмотрим возможные варианты формирования множества отношений на концептах онтологии.
Введем в рассмотрение специальный подкласс онтологии — простую таксономию следующим образом:
Таксономическая структура - иерархическая система понятий, связанных между собой отношением is_a («быть элементом класса»).
Отношение is_a имеет фиксированную заранее семантику и позволяет организовывать структуру понятий онтологии в виде дерева.
Классификация моделей онтологии
Компоненты модели |
. |
|
|
|
Формальное определение |
|
|
|
|
Пояснение |
Словарь ПО |
Пассивный словарь ПО |
Активный словарь ПО |
Таксономия понятий ПО |
Далее можно обобщить частные случаи модели онтологии таким образом, чтобы обеспечить возможность:
- представления множества концептов X в виде сетевой структуры;
- использования достаточно богатого множества отношений R, включающего не только таксономические отношения, но и отношения, отражающие специфику конкретной предметной области, а также средства расширения множества R;
- использования декларативных и процедурных интерпретаций и отношений, включая возможность определения новых интерпретаций.
Введем в рассмотрение понятие онтологической системы. Под формальной моделью онтологической системы понимают триплет вида:
где - онтология верхнего уровня (метаонтология)
- множество предметных онтологии и онтологии задач предметной области
- модель машины вывода, ассоциированной с онтологической системой .
Использование системы онтологии и специальной машины вывода позволяет решать в такой модели различные задачи. Расширяя систему моделей , можно учитывать предпочтения пользователя, а изменяя модель машины вывода, вводить специализированные критерии релевантности получаемой в процессе поиска информации и формировать специальные репозитории накопленных данных, а также пополнять при необходимости используемые онтологии.
В модели имеются три онтологические компоненты:
-
метаонтология;
-
предметная онтология;
-
онтология задач.
Метаонтология оперирует общими концептами и отношениями, которые не зависят от конкретной предметной области. Концептами метауровня являются общие понятия, такие как «объект», «свойство», «значение» и т. д. Уровни метаонтологии получают интенсиональное описание свойств предметной онтологии и онтологии задач. Онтология метауровня является статической, что дает возможность обеспечить здесь эффективный вывод.
Предметная онтология содержит понятия, описывающие конкретную предметную область, отношения, семантически значимые для данной предметной области, и множество интерпретаций этих понятий и отношений (декларативных и процедурных). Понятия предметной области специфичны в каждой прикладной онтологии, но отношения — более универсальны. Поэтому в качестве базиса обычно выделяют такие отношения модели предметной онтологии, как part_of, kind_of, contained_in, member_of, see also и некоторые другие.
Отношение part_of определено на множестве концептов, является отношением принадлежности и показывает, что концепт может быть частью других концептов. Оно является отношением типа «часть-целое» и по свойствам близко к отношению is_a и может быть задано соответствующими аксиомами. Аналогичным образом можно ввести и другие отношения типа «часть-целое».
Иначе обстоит дело с отношением see_also. Оно обладает другой семантикой и другими свойствами. Поэтому целесообразно вводить его не декларативно, а процедурно, подобно тому, как это делается при определении новых типов в языках программирования, где поддерживаются абстрактные типы данных.
Онтология задач в качестве понятий содержит типы решаемых задач, а отношения этой онтологии, как правило, специфицируют декомпозицию задач на подзадачи. Вместе с тем, если прикладной системой решается единственный тип задач (например, задачи поиска релевантной запросу информации), то онтология задач может в данном случае описываться словарной. Таким образом, модель онтологической системы позволяет описывать необходимые для ее функционирования онтологии разных уровней. Взаимосвязь между онтологиями показана на рисунке:
Машина вывода онтологической системы в общем случае может опираться на сетевое представление онтологии всех уровней. При этом ее функционирование будет связано:
-
с активацией понятий и/или отношений, фиксирующих решаемую задачу (описание исходной ситуации);
-
определением целевого состояния (ситуации);
-
выводом на сети, заключающемся в том, что от узлов исходной ситуации распространяются волны активации, использующие свойства отношений, с ними связанных. Критерием остановки процесса является достижение целевой ситуации или превышение длительности исполнения (time-out).