
- •Проектирование онтологий в среде Protégé
- •Курск 2007
- •Введение
- •1. Теоретические аспекты построения онтологий
- •1. 1. Определение онтологии
- •1. 2. Модели онтологии и онтологической системы
- •1. 3. Применение онтологий
- •1. 4. Инструменты инженерии онтологий
- •2. Создание онтологии предметной области в Protégé
- •2. 1. Предварительные замечания
- •2. 2. Основные сведения о Protégé
- •2. 3. Создание онтологии предметной области в Protégé
- •3. Методические указания по выполнению лабораторной работы.
- •3. 1. Порядок выполнения проекта:
- •3. 2. Содержание отчета о проделанной работе
- •Литература
1. 2. Модели онтологии и онтологической системы
Понятие онтологии предполагает определение и использование взаимосвязанной и взаимосогласованной совокупности трех компонент: таксономии терминов, определений терминов и правил их обработки. Введем следующее определение понятия модели онтологии:
Под формальной моделью онтологии О понимается
где
Х – конечное множество концептов (понятий, терминов) предметной области, которую представляет онтология О;
R – конечное множество отношений между концептами (понятиями, терминами) заданной предметной области;
F – конечное множество функций интерпретации (аксиоматизации), заданных на концептах и/или отношениях онтологии О.
Естественным ограничением, накладываемым на множество X, является его конечность и непустота. Иначе обстоит дело с компонентами F и R в определении онтологии О. Понятно, что и в этом случае F и R должны быть конечными множествами. Укажем, граничные случаи, связанные с их пустотой.
1.
Пусть
и
.
Тогда онтология О трансформируется в
простой словарь:
.
Такая вырожденная онтология может быть полезна для спецификации, пополнения и поддержки словарей ПО, но онтологии-словари имеют ограниченное использование, поскольку не вводят эксплицитно смысла терминов. Хотя в некоторых случаях, когда используемые термины принадлежат очень узкому (например, техническому) словарю и их смыслы уже заранее хорошо согласованы в пределах определенного (например, научного) сообщества, такие онтологии применяются на практике. Известными примерами онтологии этого типа являются индексы машин поиска информации в сети Интернет.
2.
,
.
Тогда каждому элементу множества
терминов из X
может быть поставлена в соответствие
функция интерпретации f
из F.
Формально это утверждение может быть
записано следующим образом.
причем
где
—
множество интерпретируемых терминов;
—
множество
интерпретирующих терминов.
Тогда
такие что
где
Пустота
пересечения множеств
и
исключает циклические интерпретации,
а введение в рассмотрение функции k
аргументов призвано обеспечить более
полную интерпретацию. Вид отображения
f
из F
определяет выразительную мощность и
практическую полезность этого вида
онтологии. Если функция интерпретации
задается оператором присваивания
значений (
),
где
— имя интерпретации
),
то онтология трансформируется в пассивный
словарь
:
Такой
словарь пассивен, так как все определения
терминов из
берутся
из уже существующего и фиксированного
множества
.
Практическая ценность его выше, чем
простого словаря, но явно недостаточна,
например, для представления знаний в
задачах обработки информации в Интернете
в силу динамического характера этой
среды.
Для
того чтобы учесть последнее обстоятельство,
предположим, что часть интерпретирующих
терминов из множества
задается процедурно, а не декларативно
и вычисляется каждый раз при интерпретации
термина из множества
.
В этом случае онтология преобразуется
в активный словарь определений
причем
Ценность
такого словаря для задач обработки
информации в среде Интернет выше, чем
у предыдущей модели, но все еще
недостаточна, так как интерпретируемые
элементы из
никак
не связаны между собой и, следовательно,
играют лишь роль ключей входа в онтологию.
Для
представления модели онтологии, которая
нужна для решения задач обработки
информации в Интернете
.
Рассмотрим возможные варианты формирования множества отношений на концептах онтологии.
Введем в рассмотрение специальный подкласс онтологии — простую таксономию следующим образом:
Таксономическая структура - иерархическая система понятий, связанных между собой отношением is_a («быть элементом класса»).
Отношение is_a имеет фиксированную заранее семантику и позволяет организовывать структуру понятий онтологии в виде дерева.
Классификация моделей онтологии
Компоненты модели |
|
|
|
|
Формальное определение |
|
|
|
|
Пояснение |
Словарь ПО |
Пассивный словарь ПО |
Активный словарь ПО |
Таксономия понятий ПО |
Далее можно обобщить частные случаи модели онтологии таким образом, чтобы обеспечить возможность:
- представления множества концептов X в виде сетевой структуры;
- использования достаточно богатого множества отношений R, включающего не только таксономические отношения, но и отношения, отражающие специфику конкретной предметной области, а также средства расширения множества R;
- использования декларативных и процедурных интерпретаций и отношений, включая возможность определения новых интерпретаций.
Введем
в рассмотрение понятие онтологической
системы. Под формальной моделью
онтологической системы
понимают триплет вида:
где
- онтология
верхнего уровня (метаонтология)
-
множество предметных онтологии и
онтологии задач предметной области
-
модель машины вывода, ассоциированной
с онтологической системой
.
Использование
системы онтологии и специальной машины
вывода позволяет решать в такой модели
различные задачи. Расширяя систему
моделей
,
можно учитывать предпочтения пользователя,
а изменяя модель машины вывода, вводить
специализированные критерии релевантности
получаемой в процессе поиска информации
и формировать специальные репозитории
накопленных данных, а также пополнять
при необходимости используемые онтологии.
В
модели
имеются три онтологические компоненты:
-
метаонтология;
-
предметная онтология;
-
онтология задач.
Метаонтология оперирует общими концептами и отношениями, которые не зависят от конкретной предметной области. Концептами метауровня являются общие понятия, такие как «объект», «свойство», «значение» и т. д. Уровни метаонтологии получают интенсиональное описание свойств предметной онтологии и онтологии задач. Онтология метауровня является статической, что дает возможность обеспечить здесь эффективный вывод.
Предметная
онтология
содержит понятия, описывающие конкретную
предметную область, отношения, семантически
значимые для данной предметной области,
и множество интерпретаций этих понятий
и отношений (декларативных и процедурных).
Понятия предметной области специфичны
в каждой прикладной онтологии, но
отношения — более универсальны. Поэтому
в качестве базиса обычно выделяют такие
отношения модели предметной онтологии,
как part_of,
kind_of,
contained_in,
member_of,
see
also
и
некоторые другие.
Отношение part_of определено на множестве концептов, является отношением принадлежности и показывает, что концепт может быть частью других концептов. Оно является отношением типа «часть-целое» и по свойствам близко к отношению is_a и может быть задано соответствующими аксиомами. Аналогичным образом можно ввести и другие отношения типа «часть-целое».
Иначе обстоит дело с отношением see_also. Оно обладает другой семантикой и другими свойствами. Поэтому целесообразно вводить его не декларативно, а процедурно, подобно тому, как это делается при определении новых типов в языках программирования, где поддерживаются абстрактные типы данных.
Онтология
задач в качестве понятий содержит типы
решаемых задач, а отношения этой
онтологии, как правило, специфицируют
декомпозицию задач на подзадачи. Вместе
с тем, если прикладной системой решается
единственный тип задач (например, задачи
поиска релевантной запросу информации),
то онтология задач может в данном случае
описываться словарной. Таким образом,
модель онтологической системы позволяет
описывать необходимые для ее
функционирования онтологии разных
уровней. Взаимосвязь между онтологиями
показана на рисунке:
Машина вывода онтологической системы в общем случае может опираться на сетевое представление онтологии всех уровней. При этом ее функционирование будет связано:
-
с активацией понятий и/или отношений, фиксирующих решаемую задачу (описание исходной ситуации);
-
определением целевого состояния (ситуации);
-
выводом на сети, заключающемся в том, что от узлов исходной ситуации распространяются волны активации, использующие свойства отношений, с ними связанных. Критерием остановки процесса является достижение целевой ситуации или превышение длительности исполнения (time-out).