
- •Введение
- •1. Понятие онтологии. Общая характеристика подхода
- •2. Основные виды программного инструментария онтологий
- •3. Язык rdf
- •3.1. Структура rdf-моделей
- •3.2. Нотация rdf/xml
- •3.3. Контейнеры и коллекции
- •3.4. Общая характеристика языка описания словарей rdfs
- •3.5. Синтаксис описания классов и типов-свойств в rdfs
- •3.6. Использование rdf
- •4. Язык owl
- •4.1. Диалекты owl
- •Структура онтологий
- •Основные элементы owl
- •. Картирование онтологий
- •Сложные классы [owl dl]
- •Версии онтологий
- •5. Разработка онтологий в среде Protege-2000
- •Состав онтологии
- •Обобщенная методика создания онтологий
- •Рекомендации по организации иерархий классов
3. Язык rdf
RDF (Resource Description Framework), предложенный (в качестве рекомендации) в 1999 г. консорциумом W3C (World Wide Web Consortium), изначально создавался как язык описания Internet-ресурсов (т. е. как средство описания моделей метаданных, позволяющих дополнительно охарактеризовать ресурсы и взаимосвязи между ними с понятийной точки зрения). При этом система идентификации, принятая в RDF, позволяет оперировать с расширенным понятием ресурсов. Ресурсом может быть обычная Web-страница или ее часть (например, отдельный элемент HTML- или XML-разметки, являющийся частью описываемого документа), коллекция страниц (в частности, Web-сайт или портал). Кроме того, в качестве ресурса может выступать произвольная сущность, абстрактная или физически существующая, но недоступная для машинной обработки. Синтаксической основой RDF является язык XML (eXtensible Markup Language). Способность XML к синтаксическому расширению обеспечила возможность описания формальной модели RDF/XML, позволяющей однозначно выразить конструкции RDF в терминах XML. Однако считать RDF расширением или специализированной реализацией XML некорректно. Фактически смысл RDF-нотаций заключается не в прямом описании представления данных (как в обычных языках разметки гипертекстов), а в описании модели метаданных (данных о данных), которая используется для семантической интерпретации информации (т.е. для «понимания» RDF). В связи с этим тексты на XML и некоторых других языках разметки, поддерживающих трансляцию (сериализацию) RDF-моделей, могут рассматриваться лишь как синтаксические посредники, описывающие RDF-модели в целях последующей интерпретации программными средствами, «умеющими» эти модели обрабатывать. При этом, если в XML описание какой-либо сущности может быть реализовано многими способами (и, соответственно, по-разному интерпретироваться), то в RDF внешнее различие описаний не имеет решающего значения. Важна лишь эквивалентность построенных на основании исходного текста RDF-моделей, которая и определяет одинаковое «восприятие» синтаксически разнящихся описаний. Точно также знание об одном и том же предмете может быть передано человеком на различных языках, с использованием различных выразительных средств (текстов, рисунков, таблиц и т. д.), но быть одинаково понято другими людьми. В таком контексте знанию соответствует RDF-модель, а различным формам описания этого знания – языки XML, HTML и проч. Сами RDF-модели с понятийной точки зрения представляют собой наборы фактов и семантических связей между ними, образующие ориентированные графы специального вида, в которых узлами являются сущности и значения свойств сущностей, а дугами – отношения. Важной (в тематике проблем представления знаний) особенностью RDF является возможность описания расширяемых, контекстно-зависимых словарей (также называемых схемами – RDF Schema или RDFS, что соответствует и названию расширения RDF, предназначенного для описания словарей – языка RDF Vocabulary Description Language). Под словарем следует понимать совокупность ресурсов (использующихся для описания свойств других ресурсов), классов ресурсов (которые могут быть описаны при помощи заданных свойств) и ограничений (налагаемых на допустимые значения или наборы значений свойств). При этом классы могут иметь подклассы, а свойства – подсвойства. Подобная организация словарей позволяет вводить содержательные формальные определения терминов, классифицировать понятия, отношения и их свойства, выражать одни сущности или отношения через другие и т. п., т. е. непосредственно описывать семантику данных. Эта особенность позволяет отнести язык RDF к категории языков описания онтологий и (в более широком смысле) языков представления знаний в целом. Кроме того, RDF обладает формальной семантикой, позволяющей задавать наборы утверждений и строить на них логические выводы, что сближает этот язык с выразительными возможностями классических представителей языков инженерии знаний.
Основными целями создания RDF явились:
- обеспечение возможности описания Web-метаданных (дополнительных данных о Web-ресурсах и использующих их программных системах) – эксплуатационных свойств, характеристик вычислительной среды и т. п.;
- создание базы для разработки Web-приложений, обладающих способностью к динамической адаптации к характеристикам используемых Web-ресурсов (например, планирование и организация распределенных вычислений, организационных процессов, аннотирование Web-ресурсов при решении задач поиска и селекции информации и т. п.);
- поддержка оперирования распределенными данными с использованием гипертекстовых средств информационного взаимодействия для разработки приложений, масштабируемых в глобальных сетях, независимых от конкретных параметров исполнительной среды в части совместимости данных и позволяющих обрабатывать данные вне среды их непосредственного создания;
- создание средств взаимодействия приложений (или компонентов мультиагентных систем) по каналам Internet/Intranet с возможностью комбинирования данных различных приложений, генерации коллективно используемых информационных массивов и т. п.;
- создание условий для кооперирования пользователей за счет единообразного восприятия данных с возможностями языковой адаптации, сопоставления и унификации понятий и терминов, интеграции моделей предметных и проблемных областей и т. п.
Среди основополагающих принципов, определяющих синтаксические и семантические характеристики RDF, следует особо отметить следующие:
- ориентацию на бинарные графовые модели данных (здесь термин «бинарный» указывает на бинарность отношений инциденции, связывающих узлы графа; иными словами, в RDF-графе 2 узла могут связываться единственной дугой, направленной от одного узла к другому);
- применение расширяемых словарей (схем), строящихся на основе унифицированных идентификаторов ресурсов (URI – Uniform Resource Identifiers), для описания терминологии произвольных проблемных областей;
- гибкую схему образования типов данных (с поддержкой динамического определения типов, наложений и эквивалентирования типов и областей значений, наследования, построения сложных таксономий и др.);
- совместимость с XML (включая уровень типизации данных, вложения описаний, общие пространства идентификаторов и др.).