
- •Формализация знаний в интеллектуальных системах. Данные и знания
- •Продукционные модели
- •Модификации продукционной модели
- •Семантические сети
- •Вывод на знаниях. Машина вывода.
- •Механизм вывода
- •Стратегии управления выводом.Прямой и обратный вывод.
- •Определение понятия онтологии. Классификация онтологии Понятие и классификация онтологий
- •8. Онтология верхнего уровня(онтология OpenCyc,Sumo,Dolce)
- •Онтология предметных областей на примере онтологий cidoc crm
- •Лексические онтология (семейство Wordnet). Типы отношений в лексических онтологиях
8. Онтология верхнего уровня(онтология OpenCyc,Sumo,Dolce)
Онтологии верхнего уровня
Пренебрегая незначительными различиями в определениях термина " онтология ", полученных из разных источников (и приведенных в лекции 1), в этом разделе под онтологией будем понимать систему, которая состоит из множества понятий, их определений и аксиом, необходимых для ограничения интерпретации и использования понятий.
OpenCyc
OpenCyc1 - открытая для общего пользования часть коммерческого проекта Cyc, в рамках которого создана наиболее масштабная и детализированная на текущий момент онтология в области здравого смысла. База знаний OpenCyc содержит информацию из различных предметных областей: Философия, Математика, Химия, Биология, Психология, Лингвистика и т.д. Структурно база знаний OpenCyc состоит из констант (терминов) и правил (формул), оперирующих этими константами. Правила делятся на два вида: аксиомы и выводимые утверждения. Под аксиомами в OpenCyc понимаются утверждения, которые были явно и вручную введены в базу знаний экспертами, а не появились там (или могут появиться) в результате работы машины вывода. Все утверждения или формулы в базе знаний OpenCyc фиксируются на языке CycL, выразительно эквивалентном исчислению предикатов первого порядка.
DOLCE
DOLCE (Descriptive Ontology for Linguistic and Cognitive Engineering) - первая из онтологий в библиотеке базовых онтологий проекта WonderWeb. Для представления своей онтологии авторы DOLCE избрали более гибкий, чем в проекте Cyc, подход: онтология фиксируется с использованием логики предикатов первого порядка. Затем описывается та часть утверждений, которая может быть представлена на языке OWL. Оставшиеся аксиомы, выраженные на языке KIF2, добавляются к OWL-описаниям в виде комментариев. Таким образом достигается выразительность уровня KIF3 и совместимость с OWL. Недостаток такого подхода в том, что приложения, не имеющие информации о действительной структуре OWL-документа, не смогут получить доступ к "закомментированным" утверждениям.
SUMO
SUMO (Standard Upper Merged Ontology) - онтология верхнего уровня, разработанная в рамках проекта IEEE SUO (IEEE Standard Upper Ontology) и Teknowledge. Проект претендует на статус стандарта для онтологий верхнего уровня. Аксиомы ограничивают интерпретацию концептов и предоставляют основу для систем автоматизированного рассуждения, которые могут обрабатывать базы знаний, соответствующие по своей структуре онтологии SUMO. Пример аксиомы: "Если Cявляется экземпляром процесса горения, то существуют выделение тепла H и излучение света L такие, что оба они - H и L- являются подпроцессами C ". Более сложные предложения говорят, что процессы выделения тепла и излучения светасопутствуют каждому процессу горения. Аксиомы кодируются в SUMO на формальном логическом языке SUO-KIF.
Онтология предметных областей на примере онтологий cidoc crm
Другое название - онтология домена. Назначение схоже с назначением онтологии верхнего уровня, но область интереса ограничена одной предметной областью (т.н. доменом), например, авиация, медицина, культура, дистанционное обучение, Интернет-технологии. Онтология предметной области обобщает понятия, использующиеся в некоторых задачах домена, абстрагируясь от самих задач (так, онтология автомобилей независима от любых особенностей конкретных марок машин). Во многих дисциплинах сейчас разрабатываются стандартные онтологии, которые могут использоваться экспертами по предметным областям для совместного использования и аннотирования информации в своей области.
Например, в области медицины созданы большие стандартные, структурированные словари, такие как SNOMED CT (SystematizedNomenclature of Medicine - Clinical Terms - систематизированная номенклатура медицины - клиническая терминология) и UMLS(Unified Medical Language System - семантическая сеть Системы Унифицированного Медицинского Языка). Также появляются обширные общецелевые онтологии. Так, программа ООН по развитию (United Nations Development Program) и компания Dun&Bradstreet объединили усилия для разработки онтологии UNSPSC, которая предоставляет терминологию товаров и услуг (www.unspsc.org). Еще один пример - онтология в области документации в сфере культурного наследия CIDOC CRM, которая будет рассмотрена в лекции 5.
CIDOC CRM CIDOC CRM ("Committee on Documentation" "Conceptual Reference Model") представляет собой формальную онтологию, предназначенную для улучшения интеграции и обмена гетерогенной информацией по культурному наследию. Более конкретно, CIDOC CRM определяет семантику схем баз данных и структур документов, используемых в культурном наследии и музейной документации, в терминах формальной онтологии. Модель не определяет терминологию, появляющуюся в конкретных структурах данных, но имеет характерные отношения для ее использования.
Модель может служить как руководством для разработчиков информационных систем, так и общим языком для экспертов предметной области и специалистов по информационным технологиям. Она предназначена для покрытия контекстной информации исторического, географического и теоретического характера об отдельных экспонатах и музейных коллекциях в целом. Иерархия классов модели CIDOC CRM делится на 2 ветви: Постоянные сущности и Временные сущности. Прочие классы являются вспомогательными.
На самых нижних уровнях иерархии классов появляются понятия, характерные для сферы культуры: Хранение, Перемещение(ценностей), " Проект или Процедура " (в том числе техника производства), Период (в том числе художественный стиль). Иерархия классов может быть гибко расширена с применением встроенного класса Тип. Наибольший интерес представляют свойства. Классы на нижних уровнях иерархии имеют около 10-15 свойств, причем большая часть свойств наследуется от классов-предков. Названия свойств представляют собой глагольные фразы, выбранные так, что при последовательном связывании двух классов свойством получается осмысленная фраза с субъектом (первый, если считать слева направо, класс), предикатом (свойством) и объектом (второй класс)