Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
100587_Lytvyn.doc
Скачиваний:
167
Добавлен:
07.02.2016
Размер:
6.01 Mб
Скачать

6.3. Методології створення і “життєвий цикл”онтології

Розробники систем, заснованих на знаннях, стикаються з проблемою “вузької шийки” видобу­вання знань. Аналогічна проблема існує і у процесі створення онто­логії. Але, на відміну від розробників інтелектуальних систем, творців онтології чекають і додаткові проб­леми, пов’язані з відсутністю хоч якихось загальних і верифіко­ва­них методо­логій, що визначають, які “процедури” повинні виконувати в процесі розроблення, і на яких стадіях розроблення онтології їх по­трібно виконувати. Сьогодні існує лише декілька не­залежних методо­логій, орієнтованих на побудову онтології.

Відразу зазначимо, що ці підходи і методології ґрунтуються на поданих принципах проектування і реалізації онтології, запропо­нованих Грубером.

  1. Чіткість (Clarity) – онтологія повинна ефективно передавати зна­чення введених термінів. Визначення мають бути об’єктивними, хоча мотивація введення термінів може визначатися ситуацією або вимогами обчислювальної ефек­тивності. Для об’єктивізації визначень потрібно використову­вати чітко фіксований формалізм, логічно зада­вати визначення у вигляді логічних аксіом.

  2. Узгодженість (Coherence) – означає, що принаймні всі виз­начення мають бути логічно несуперечливі, а всі твер­дження, що виводяться в онтології, не повинні суперечити аксіомам.

  3. Розширюваність (Extendibility) – онтологія має бути спро­ек­тована так, щоб забезпечувати використання слов­ників термінів, що розділяються, які допускають можливість монотонного розширення чи спеціалізації без необхідності ревізії вже наявних понять.

  4. Мінімум впливу кодування (Minimal encoding bias) – концептуалізація, що лежить в основі створюваної онтології, має бути специфікована на рівні уявлення, а не символь­ного кодування. Цей принцип пов’язаний з тим, що агенти, які поділяють онтологію, можуть бути реалізовані в різних системах відображення знань.

  5. Мінімум онтологічних зобовязань (Minimal ontological commitment) – онтологія повинна містити тільки най­істотніші припу­щення про модельований світ, щоб залишати свободу розширення і спеціалізації. Звідси витікає, що онто­логії ґрунтуються на “слабких” теоріях, оскільки мета їх ство­рення і використання полягає передусім у тому, щоб “гово­рити” про предметну область, на відміну від БЗ, які можуть містити знання, необхідні для розв’язання задач чи одержан­ня відповідей на запитання.

6.4. Мови опису онтологій

Сьогодні існує декілька розповсюджених стандартів опису онто­логій. Ключовим моментом у проектуванні онтологій є вибір відпо­відної мови специфікації онтологій (Ontology specification language). Мета таких мов  надати можливість вказувати додаткову семантику ресурсів, що машинно-інтерпретується, зробити машинне подання да­них більш схожим на стан речей у реальному світі, істотно підвищити виразні можливості концептуального моделювання слабкострукту­рованих Web-даних.

Існують традиційні мови специфікації онтологій (Ontolingua, CYCL, мови, засновані на дескриптивних логіках, такі як LOOM, і мови, засновані на фреймах,  OKBC, OCML, Flogic). Пізніші мови засновані на Web-стандартах, такі як XOL, SHOE або UPML, RDF(S), DAML, OIL, OWL, що створені спеціально для обміну онтологіями через Web.

Загалом, відмінність між традиційними і Web-мовами специ­фікації онтологій полягає у виразних можливостях опису наочної області і деяких можливостях механізму логічного виведення для цих мов. Типові примітиви мов додатково містять:

  • конструкції для арегації множинних ієрархій класів, правил ви­ведення і аксіом;

  • різні форми модуляризації для запису онтологій і відношень між ними;

  • можливість мета-опису онтологій; це корисно для встановлення зв’язків між різними видами онтологій.

Першими пропозиціями з опису онтологій на базі RDFS були DARPA DAML-ONT (DARPA Agent Markup Language) і European Commission OIL (Ontology Inference Layer). Ці стандарти специфікації й обміну онтологіями розроблені для досягнення якнайкращих резуль­татів у підтримці процесу обміну знаннями й інтеграції знань. DAML забезпечує примітиви для оголошення перетинів, об’єднань, доповнень класів тощо, а OIL заснований на description logics. Інше розширення RDFS  DRDFS. Так само як і OIL, він дає можливість для вираження класів і визначення властивостей, проте виразна потужність мов DRDFS і OIL така, що жоден з них не може розглядатися як фрагмент іншого.

На базі цих пропозицій DAML і OIL виникло спільне рішення – DAML+OIL, яке послугувало поштовхом для створення в межах ініціа­тиви Semantic Web окремої групи з перегляду цього рішення і стандартизації мови опису Web-онтологій (OWL – Web Ontology Language). Адаптація до Web-систем логіки і штучного інтелекту ста­но­вить вершину “піраміди Semantic Web”, забезпечуючи семантично-адекватний пошук інформації і машинну інтерпретацію семантики.

OIL також можна розглядати в порівнянні з Ontolingua, розроб­леним у межах ініціативи On-To-Knowledge. Порівняно з Ontolingua, OIL менш виразний, але все-таки дає змогу робити логічні висновки: підтримка виведення забезпечується системою FACT – класифі­катором, який працює на основі description logic.

Проте загалом можна сказати, що орієнтованість мов опису онто­логій на системи математичної логіки робить їх занадто потуж­ними інструментами для величезної кількості додатків, яким достатньо простої мови опису словників, – RDFS. І це правильно, кожен ступінь у піраміді – це ступінь, на якому багато систем можуть зупинитися, згідно зі своїми власними вимогами до даних і їх використання.

Детально проаналізувавши найрозповсюдженіші мови опису онто­логій, ми прийшли до висновку, що найцікавішим стандартом опису онтологій є Ontology Web Language, або OWL. Цей стандарт встановлений організацією W3C, що є законодавцем стандартів у всьому, що стосується Web. Поточний стандарт OWL прийнятий 2004 року, коли W3C опублікувала документ “OWL Web Ontology Language Guide. W3C Recommendation 10 February 2004” (OWL, мова Web-он­тологій. Керівництво. Рекомендація W3C від 10 лютого 2004 р.). Наве­демо декілька тез із вищезгаданого документа.

Всесвітня Павутина зараз нагадує погано розмічену географічну карту. Наше освоєння документів і усвідомлення їх можливостей за­сно­ване на пошуку ключових слів, підтримуваному грамотним вико­рис­танням зв’язків між документами і навиками роботи в пошукових системах. Вся маса цих даних некерована без підтримки потужними інструментами. Щоб наносити на карту цей ландшафт точніше, ком­п’ютерним агентам потрібні машинно-читабельні описи вмісту і харак­теристик доступних Web-ресурсів. Ці описи повинні йти на додаток до версій тієї самої інформації, що можуть бути прочитані людиною.

Мова Web-онтологій OWL покликана забезпечити механізм, який може використовуватися для опису класів і зв’язків між ними, що властиві для Web-документів і додатків, однак її структура передбачає використання і в інших середовищах.

Рекомендації W3C демонструють, як використовувати мову OWL, щоб:

  • формалізувати область визначення класів і властивостей цих класів;

  • визначити індивідів та призначити їх властивості;

  • уточнити ці класи та індивіди до ступеня, що визначений фор­мальною семантикою OWL.

Виклад рекомендацій організований так, щоб відобразити по­ступове визначення набору класів, властивостей та індивідів, почи­наючи з основних принципів і переходячи до складніших мовних компонентів.

“Скажіть мені, яке вино мені треба купити до кожної страви в цьому меню. І, до речі, я не люблю Сотерн.” Сьогодні важко було б створити Web-сервер-агент, який зміг би виконати пошук вин у мережі, що задовольняють цей запит. Для підтримки такого роду об­чис­лень необхідно піти далі за ключові слова і описати зміст ресурсів, доступних у мережі. Цей додатковий рівень інтерпретації пов’язаний з семантикою даних.

Мова Web-онтологій OWL – це мова для визначення і подання Web-онтологій. Онтологія – термін, запозичений з філософії, який оз­начає науку, що описує форми буття і те, як вони відносяться між со­бою. Web-онтологія може об’єднувати описи класів, властивостей і їх приклади. Формальна семантика OWL описує, як отримати логічні на­слідки, маючи таку онтологію, тобто отримати факти, які не відобра­жені в онтології буквально, але виходять з її семантики. Ці наслідки можуть бути засновані на одному документі або множині розподілених доку­ментів, які комбінуються з використанням певних механізмів OWL.

Питання, яке виникає, коли читаєш опис ще одного XML/Web-стандарту, – це “Що це дає мені, що не можуть дати XML і XML Schema?” Є дві відповіді на це запитання.

  • Онтологія відрізняється від схеми XML тим, що це відображення знання, а не формат повідомлень. Більшість Web-стандартів скла­даються з комбінації форматів повідомлень і специфікацій прото­колів. Цим форматам задали експлуатаційну семантику типу: “Піс­ля отримання повідомлення ЗамовленняНаКупівлю, перевести Кіль­кість гривень з РахунокПокупця на РахунокПродавця і відпустити Товар.” Але специфікація не створена для підтримки операцій поза контекстом цієїї транзакції. Наприклад, у нас немає, як правило, механізму, щоб визначити, що через те, що Товар має назву Шордоне, він має також бути білим вином.

  • Однією з переваг OWL-онтологій буде доступність інструментів, які можуть аналізувати їх. Інструменти забезпечать загальну під­тримку, яка не є специфічною для певної наочної області, що було б тим випадком, коли треба побудувати систему, щоб міркувати в межах однієї стандартної для заданої індустрії XML-схеми. Побу­дова чіткої і працездатної системи міркування – непроста справа. Будівництво онтології набагато доступніше. Автори стандарту очікують, що багато людей приєднаються до створення онтологій. Вони отримають вигоду з інструментів третіх осіб, заснованих на формальних властивостях мови OWL, інструментів, що нададуть асортимент можливостей, які більшості організацій було б важко реалізувати самим.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]