Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
підручник Менеджмент знань.doc
Скачиваний:
0
Добавлен:
01.03.2025
Размер:
6 Mб
Скачать

6.3. Методології створення і «життєвий цикл» онтології

Як наголошувалося вище, розробники систем, заснованих на знаннях, стикаються з проблемою «вузької шийки» видобу­вання знань. Аналогічна проблема існує і при створенні онто­логії. Але, на відміну від розробників інтелектуальних систем, творців онтології чекають і додаткові проблеми, пов’язані з відсутністю хоч якихось загальних і верифікованих методо­логій, що визначають, які «процедури» повинні виконуватися в процесі розроблення, і на яких стадіях розроблення онтології вони мають виконуватися. Сьогодні існує лише декілька не­залежних методологій, орієнтованих на побудову онтології.

Відразу зазначимо, що ці підходи і методології базуються на поданих далі принципах проектування і реалізації онтології, запропонованих Грубером.

  1. Чіткість (Clarity) — онтологія повинна ефективно передавати значення введених термінів. Визначення мають бути об’єктивними, хоча мотивація введення термінів може визначатися ситуацією або вимогами обчислювальної ефек­тивності. Для об’єктивізації визначень має використову­ватися чітко фіксований формалізм, при цьому логічно зада­вати визначення у вигляді логічних аксіом.

  2. Узгодженість (Coherence) — означає, що принаймні всі визначення мають бути логічно несуперечливі, а всі твер­дження, що виводяться в онтології, не повинні суперечити аксіомам.

  3. Розширюваність (Extendibility) — онтологія має бути спроектована так, щоб забезпечувати використання слов­ників термінів, що розділяються, які допускають можливість монотонного розширення чи спеціалізації без необхідності ревізії вже наявних понять.

  4. Мінімум впливу кодування (Minimal encoding bias) — концептуалізація, що лежить в основі створюваної онтології, має бути специфікована на рівні уявлення, а не символь­ного кодування. Цей принцип пов’язаний з тим, що аґенти, що поділяють онтологію, можуть бути реалізовані в різних системах відображення знань.

  5. Мінімум онтологічних зобов’язань (Minimal ontological commitment) — онтологія повинна містити тільки най­істотніші припущення про модельований світ, щоб залишати свободу розширення і спеціалізації. Звідси витікає, що онто­логії базуються на «слабких» теоріях, оскільки мета їх ство­рення і використання полягає, перш за все, в тому, щоб «гово­рити» про предметну область, на відміну від БЗ, які можуть містити знання, необхідні для розв’язання задач чи одержан­ня відповідей на запитання.

6.4. Мови опису онтологій

На сьогодні існує декілька розповсюджених стандартів опису онтологій. Ключовим моментом у проектуванні онтологій є вибір відповідної мови специфікації онтологій (Ontology specification language). Мета таких мов  надати можливість вказувати додаткову семантику ресурсів, що машинно-інтерпретується, зробити машинне подання даних більш схожим на стан речей у реальному світі, істотно підвищити виразні можливості концептуального моделювання слабкоструктурованих Web-даних.

Існують традиційні мови специфікації онтологій (Ontolingua, CYCL, мови, засновані на дескриптивних логіках, такі як LOOM, і мови, засновані на фреймах,  OKBC, OCML, Flogic). Пізніші мови засновані на Web-стандартах, такі як XOL, SHOE або UPML, RDF(S), DAML, OIL, OWL, що створені спеціально для обміну онтологіями через Web.

Загалом, відмінність між традиційними і Web-мовами специфікації онтологій полягає у виразних можливостях опису наочної області і деяких можливостях механізму логічного виведення для цих мов. Типові примітиви мов додатково включають:

  • конструкції для аґреґації множинних ієрархій класів, правил виведення і аксіом;

  • різні форми модуляризації для запису онтологій і відношень між ними;

  • можливість мета-опису онтологій; це корисно при встановленні зв’язків між різними видами онтологій.

Першими пропозиціями з опису онтологій на базі RDFS були DARPA DAML-ONT (DARPA Agent Markup Language) і European Commission OIL (Ontology Inference Layer). Ці стандарти специфікації й обміну онтологіями розроблені для досягнення якнайкращих результатів у підтримці процесу обміну знаннями й інтеґрації знань. DAML забезпечує примітиви для оголошення перетинів, об’єднань, доповнень класів і таке інше, а OIL заснований на description logics. Інше розширення RDFS  DRDFS. Так само як і OIL, він дає можливість для вираження класів і визначення властивостей, проте виразна потужність мов DRDFS і OIL така, що жоден з них не може розглядатися як фраґмент іншого.

На базі цих пропозицій DAML і OIL виникло спільне рішення — DAML+OIL, яке послужило поштовхом для створення в рамках ініціативи Semantic Web окремої групи з перегляду цього рішення і стандартизації мови опису Web-онтологій (OWL — Web Ontology Language). Адаптація до Web систем логіки і штучного інтелекту складає вершину «піраміди Semantic Web», забезпечуючи семантично-адекватний пошук інформації і машинну інтерпретацію семантики.

OIL також можна розглядати в порівнянні з Ontolingua, розробленим у рамках ініціативи On-To-Knowledge. У порівнянні з Ontolingua, OIL менш виразний, але все-таки дозволяє робити логічні висновки: підтримка виведення забезпечується системою FACT — класифікатором, який працює на основі description logic.

Проте загалом можна сказати, що орієнтованість мов опису онтологій на системи математичної логіки робить їх занадто потужними інструментами для величезної кількості додатків, яким достатньо простої мови опису словників, — RDFS. І це правильно, кожен ступінь у піраміді — це ступінь, на якому багато систем можуть зупинитися, згідно зі своїми власними вимогами до даних і їх використання.

Детально проаналізувавши найрозповсюдженіші мови опису онтологій, ми прийшли до висновку, що найцікавішим стандартом опису онтологій є Ontology Web Language, або OWL. Цей стандарт встановлений організацією W3C, що є законодавцем стандартів у всьому, що стосується Web. Поточний стандарт OWL був прийнятий 2004 року, коли W3C опублікувала документ «OWL Web Ontology Language Guide. W3C Recommendation 10 February 2004» (OWL, мова Web-онтологій. Керівництво. Рекомендація W3C від 10 лютого 2004 р.). Наведемо декілька тез із вищезгаданого документу.

Всесвітня Павутина зараз нагадує погано розмічену географічну карту. Наше освоєння документів і усвідомлення їх можливостей засноване на пошуку ключових слів, підтримуваному грамотним використанням зв’язків між документами і навиками роботи в пошукових системах. Вся маса цих даних некерована без підтримки потужними інструментами. Щоб наносити на карту цей ландшафт точніше, комп’ютерним аґентам потрібні машинно-читабельні описи вмісту і характеристик доступних Web-ресурсів. Ці описи повинні йти на додаток до версій тієї ж інформації, що можуть бути прочитані людиною.

Мова Web-онтологій OWL покликана забезпечити механізм, який може використовуватися для опису класів і зв’язків між ними, що властиві для Web-документів і додатків, однак її структура передбачає використання і в інших середовищах.

Рекомендації W3C демонструють, як використовувати мову OWL, щоб:

  • формалізувати область визначення класів і властивостей цих класів;

  • визначити індивідів та призначити їх властивості;

  • уточнити ці класи і індивіди до ступеня, що визначений формальною семантикою OWL.

Виклад рекомендацій організований так, щоб відобразити поступове визначення набору класів, властивостей та індивідів, починаючи з основних принципів і переходячи до складніших мовних компонентів.

«Скажіть мені, яке вино мені треба купити до кожної страви в цьому меню. І, до речі, я не люблю Сотерн.» Сьогодні важко було б створити Web-сервер-аґент, який зміг би виконати пошук вин у мережі, що задовольняють цей запит. Для підтримки такого роду обчислень необхідно піти далі за ключові слова і описати зміст ресурсів, доступних у мережі. Цей додатковий рівень інтерпретації має справу з семантикою даних.

Мова Web-онтологій OWL — це мова для визначення і подання Web-онтологій. Онтологія — термін, запозичений з філософії, який позначає науку, що описує форми буття і те, як вони відносяться між собою. Web-онтологія може включати описи класів, властивостей і їх приклади. Формальна семантика OWL описує, як отримати логічні наслідки, маючи таку онтологію, тобто отримати факти, які не відображені в онтології буквально, але виходять з її семантики. Ці наслідки можуть бути засновані на одному документі або множині розподілених документів, які комбінуються з використанням певних механізмів OWL.

Питання, яке виникає, коли читаєш опис ще одного XML/Web стандарту, — це «Що це дає мені, що не можуть дати XML і XML Schema?» Є дві відповіді на це питання.

  • Онтологія відрізняється від схеми XML тим, що це відображення знання, а не формат повідомлень. Більшість Web-стандартів складаються з комбінації форматів повідомлень і специфікацій протоколів. Цим форматам дали експлуатаційну семантику типу: «Після отримання повідомлення ЗамовленняНаКупівлю, перевести Кількість гривень з РахунокПокупця на РахунокПродавця і відпустити Товар.» Але специфікація не створена для підтримки операцій поза контекстом цієїї транзакції. Наприклад, у нас немає, як правило, механізму, щоб визначити, що через те, що Товар має назву Шардоне, він має також бути білим вином.

  • Однією з переваг OWL-онтологій буде доступність інструментів, які можуть аналізувати їх. Інструменти забезпечать загальну підтримку, яка не є специфічною для певної наочної області, що було б тим випадком, коли треба побудувати систему, щоб міркувати в межах однієї стандартної для заданої індустрії XML-схеми. Побудова чіткої і працездатної системи міркування — непроста справа. Будівництво онтології набагато доступніше. Автори стандарту очікують, що багато людей приєднаються до створення онтологій. Вони отримають вигоду з інструментів третіх осіб, заснованих на формальних властивостях мови OWL, інструментів, що нададуть асортимент можливостей, які більшості організацій було б важко реалізувати самим.