- •В.В. Литвин технології менеджменту знань
- •Розділ 1 основні поняття менеджменту знань
- •1.1. Основні означення менеджменту знань
- •1.1.1. Структура менеджменту знань
- •Маркетинґ Проектування Підготовка виробництва Виробництво Збут
- •1.1.2. Формування знань
- •1.1.3. Введення даних
- •1.1.4. Адміністрування
- •1.1.5. Мотивація
- •1.1.6. Особливості впровадження мз
- •1.2. Менеджмент знань
- •1.3. Базові поняття менеджменту знань
- •1.3.1. Видобування знань
- •1.3.2. Системи пізнання
- •1.3.3. Організація доступу до знань
- •1.3.4. Інновації в області автоматизації
- •1.3.5. Менеджмент знань та інформації
- •1.3.6. Менеджмент знань та Інтернет
- •1.4. Онтологічний інжиніринг
- •1.4.1. Системи керування знаннями
- •1.4.2. Онтологія
- •1.5. Висновки
- •Запитання для повторення та контролю знань
- •Розділ 2 теоретичні аспекти менеджменту та інженерії знань
- •2.1. Поле знань
- •2.1.1. Мова опису поля знань
- •2.1.2. Семіотична модель поля знань
- •2.1.3. “Піраміда” знань
- •2.2. Стратегії одержання знань
- •2.3. Теоретичні аспекти видобування знань
- •2.3.1. Психологічний аспект
- •2.3.2. Лінгвістичний аспект
- •2.3.3. Гносеологічний аспект видобування знань
- •2.4. Теоретичні аспекти структурування знань
- •2.4.1. Історична довідка
- •2.4.2. Ієрархічний підхід
- •2.4.3. Традиційні методології структуризації
- •2.4.4. Об’єктно-структурний підхід (осп)
- •Стратифікація знань предметної області
- •Матриця об’єктно-структурного аналізу
- •Запитання для повторення та контролю знань
- •Розділ 3 технології менеджменту та інженерії знань
- •3.1. Класифікація методів практичного видобування знань
- •3.2. Комунікативні методи
- •3.2.1. Пасивні методи
- •Порівняльні характеристики пасивних методів видобування знань
- •3.2.2. Активні індивідуальні методи
- •Порівняльні характеристики активних індивідуальних методів видобування
- •3.2.3. Активні групові методи
- •3.3. Текстологічні методи
- •3.3.1. Методи структурування
- •Дані концептуалізації
- •3.3.2. Еволюція систем одержання знань
- •Запитання для повторення та контролю знань
- •Завдання для самостійного розв’язування
- •Розділ 4 прикладні аспекти менеджменту та інженерії знань
- •4.1. Латентні структури знань і психосемантика
- •4.1.1. Семантичні простори і психологічне градуювання
- •Опис зв’язку між поняттями
- •4.1.2. Методи багатовимірного градуювання
- •4.1.3. Використання метафор для виявлення “прихованих” структур знань
- •4.2. Метод репертуарних решіток
- •4.2.1. Основні поняття
- •4.2.2. Методи виявлення конструктів. Метод мінімального контексту
- •4.2.3. Аналіз репертуарних решіток
- •4.2.4. Автоматизовані методи
- •4.3. Керування знаннями
- •4.3.1. Що таке “керування знаннями”?
- •4.3.2. Керування знаннями і корпоративна пам’ять
- •4.3.3. Системи omis
- •4.3.4. Особливості розроблення омis
- •4.4. Візуальне проектування баз знань як інструмент пізнання
- •4.4.1. Від понятійних карт до семантичних мереж
- •4.4.2. База знань як пізнавальний інструмент
- •4.5. Проектування гіпермедіа бд і адаптивних навчальних систем
- •4.5.1. Гіпертекстові системи
- •4.5.2. Від мультимедіа до гіпермедіа
- •4.5.3. На шляху до адаптивних навчальних систем
- •Запитання для повторення та контролю знань
- •Розділ 5 Класифікація даних та знань
- •5.1. Важливість правильної класифікації
- •5.1.1. Класифікація й об’єктно-орієнтовне проектування
- •5.1.2. Труднощі класифікації
- •5.2. Ідентифікація класів і об’єктів
- •5.2.1. Класичний і сучасний підходи
- •5.2.2. Об’єктно-орієнтований аналіз
- •5.3. Ключові абстракції й механізми
- •5.3.1. Ключові абстракції
- •5.3.2. Ідентифікація механізмів
- •5.4. Висновки
- •Запитання для повторення та контролю знань
- •Розділ 6 онтології й онтологічні системи
- •6.1. Поняття онтології
- •6.2. Моделі онтології й онтологічної системи
- •Класифікація моделей онтології
- •6.3. Методології створення і “життєвий цикл”онтології
- •6.4. Мови опису онтологій
- •6.4.1. Види owl
- •6.4.2. Структура онтологій
- •Запитання для повторення та контролю знань
- •Розділ 7 Програмні засоби побудови онтологій
- •7.1. Онтологія як засіб формалізації та алгоритмізації знань в інтелектуальній системі
- •7.1.1. Аналіз підходів до навчання онтологій
- •7.1.2. Загальні принципи проектування онтологій
- •7.1.3. Формати та стандарти подання інформації
- •7.1.4. Засоби для створення онтології
- •7.2. Технологія розроблення онтологій в редакторі Protégé
- •7.2.1. Еволюція Protégé
- •7.2.2. Protégé-owl. Мова Web онтологій owl
- •7.2.3. Основні терміни та поняття у Protégé-owl
- •Терміни та їх синоніми
- •7.2.4. Методика розроблення онтології засобами Protégé
- •Створення й експлуатація онтології
- •7.2.5. Створення онтології
- •Запитання для повторення та контролю знань
- •Завдання для самостійного розв’язування
- •Література
- •Литвин Василь Володимирович технології менеджменту знань
- •V lp.Com.Ua, ел. Пошта: vmr@vlp.Com.Ua
6.3. Методології створення і “життєвий цикл”онтології
Розробники систем, заснованих на знаннях, стикаються з проблемою “вузької шийки” видобування знань. Аналогічна проблема існує і у процесі створення онтології. Але, на відміну від розробників інтелектуальних систем, творців онтології чекають і додаткові проблеми, пов’язані з відсутністю хоч якихось загальних і верифікованих методологій, що визначають, які “процедури” повинні виконувати в процесі розроблення, і на яких стадіях розроблення онтології їх потрібно виконувати. Сьогодні існує лише декілька незалежних методологій, орієнтованих на побудову онтології.
Відразу зазначимо, що ці підходи і методології ґрунтуються на поданих принципах проектування і реалізації онтології, запропонованих Грубером.
Чіткість (Clarity) – онтологія повинна ефективно передавати значення введених термінів. Визначення мають бути об’єктивними, хоча мотивація введення термінів може визначатися ситуацією або вимогами обчислювальної ефективності. Для об’єктивізації визначень потрібно використовувати чітко фіксований формалізм, логічно задавати визначення у вигляді логічних аксіом.
Узгодженість (Coherence) – означає, що принаймні всі визначення мають бути логічно несуперечливі, а всі твердження, що виводяться в онтології, не повинні суперечити аксіомам.
Розширюваність (Extendibility) – онтологія має бути спроектована так, щоб забезпечувати використання словників термінів, що розділяються, які допускають можливість монотонного розширення чи спеціалізації без необхідності ревізії вже наявних понять.
Мінімум впливу кодування (Minimal encoding bias) – концептуалізація, що лежить в основі створюваної онтології, має бути специфікована на рівні уявлення, а не символьного кодування. Цей принцип пов’язаний з тим, що агенти, які поділяють онтологію, можуть бути реалізовані в різних системах відображення знань.
Мінімум онтологічних зобов’язань (Minimal ontological commitment) – онтологія повинна містити тільки найістотніші припущення про модельований світ, щоб залишати свободу розширення і спеціалізації. Звідси витікає, що онтології ґрунтуються на “слабких” теоріях, оскільки мета їх створення і використання полягає передусім у тому, щоб “говорити” про предметну область, на відміну від БЗ, які можуть містити знання, необхідні для розв’язання задач чи одержання відповідей на запитання.
6.4. Мови опису онтологій
Сьогодні існує декілька розповсюджених стандартів опису онтологій. Ключовим моментом у проектуванні онтологій є вибір відповідної мови специфікації онтологій (Ontology specification language). Мета таких мов надати можливість вказувати додаткову семантику ресурсів, що машинно-інтерпретується, зробити машинне подання даних більш схожим на стан речей у реальному світі, істотно підвищити виразні можливості концептуального моделювання слабкоструктурованих Web-даних.
Існують традиційні мови специфікації онтологій (Ontolingua, CYCL, мови, засновані на дескриптивних логіках, такі як LOOM, і мови, засновані на фреймах, OKBC, OCML, Flogic). Пізніші мови засновані на Web-стандартах, такі як XOL, SHOE або UPML, RDF(S), DAML, OIL, OWL, що створені спеціально для обміну онтологіями через Web.
Загалом, відмінність між традиційними і Web-мовами специфікації онтологій полягає у виразних можливостях опису наочної області і деяких можливостях механізму логічного виведення для цих мов. Типові примітиви мов додатково містять:
конструкції для арегації множинних ієрархій класів, правил виведення і аксіом;
різні форми модуляризації для запису онтологій і відношень між ними;
можливість мета-опису онтологій; це корисно для встановлення зв’язків між різними видами онтологій.
Першими пропозиціями з опису онтологій на базі RDFS були DARPA DAML-ONT (DARPA Agent Markup Language) і European Commission OIL (Ontology Inference Layer). Ці стандарти специфікації й обміну онтологіями розроблені для досягнення якнайкращих результатів у підтримці процесу обміну знаннями й інтеграції знань. DAML забезпечує примітиви для оголошення перетинів, об’єднань, доповнень класів тощо, а OIL заснований на description logics. Інше розширення RDFS DRDFS. Так само як і OIL, він дає можливість для вираження класів і визначення властивостей, проте виразна потужність мов DRDFS і OIL така, що жоден з них не може розглядатися як фрагмент іншого.
На базі цих пропозицій DAML і OIL виникло спільне рішення – DAML+OIL, яке послугувало поштовхом для створення в межах ініціативи Semantic Web окремої групи з перегляду цього рішення і стандартизації мови опису Web-онтологій (OWL – Web Ontology Language). Адаптація до Web-систем логіки і штучного інтелекту становить вершину “піраміди Semantic Web”, забезпечуючи семантично-адекватний пошук інформації і машинну інтерпретацію семантики.
OIL також можна розглядати в порівнянні з Ontolingua, розробленим у межах ініціативи On-To-Knowledge. Порівняно з Ontolingua, OIL менш виразний, але все-таки дає змогу робити логічні висновки: підтримка виведення забезпечується системою FACT – класифікатором, який працює на основі description logic.
Проте загалом можна сказати, що орієнтованість мов опису онтологій на системи математичної логіки робить їх занадто потужними інструментами для величезної кількості додатків, яким достатньо простої мови опису словників, – RDFS. І це правильно, кожен ступінь у піраміді – це ступінь, на якому багато систем можуть зупинитися, згідно зі своїми власними вимогами до даних і їх використання.
Детально проаналізувавши найрозповсюдженіші мови опису онтологій, ми прийшли до висновку, що найцікавішим стандартом опису онтологій є Ontology Web Language, або OWL. Цей стандарт встановлений організацією W3C, що є законодавцем стандартів у всьому, що стосується Web. Поточний стандарт OWL прийнятий 2004 року, коли W3C опублікувала документ “OWL Web Ontology Language Guide. W3C Recommendation 10 February 2004” (OWL, мова Web-онтологій. Керівництво. Рекомендація W3C від 10 лютого 2004 р.). Наведемо декілька тез із вищезгаданого документа.
Всесвітня Павутина зараз нагадує погано розмічену географічну карту. Наше освоєння документів і усвідомлення їх можливостей засноване на пошуку ключових слів, підтримуваному грамотним використанням зв’язків між документами і навиками роботи в пошукових системах. Вся маса цих даних некерована без підтримки потужними інструментами. Щоб наносити на карту цей ландшафт точніше, комп’ютерним агентам потрібні машинно-читабельні описи вмісту і характеристик доступних Web-ресурсів. Ці описи повинні йти на додаток до версій тієї самої інформації, що можуть бути прочитані людиною.
Мова Web-онтологій OWL покликана забезпечити механізм, який може використовуватися для опису класів і зв’язків між ними, що властиві для Web-документів і додатків, однак її структура передбачає використання і в інших середовищах.
Рекомендації W3C демонструють, як використовувати мову OWL, щоб:
формалізувати область визначення класів і властивостей цих класів;
визначити індивідів та призначити їх властивості;
уточнити ці класи та індивіди до ступеня, що визначений формальною семантикою OWL.
Виклад рекомендацій організований так, щоб відобразити поступове визначення набору класів, властивостей та індивідів, починаючи з основних принципів і переходячи до складніших мовних компонентів.
“Скажіть мені, яке вино мені треба купити до кожної страви в цьому меню. І, до речі, я не люблю Сотерн.” Сьогодні важко було б створити Web-сервер-агент, який зміг би виконати пошук вин у мережі, що задовольняють цей запит. Для підтримки такого роду обчислень необхідно піти далі за ключові слова і описати зміст ресурсів, доступних у мережі. Цей додатковий рівень інтерпретації пов’язаний з семантикою даних.
Мова Web-онтологій OWL – це мова для визначення і подання Web-онтологій. Онтологія – термін, запозичений з філософії, який означає науку, що описує форми буття і те, як вони відносяться між собою. Web-онтологія може об’єднувати описи класів, властивостей і їх приклади. Формальна семантика OWL описує, як отримати логічні наслідки, маючи таку онтологію, тобто отримати факти, які не відображені в онтології буквально, але виходять з її семантики. Ці наслідки можуть бути засновані на одному документі або множині розподілених документів, які комбінуються з використанням певних механізмів OWL.
Питання, яке виникає, коли читаєш опис ще одного XML/Web-стандарту, – це “Що це дає мені, що не можуть дати XML і XML Schema?” Є дві відповіді на це запитання.
Онтологія відрізняється від схеми XML тим, що це відображення знання, а не формат повідомлень. Більшість Web-стандартів складаються з комбінації форматів повідомлень і специфікацій протоколів. Цим форматам задали експлуатаційну семантику типу: “Після отримання повідомлення ЗамовленняНаКупівлю, перевести Кількість гривень з РахунокПокупця на РахунокПродавця і відпустити Товар.” Але специфікація не створена для підтримки операцій поза контекстом цієїї транзакції. Наприклад, у нас немає, як правило, механізму, щоб визначити, що через те, що Товар має назву Шордоне, він має також бути білим вином.
Однією з переваг OWL-онтологій буде доступність інструментів, які можуть аналізувати їх. Інструменти забезпечать загальну підтримку, яка не є специфічною для певної наочної області, що було б тим випадком, коли треба побудувати систему, щоб міркувати в межах однієї стандартної для заданої індустрії XML-схеми. Побудова чіткої і працездатної системи міркування – непроста справа. Будівництво онтології набагато доступніше. Автори стандарту очікують, що багато людей приєднаються до створення онтологій. Вони отримають вигоду з інструментів третіх осіб, заснованих на формальних властивостях мови OWL, інструментів, що нададуть асортимент можливостей, які більшості організацій було б важко реалізувати самим.