Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
mini-WPORKA.docx
Скачиваний:
3
Добавлен:
04.09.2019
Размер:
61.73 Кб
Скачать

17.Лексичні онтології

WordNet — семантичний словник для англійської мови. У ньому слова англійської мови розбито на групи синонімів — синсети (від англ. synset, synonym set), та надається коротке загальне визначення, та семантичні стосунки між цими словами. Мета подвійна: по-перше, це створення комбінації словника і тезауруса, більш інтуїтивно придатних для використання, а по-друге, підтримка автоматичного аналізу текстів та розробок в галузі штучного інтелекту. Інструменти бази даних і програмного забезпечення було випущено під BSD-подібною ліцензією що дозволяє вільне завантаження та використання. База даних може також бути переглянута в режимі он-лайн.

WordNet був створений і підтримується в Лабораторії Когнітивних Наук Університету Прінстон під керівництвом професора психології Джорджа Міллера. Рорзобка почалась в 1985 році. За роки існування, проект отримав приблизно 3 мільйони доларів США, переважно від урядових організацій зацікавлених в машинному перекладі.

Ідея WordNet'у виявилась дуже ефективною. Концепцію було взято для створення Euro-WordNet — семантичного словника всіх європейських мов, в основному, для створення систем машинного перекладу.

В цілому WordNet можна представити як мережу, в вузлах якої знаходяться сінсети - лексікалізованні поняття. Основними типами зв'язків між вузлами є гіпонімія і меронімія.

Тезаурус - словник, в якому слова, пов'язані з яким-небудь галузі знання, розташовані за тематичним принципом і показані семантичні відносини (родо-видові, синонімічні та ін) між лексичними одиницями. В інформаційно-пошукових тезаурусах лексичні одиниці тексту замінюються дескрипторами.

У 70-х рр.. 20 в. набули поширення інформаційно-пошукові тезауруси.

18.Онтологія предметної області

Інша назва - онтологія домену. Призначення схоже з призначенням онтології верхнього рівня, але область інтересу обмежена однією предметною областю (т.зв. доменом), наприклад, авіація, медицина, культура, дистанційне навчання, Інтернет-технології. Онтологія предметної області узагальнює поняття, що використовуються в деяких задачах домену, абстрагуючись від самих завдань (так, онтологія автомобілів незалежна від будь-яких особливостей конкретних марок машин). У багатьох дисциплінах зараз розробляються стандартні онтології, які можуть використовуватися експертами по предметним областям для спільного використання та анотування інформації у своїй галузі.

Наприклад, в області медицини створені великі стандартні, структуровані словники, такі як SNOMED CT (Systematized Nomenclature of Medicine - Clinical Terms - систематизована номенклатура медицини - клінічна термінологія) і UMLS (Unified Medical Language System - семантична мережа Системи Уніфікованого Медичного Мови). Також з'являються великі общецелевие онтології. Так, програма ООН з розвитку (United Nations Development Program) і компанія Dun & Bradstreet об'єднали зусилля для розробки онтології UNSPSC, яка надає термінологію товарів і послуг (www.unspsc.org). Ще один приклад - онтологія в області документації у сфері культурної спадщини CIDOC CRM, яка буде розглянута в лекції 5.

19. Семантичний веб-простір Суть її полягає в автоматизації "інтелектуальних" завдань обробки значення (в семантичному сенсі) тих чи інших ресурсів, наявних в Мережі. Обробкою та обміном інформації повинні займатися не люди, а спеціальні інтелектуальні агенти (програми, розміщені в Мережі). Але для того, щоб взаємодіяти між собою, агенти повинні мати загальне (поділюване всіма) формальне представлення значення для будь-якого ресурсу. Саме для мети подання загальної, явною і формальної специфікації значення в Semantic Web використовуються онтологіі. Работа над засобами опису семантики в Мережі почалася задовго до публікації 2001 року. У 1997 році консорціум W3C визначив специфікацію RDF (Resource Description Framework). RDF надає простий, але потужний мова опису ресурсів, заснований на триплетах (triple-based) "Суб'єкт-Предикат-Об'єкт" і специфікації URI. Концептуально RDF дає мінімальний рівень для подання знань в Мережі. Специфікація RDF спирається на ранні стандарти, що лежать в основі Web:

• Unicode служить для представлення символів алфавітів різних мов,

• URI використовується для визначення унікальних ідентифікаторів ресурсів,

• XML і XML Schema - для структурування та обміну інформацією та для зберігання RDF (XML синтаксис RDF).

Крім RDF була розроблена мова опису структурованих словників для RDF - RDF Schema (RDFS). Він надає мінімальний набір засобів для специфікації онтологій.Результатом в 2004 році став мову GRDDL (Gleaning Resource Descriptions form Dialects of Languages). Його призначення полягає у наданні коштів для вилучення RDF-триплетів з XML і XHTML даних (особливо це відноситься до документів, автоматично генеруються із закритих баз даних). Розвивалося і програмне забезпечення для Semantic Web. В області створення бібліотек класів і побудови логічних висновків над RDF-графами була створена бібліотека Jena Framework, в області створення модулів розширення для браузерів - Simile для Firefox. В області створення візуальних середовищ редагування велике число редакторів онтологій стали підтримувати RDF.В 2004 статус рекомендації отримав мова OWL (Web Ontology Language). Він має 3 діалекту (3 безлічі структурних одиниць), що використовуються в залежності від необхідної виразної потужності. OWL фактично є надбудовою над RDF / RDFS і підтримує ефективне представлення онтологій в термінах класів і властивостей, забезпечення простих логічних перевірок цілісності онтології і зв'язування онтологій один з одним (імпорт зовнішніх визначень). В 2005 році почалася робота над форматом обміну правилами - RIF (Rule Interchange Format). Його призначення - з'єднати в одному стандарті кілька формалізмів для опису правил (по яких може здійснюватися нетривіальний логічний висновок): логіку клауз Хорна, логіки вищих порядків, продукційні моделі і т.п.Язик SPARQL - мова запитів до RDF-сховищ - у січні 2008 року набув статусу офіційної рекомендації Консорціуму W3C. Синтаксично він дуже схожий на SQL. Він вже широко використовується розробниками інформаційних сістем. Ще одним каменем спотикання для створення Semantic Web є фактична відсутність працюючих інтелектуальних агентів. Не всяка програма, обробна RDF, є агентом Semantic Web, точно так само як і не всяка програма, написана на Пролозі, є додатком в області штучного інтеллекта.Завершая розділ, потрібно підкреслити, що Семантична Мережа продовжує розвиватися - з'являються нові стандарти.