Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
mini-WPORKA.docx
Скачиваний:
3
Добавлен:
04.09.2019
Размер:
61.73 Кб
Скачать
  1. Лінгвістичні ресурси –класифікація

У проектуванні онтологій умовно можна виділити два напрями, до деякого часу розвивалися окремо. Перша пов'язана з поданням онтології як формальної системи, заснованої на математично точних аксіомах. Другий напрямок розвивався в рамках комп'ютерної лінгвістики та когнітивної науки. Там онтологія розумілася як система абстрактних понять, які існують лише в свідомості людини, яка може бути виражена природною мовою (або засобами якоїсь іншої системи символів). При цьому зазвичай не робиться припущень про точність або несуперечності такої системи.

Таким чином, існує два альтернативних підходи до створення і дослідження онтологій. Перший (формальний) заснований на логіці (предикатів першого порядку, дескриптивного, модальної і т.п.). Другий (лінгвістичний) заснований на вивченні природної мови (зокрема, семантики) і побудові онтологій на великих текстових масивах, так званих корпусах.

В даний час дані підходи тісно взаємодіють. Йде пошук зв'язків, які дозволяють комбінувати відповідні методи. Тому іноді буває складно відокремити лексичні онтології з елементами формальних аксіоматики від логічних систем з включеннями лінгвістичних знань.

Незалежно від різних підходів можна виділити 3 основних принципи класифікації онтологій:

1. за ступенем формальності;

2. по наповненню, вмісту;

3. за метою створення.

Розглянемо відповідні класифікації по порядку. –наст пит

7.Типи словників, структурні одиниці словників

контрольований словник, тобто кінцевий список термінів (найпростішим прикладом є каталог на основі ідентифікаторів). Каталоги представляють точну (не багатозначну) інтерпретацію термінів. Наприклад, кожен раз, посилаючись на термін "машина", ми будемо використовувати одне і те ж значення (відповідне деякого ID в словнику), незалежно від того, про що йде мова в контексті: про "пральній машині", "автомобілі" або "державній машині".

Інший специфікацією онтології може бути глосарій, що представляє собою список термінів з їх значеннями. Значення описуються у вигляді коментарів на природній мові. Це дає більше інформації, оскільки люди можуть прочитати такий коментар і зрозуміти сенс терміна.

Тезауруси несуть додаткову семантику, визначаючи зв'язки між термінами. Відносини, властиві для тезаурусів: синонімія, ієрархічне відношення і асоціація.

формальні таксономії. Цей різновид онтологій включає точне визначення ставлення Підклас-КЛАС (позначається як isA). У таких системах строго дотримується транзитивність відносини isA: якщо A є підкласом класу B, то кожен підклас класу A також є підкласом класу B.

Формальне ставлення ЕКЗЕМПЛЯР-КЛАС (позначається як isInstanceOf). Деякі класифікації включають тільки імена класів, інші містять на нижньому рівні екземпляри (індивіди). Для відносини ЕКЗЕМПЛЯР-КЛАС виконується так звана "успадкованого" вздовж відносини isA: якщо A є підкласом класу B, то кожен екземпляр класу A також є екземпляром класу B. Тому в наведеному вище прикладі "брошки" не можуть бути поміщені в ієрархії нижче "предмет одягу", навіть у підкатегорію "жіночі предмети одягу", або стати примірником цієї категорії.

Далі серед структурних елементів з'являються слоти. Тут класи (іноді їх називають фреймами) можуть мати інформацію про властивості (слотах). Наприклад, клас "предмет одягу" може мати властивості "ціна", "зроблений з".