Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЕК_№3.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
3.49 Mб
Скачать

2. 8. Інформаційно-пошукові мови: види інформаційно-пошукових мов; інформаційно-пошукові мови класифікаційного типу; інформаційно-пошукові мови дескрипторного типу.

Кожна ІПС містить певний набір семантичних засобів (куди належить, зокрема, іпформаційно-пошукова мова), методи індексування документів та запитів, методи пошуку. Основу семантичних засобів становить ІПМ. Інформаційно-пошукова мова — це спеціалізована штучна мова, яка призначена для опису центральних тем чи предметів і формальних характеристик документів, а також для опису інформаційних запитів і наступного виконання пошуку.

Іноді в АІПС одну мову використовують для індексації документів, а іншу — для індексації інформаційних запитів. До ІПМ ставиться цілий ряд вимог:

  1. повинна мати достатній набір лексико-граматичних засобів для точного вираження центральних тем або змісту будь-якого тексту (документа) і теми довільного інформаційного запиту;

  2. має бути однозначною, тобто кожний запис нею повинен мати лише одне семантичне тлумачення;

  3. бути зручною для порівняння та повного чи часткового порівняння ПОБ і ПР; компактною, мати невелику вартість та бути відкритою для можливого розширення та внесення змін.

Жодна з природних мов не може бути використана як ІПМ через недостатню структуризацію, велику кількість граматичних винятків, неоднозначність та велику надлишковість природної мови.

Доцільність використання тієї чи іншої мови багато в чому залежить від призначення інформаційної системи, рівня її оснащення технічними засобами та рівня автоматизації. Для зберігання документів у бібліотеках і технічних архівах використовують, як правило, мови, якими поширюються традиційні бібліо-течно-бібліографічні класифікації. Словниковий склад цих мов задається у вигляді фіксованого списку слів і словосполучень. Ці мови належать до класифікаційного типу, причому розглядаються такі системи класифікації: ієрархічна, алфавітно-предметна, фасетна.

З огляду на ріст інформаційних потоків та інформаційних потреб перелічені мови класифікаційного типу не задовольняють вимог сучасних інформаційних систем. Адже мова цього типу має дуже обмежений словниковий запас, поповнювати який дуже нелегко, а тому мови цієї групи використовуються в дуже вузькоспеціалізованих системах. Більш поширені інформаційно-пошукові мови дескрипторного типу.

При використанні дескрипторної мови основний зміст запиту чи документа виражається у вигляді деякої сукупності слів чи словосполучень природної мови. Слова та словосполучення є іменами деяких класів понять. Слово чи словосполучення, яке входить до пошукового образу, задає координати документа в багатовимірному просторі ознак.

У сучасних ІПС дескрипторна мова експлуатується в двох варіантах:

  1. Обробка документів і запитів за допомогою інформаційно-пошукового тезаурусу.

  2. Безтезаурусний ввід і пошук документів.

При розробці дескрипторної мови виконується спеціальний лексикограматичний контроль, будуються спеціальні словники, схеми, таблиці, які дають змогу виразити парадигматичні відношення між термінами індексування. Для дескрипторної мови розробляється спеціальний синтаксис.

Лексикографічний контроль полягає в тому, що всі ключові слова зводяться до нормального вигляду, тобто до одної форми написання і повного усунення синонімії, омонімії та різного роду багатозначностей за допомогою спеціального нормативного словника. У цьому словнику в єдиній морфологічній формі перелічені всі ключові слова. Зі списку ключових слів вибираються слова, які в межах даної ІПМ є синонімами. Ці ключові слова групуються в класи умовної еквівалентності (парадигми). Із кожної такої групи вибирається одне слово чи словосполучення, яке є семантичною домінантою групи, тобто найповніше визначає зміст слів відповідної групи. Ці слова стають дескрипторами, тобто лексичними одиницями ІПМ. Звідси й походить назва «дескрипторна мова».

Отже, дескриптори — необхідні для координатного індексування документів та інформаційних запитів нормативні ключові слова, які відібрані з основного словникового складу природної мови так, аби серед них не було омонімів, синонімів та багатозначності.

Дескрипторною називається спеціалізована інформаційно-пошукова мова, словниковий склад якої становлять дескриптори, а граматика — способи побудови пошукових образів та пошукових розпоряджень координацією відповідних дескрипторів.