Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
71_ю-._.pdf
Скачиваний:
35
Добавлен:
06.02.2016
Размер:
3.43 Mб
Скачать

ня або предметизація та систематизація (класифікація).

Пошуковий образ при предметному індексуванні задається правилами (методами) предметизації і представляє собою складну предметну рубрику, що складається із заголовка та ряду підзаголовків, об’єднаних за допомогою таких граматичних засобів, як тире та кома.

Пошуковий образ при систематичному індексуванні задається правилами систематизації та є складним індексом, окремі компоненти якого об’єднані між собою за допомогою знаків (+) та (:). Прикладами пошукових образів даного типу можуть бути класифікаційні індекси УДК, ББК та ін.

Посткоординатне (координатне) індексування – це процес перекладу змісту документа або запиту на ІПМ, при якому пошуковий образ задається списком лексичних одиниць. Послідовність лексичних одиниць може бути будь-якою, кожен індекс має пошукові функції, що забезпечують багатоаспектний пошук інформації. Прикладом пошукового образу в результаті такого індексування може бути пошуковий образ мовою ключових слів або дескрипторів [103].

При формуванні ПОД і ПОЗ часто здійснюється процедура надлишкового індексування, що полягає в доповненні ПОД або ПОЗ індексами, пов’язаними сильними парадигматичними відношеннями з індексами вихідного пошукового образу.

Методика предметизації

Сутність предметизації полягає у відображенні ознак документів у вигляді ПОД предметних рубрик.

Процес предметизації складається з декількох взаємопов’язаних операцій: відбір документів, аналіз документа як об’єкта предметизації і відбір смислових компонентів у головному змісті документа та прийняття рішення щодо наступного відображення їх у предметних рубриках; оформлення вибраних смислових компонентів у предметні рубрики і редагування предметних рубрик [36].

Відбір документів для предметизації здійснюється переважно для відтворення їх у предметному каталозі та інших ІПС і залежить від особливостей конкретної ІПС та потреб споживачів.

Аналіз документа є складною операцією, яка вимагає від предметизатора знання предмета, широкої ерудиції, вміння відрізняти головне від другорядного тощо.

Аналіз розпочинається з перегляду, в процесі якого визначається

136

предмет, аспекти його вивчення, призначення, форма документа. Під час перегляду необхідно звертати увагу на джерело інформації, тобто елементи документа, його текст, титульну сторінку, передмову, видавничу анотацію тощо. Ця джерельна база дає інформацію про весь документ.

У значній кількості документів назва досить точно відтворює тематику. Але предметизувати тільки за назвою – невірно, необхідно переконатися в тому, що назва дійсно передає зміст документа.

Важливим джерелом інформації про зміст документа є анотація, але головне джерело – текст документа, ознайомлення з яким забезпечує точність предметизації.

Відібрані на основі всебічного аналізу відомості використовуються для вибору смислових компонентів у змісті документа. Саме у ході вибору смислових компонентів вирішується питання про те, якою буде рубрика в залежності від її подальшого використання (у предметному каталозі чи предметному покажчику). На цьому етапі використовується і метод типізації, основою якого є категорійний аналіз, суть якого – розподіл термінів певної галузі знання на категорії (групи) за будь-якими ознаками. При предметизації документів необхідно сформулювати типові категорії предметів, тобто виділити в ході аналізу документів групи (категорії) предметів, що мають спільні ознаки. Так, для будь-якої науки виділяються, наприклад, такі типові категорії: наука, об’єкт вивчення, процеси, методи дослідження, місце, час. Але стосовно кожної конкретної науки ці категорії конкретизуються.

Наприклад, об’єктами вивчення у ботаніці є рослини, у суспільних науках – явища суспільного життя тощо.

Типізація застосовується не лише на етапі вибору предметних заголовків, а й підзаголовків.

Категорійний аналіз в предметизації набуває особливого значення при переході від традиційних до автоматизованих систем пошуку інформації [26].

Вибираючи предметну рубрику для відтворення документа в ІПС із контрольованою лексикою, слід з’ясувати, чи збігається зміст документа з тією предметною рубрикою, яка вже зафіксована в словнику. Якщо така рубрика відсутня, необхідно відкривати в словнику нову предметну рубрику. У випадку, коли ІПС тільки створюється, на кожний документ складається нова предметна рубрика. Значну допомогу в цьому надають списки предметних рубрик.

137

Вирішуючи питання про відбір предметної рубрики, необхідно порівняти обсяг поняття про предмет у документі з предметною рубрикою, що вже існує в конкретній ІПМ. З урахуванням такого підходу предметні рубрики підрозділяються на адекватні і узагальнюючі [36].

Адекватні – це рубрики, обсяг яких найбільш точно відповідає темі документа.

Узагальнюючі – це такі рубрики, обсяг яких більш ширший, ніж головна тема документа. Для одного й того ж документа можна сформулювати адекватну або узагальнюючу предметну рубрику. Так, наприклад, для навчального посібника “Предметизація документів” адекватною буде предметна рубрика Предметизація документів підручники і посібники, а узагальнюючою – Індексування документів підручники і посібники. Вибір рубрики залежить від потреб конкретного пошукового масиву. Відбір предметних рубрик для АПП до таблиць класифікації та систематичного каталога зведений до мінімуму, оскільки тут використовують як самостійні предметні рубрики прямі й інверсовані терміни, скорочені та повні найменування, синоніми, техніцизми [26].

Основною вимогою до предметної рубрики має бути її лаконізм у поєднанні з повним розкриттям змісту документа. Тобто, необхідно використовувати зафіксовані у лексиці ІПМ саме ті лексичні одиниці, які найточніше визначають зміст видання документа. Формулюючи рубрику, перш за все, спираються на існуючі типові категорії предметів і типові аспекти дослідження предметів, що властиві певній групі документів.

У випадках синонімії для формування предметної рубрики з усіх схожих понять обирають один термін, який і є лексичною одиницею і використовується для розкриття змісту документа. Від усіх інших синонімічних термінів, за якими може здійснюватися пошук інформації, роблять загальні посилання, наприклад:

Інформаційні процеси див. Інформатика. Процеси – інформаційні див. Інформатика.

У випадках полісемії та омонімії заголовок предметної рубрики доповнюють поясненням [36].

Нефрит (геол.) Нефрит (мед.)

Лексичний склад мови предметних рубрик досить багатий. Для

138