- •Раздел III. Заголовок, точки доступа и авторитетная запись 91
- •Глава 4. Формирование заголовка и точки доступа библиографической записи 91
- •Глава 5. Авторитетные/нормативные записи 112
- •Глава 9. Координатное индексирование 166
- •Раздел V. Аннотирование и реферирование 193
- •Глава 10. Аннотирование документа 193
- •10.1. Теоретические основы аннотирования 193
- •Глава 11. Реферирование документа 198
- •Предисловие
- •Введение
- •Раздел I.ОсновыАналитико-синтетической переработки информации
- •Глава 1. Значение процессов обработки документа
- •1.1. Аналитико-синтетическая переработка информации как учебная дисциплина
- •1.2. Роль обработки документа в организациях системы документальных коммуникаций
- •Титульная страница книги
- •Оборот титульного листа книги
- •129075, Москва, Звездный бульвар, 23
- •103473, Москва, Краснопролетарская, 16
- •1.3. Объект обработки документа
- •1.4. Классификация документа
- •Глава 2. Виды и результаты обработки документа
- •2.1. Виды обработки
- •2.1.1. Семантическая обработка документа
- •2.2. Библиографическая запись — главный результат обработки
- •2.3. Виды библиографических записей
- •2.4. Автоматизация процессов обработки
- •2.4.1. Система форматов rusmarc. Общая характеристика
- •2.4.2. Российский формат машиночитаемой каталогизации (rusmarc)
- •Раздел II. Библиографическое описание документа
- •Глава 3. Теоретические основы составления библиографического описания
- •3.1. Стандартизация библиографического описания
- •3.2. Библиографическое описание: определение, состав и назначение
- •Перечень элементов и областей библиографического описания
- •3.3. Виды библиографического описания
- •3.4. Общая методика библиографического описания
- •3.4.1. Пунктуация в библиографическом описании
- •3.4.2. Источник информации для составления библиографического описания
- •3.4.3. Сокращения слов в библиографическом описании
- •3.4.4. Язык библиографического описания
- •3.4.5. Орфография в библиографическом описании
- •3.4.6. Отражение в описании ошибок и опечаток, допущенных в документе
- •3.5. Одноуровневое библиографическое описание
- •3.5.1. Область заглавия и сведений об ответственности
- •3.5.2. Область издания
- •3.5.4. Область выходных данных
- •3.5.6. Область серии
- •3.5.7. Область примечания
- •3.5.8. Область стандартного номера (или его альтернативы) и условий доступности
- •3.5.9. Этапы составления одноуровневого библиографического описания
- •Распределение библиографических сведений по областям описания
- •3.6. Многоуровневое библиографическое описание
- •3.6.1. Многоуровневое описание многотомного документа
- •3.6.2 Многоуровневое описание сериальных документов
- •3.6.3. Многоуровневое описание составной части документа (Аналитическое библиографическое описание)
- •Раздел III. Заголовок, точки доступа и авторитетная запись
- •Глава 4. Формирование заголовка и точки доступа библиографической записи
- •4.1. Заголовок и точки доступа библиографической записи: определение, назначение, виды
- •4.2. История разработки заголовка библиографической записи
- •4.3. Общая методика формирования заголовка библиографической записи
- •4.4. Заголовок, содержащий имя лица. Форма, структура, правила приведения
- •4.5. Заголовок, содержащий наименование организации. Форма, структура, правила приведения
- •4.6. Заголовок, содержащий унифицированное заглавие. Форма, структура, правила приведения
- •4.7. Заголовок, содержащий обозначение документа. Форма, структура, правила приведения
- •4.8. Заголовок, содержащий географическое название. Форма, структура, правила составления
- •Глава 5. Авторитетные/нормативные записи
- •5.1. Значение авторитетных/нормативных записей
- •5.2. Структура формата
- •5.3. Методика формирования авторитетных файлов
- •5.3.1. Авторитетные/нормативные записи имен лиц
- •5.3.2. Авторитетные/нормативные записи под наименованием организации
- •5.3.3. Авторитетные/нормативные записи географических названий
- •5.3.4. Авторитетные/нормативные записи унифицированных заглавий
- •5.3.5. Авторитетные/нормативные записи предметных рубрик
- •Раздел IV. Индексирование документа
- •Глава 6. Теоретические основы индексирования
- •6.1. Общие положения индексирования
- •6.2. Требования к информационно-поисковым языкам
- •6.3. Общие правила индексирования
- •Глава 7. Предметизация документа
- •7.1. Теоретические основы предметизации
- •7.1.1. Значение предметизации
- •7.1.2. Терминосистема процесса предметизации
- •7.2. Предметизационный ипя – средство предметизации
- •7.2.1. Характеристика предметизационного ипя
- •7.2.2. Структура предметизационного ипя
- •7.3. Общая методика предметизации
- •7.3.1. Основные этапы процесса предметизации
- •7.3.2. Структура предметной рубрики
- •7.3.3. Правила предметизации
- •7.4. Предметная рубрика – результат процесса предметизации
- •Глава 8. Систематизация документа
- •8.1. Значение систематизации
- •8.2. Классификационный ипя — средство реализации процесса систематизации
- •8.2.1. Терминосистема классификационного ипя
- •63.3 (2)4 Период феодализма (IV в. – 1861 г.)
- •63.3(2)41 Период зарождения и становления феодальных отношений (IV-XI вв.)
- •8.2.2. Классификационные системы, используемые в России
- •8.3. Общая методика систематизации
- •8.3.1. Принципы систематизации
- •8.3.2. Методы систематизации
- •8.3.3. Правила систематизации
- •8.4. Алгоритм поиска индексов в классификационной системе
- •8.5. Классификационный индекс – результат систематизации
- •Глава 9. Координатное индексирование
- •9.1. Теоретические основы координатного индексирования
- •9.2. Информационно-поисковый тезаурус (ипт)
- •9.2.1. Структура ипт
- •9.3. Методика разработки информационно-поискового тезауруса
- •9.3.1 Составление словаря ключевых слов
- •9.3.2. Дескрипторизация ключевых слов
- •9.3.4. Указатели роли и связи
- •9.4. Автоматизация процессов построения ипт
- •9.5. Методика координатного индексирования
- •9.6. Автоматизация координатного индексирования
- •9.6.1. Основные методы автоматизированного индексирования
- •Раздел V. Аннотирование и реферирование
- •Глава 10. Аннотирование документа
- •10.1. Теоретические основы аннотирования
- •10.2. Методика аннотирования документа
- •10.2.1. Основные требования к составлению аннотации
- •10.2.2. Этапы аннотирования
- •10.3. Автоматизация аннотирования
- •Глава 11. Реферирование документа
- •11.1. Теоретические основы реферирования
- •11.2. Виды рефератов
- •11.3. Общая методика реферирования документа
- •11.4. Методы реферирования
- •11.4.1. Методика составления информативного реферата
- •11.4.2. Особенности текста реферата
- •Заключение
- •Приложения
- •Российский формат машиночитаемой каталогизации
- •Пример машиночитаемой библиографической записи, созданной в формате rusmarc в Российской национальной библиотеке на книгу е. В. Пчелова «Рюриковичи. История династии»
- •Примеры библиографических записей, содержащих библиографическое описание и заголовок Книги. Однотомные издания
- •Многотомные издания
- •Депонированная научная работа
- •Неопубликованные документы
- •Сериальные и другие продолжающиеся ресурсы
- •Изоиздание
- •Составные части документов
- •Isbn 978-s
9.3.2. Дескрипторизация ключевых слов
Дескрипторизация словаря заключается в переводе поисковых образов текстов документов с языка ключевых слов на дескрипторный язык. Процесс дескрипторизации включает:
— нормализацию ключевых слов;
— установление классов условной эквивалентности.
Нормализация терминов индексирования заключается в приведении их к стандартной для информационно-поисковых тезаурусов форме записи.
Ключевые слова должны быть представлены в тезаурусе в унифицированной грамматической форме:
— различные формы глагола должны заменяться существительными;
— различные формы прилагательного, используемого в роли отдельного КС, заменяются формой именительного падежа единственного числа мужского рода;
— различные формы существительного заменяются формой именительного падежа. Если существительное имеет две формы числа (единственное и множественное), то оно приводится к типовым формам согласно ГОСТ 18383–73.
При нормализации ключевых слов важно иметь в виду порядок слов.
Например, к словосочетанию, состоящему из прилагательного (или нескольких) и существительного, возникает вопрос, какой порядок записи использовать: прямой или инвертированый. Чтобы обеспечить экономичность и единообразие формулировок ключевых выражений и дескрипторов, используют инвертированную форму записи – существительное, затем прилагательное. Например: «каталог библиотечный». В этом случае дается отсылка от отвергнутой к принятой форме, что приводит к росту объема справочного аппарата. Используют и другой вариант: словосочетания приводят в прямой форме (не инвертируют). Например: «библиотечный каталог».
Важную роль в теории и практике дескрипторных ИПС выполняет понятие «условная эквивалентность ключевых слов».
Условная эквивалентность ключевых слов выражается в следующем: если ключевое слово в любом тексте документального массива, введенного в ИПС, может быть заменено другим ключевым словом так, что на запрос решение о выдаче остается таким же, как и до замены, то такие ключевые слова являются эквивалентными в сфере действия данной ИПС.
Существует два вида эквивалентности ключевых слов:
Имманентная (безусловная) и факультативная (условная), существующая только в рамках конкретной узкотематической ИПС.
Имманентная эквивалентность может быть представлена:
лексическими синонимами (существительными и прилагательными). Например: «габарит – размер». В качестве лексических синонимов выступает русский термин и соответствующий ему из иностранного языка;
полным наименованием и общепринятым сокращением. Например: «НТИ = научно-техническая информация».
Причиной факультативной эквивалентности является условный характер дескрипторного языка. Факультативная эквивалентность может быть представлена:
семантически родственными словами, смысловым различием которых можно пренебречь в рамках конкретной ИПС (квазисинонимы). Например: «воздух = атмосфера»;
терминами, выражающими понятия и представления, связанные логическими отношениями и психологическими ассоциациями. Как правило, такие связи представляются в виде парадигматических отношений, но иногда они подменяются отношением эквивалентности. Например: «авиация = самолет»; «алфавит = буква» (родовидовые отношения и отношения целое – часть); «громкоговоритель = радиовещание» (предмет – функция); «алюминий = дюраль» (сходство); «страна зарубежная = иностранный» (предмет – признак);
эллипсами (пропусками слов в речи), имеющими хождение в определенной отрасли знания. Например: «машина = электронная вычислительная машина».
Факультативная эквивалентность ключевых слов является регулярным средством формирования классов условной эквивалентности. Имманентная эквивалентность ключевых слов менее распространена.
Естественный язык обладает рядом свойств, осложняющих его использование для записи и поиска информации. Часто точное значение слов можно определить только из контекста, в котором они употреблены. Сложности для автоматизированной обработки слов и словосочетаний создают явления омонимии и полисемии. Неоднозначность и многозначность слов естественного языка препятствуют достижению соответствия между содержанием документа и средствами выражения этого содержания.
Омонимия и полисемия ключевых слов устраняется при помощи специальных помет (лексикографически). Например: «библиография» (наука) – «библиография» (деятельность). Таким образом, уточняют значение ключевого слова. Многозначность единичных ключевых слов можно снять путем перевода их в словосочетания. Единичные ключевые слова со значением омонима подвергаются дескрипторизации наряду с другими ключевыми словами, в результате чего происходит расчленение множества ключевых слов на классы условной эквивалентности. В качестве представителя данного класса (доминанты) в дескрипторном ИПЯ выбирается одно из ключевых слов этого класса. Это слово можно назвать «дескриптором», и оно имеет два значения: 1) класс условно эквивалентных (взаимозаменяемых) ключевых слов и 2) ключевое слово, являющееся представителем данного класса эквивалентности. В дескрипторном словаре, представляющем собой алфавитный перечень ключевых слов и дескрипторов, от ключевых слов даются отсылки к соответствующим дескрипторам. Около слов, обозначающих дескрипторы, перечисляются условно эквивалентные ключевые слова. Благодаря этому уточняется значение дескриптора.
9.3.3. Установление парадигматических отношений
Парадигматические (базисные, аналитические) отношения выражают постоянные семантические (смысловые) связи между лексическими единицами ИПЯ, не зависящие от текста. К ним относят: «род – вид», «целое – часть» и т. п. Эти отношения стабильны для каждой предметной области и фиксируются в словаре. В ИПТ фиксируются следующие парадигматические отношения (связи):
Род – вид (родовидовые, выше – ниже, шире – уже).
Отношение синонимии (условной эквивалентности).
Ассоциативные отношения различного вида.
Используя логический анализ для сопоставления объемов понятий (дескрипторов), между ними выявляются отношения подчинения (объем одного понятия целиком включается в объем другого понятия) и пересечения (объемы понятий пересекаются). Логическое отношение подчинения связывает родовое понятие (понятие большого объема) и видовое понятие (понятие меньшего объема).
Родовидовые отношения между несколькими дескрипторами можно выстроить в виде иерархического дерева. Процесс построения иерархических деревьев включает распределение дескрипторов по все более узким семантическим категориям. В качестве главных семантических категорий выступают, например: «технологические процессы», «естественные явления», «материальные предметы», «свойства», «время» и др. Эти категории представляют собой общие понятия соответствующей области знания и включаются в тезаурус в качестве родовых для определенной группы дескрипторов.
Деление на категории позволяет собрать вместе дескрипторы, обозначающие родственные понятия.
Отношение пересечения понятий выражаются через ссылки «см. также». Например:
а) Родовидовые отношения
Преобразование информации
См. также Декодирование
Кодирование
б) Отношение функция (назначение) – предмет (процесс)
Надежность
См. также Защита
в) Отношение признак (свойство) – предмет (процесс)
Движение
См. также Динамика и т. д.
Родовидовые отношения выражают сильные парадигматические отношения. Отношения пересечения между дескрипторами представлены слабыми парадигматическими отношениями.
Кроме родовидовых отношений, между дескрипторами существуют ассоциативные отношения. Ассоциативные отношения можно установить с помощью сопоставления признаков, входящих в определения данных понятий и анализа содержания данной тематической области. Анализ текстов документов по конкретной тематике поможет выявить основную систему ассоциаций. Развивать систему ассоциаций могут помочь рекомендации заинтересованных пользователей АИС.
Использование тех или иных ассоциативных отношений зависит от специфики соответствующего лексического материала и ориентации на задачи поиска информации.
Примерами ассоциативных отношений могут служить отношения «часть – целое», «функциональное сходство», «следствие – причина» и др.
Отношение «целое – часть» («часть – целое») отражает факт вхождения одного объекта (предмета) или процесса в состав другого. Например:
БРОНХИ
ДЫХАТЕЛЬНАЯ ГЛОТКА
СИСТЕМА ГОРТАНЬ
ЛЕГКИЕ
НОС
ОКОЛОНОСОВЫЕ ПАЗУХИ
В процессе выявления таких отношений необходимо ответить на ряд вопросов: какие составные части имеет объект, обозначаемый дескриптором, в состав каких других объектов может входить объект, обозначенный дескриптором, и другие подобные вопросы. При этом рекомендуется пользоваться энциклопедическими и толковыми словарями, так как ответы на эти вопросы относятся к числу энциклопедических сведений. Разновидностью такого отношения можно назвать отношение «система – элемент». В информационной деятельности таким примером может служить отношение: «информационно-поисковая система – информационно-поисковый язык».
Отношение «причина – следствие» – это такое отношение между парой дескрипторов, когда наличие предмета (процесса, свойства), обозначенного одним дескриптором означает наличие предмета (процесса, свойства), обозначенного другим дескриптором.
Такое понимание ассоциации не предполагает разграничения между причиной и следствием и не требует наличия подлинной причинно-следственной связи. К причинно-следственным отношениям можно отнести отношение «функция (назначение) – предмет (процесс)» или «предмет (процесс) – признак (свойство)». Например: «арктика – холод».
Между предметами (процессами, свойствами), обладающими общими признаками (общность назначения, формы, функции и т. д.) существует отношение сходства. Например: «картотека – каталог».
В том случае, когда происходит противопоставление предметов, процессов, свойств по критерию отличия, между ними устанавливается отношение контраста. Например: «хороший – плохой». Ассоциации по контрасту возникают вследствие наличия в языке антонимов (противоположных по значению слов).
Ассоциативная связь между предметами или явлениями, воспринимающимися в непосредственной близости друг к другу в пространстве и во времени, называется отношением смежности. Например: «стол – стул».
Морфологическая характеристика термина «индексирование» заключается в отнесении его к лексикографическим категориям. В словник ИПТ включаются, как правило, следующие типы ЛЕ:
существительные, прилагательные, числительные, наречия, некоторые причастия и их сочетания, очень редко глаголы;
именные словосочетания;
лексически значимые компоненты сложных слов;
сокращение слов и словосочетаний.
Отобранные из текстов ключевые слова подвергаются лексикографической обработке, которая заключается в выполнении следующих операций:
решение вопроса о разделении выделенного словосочетания из двух или более слов или сохранение его в качестве целостного КС;
решение вопроса об использовании сложного слова в качестве КС или членении его на два или более ключевых слова;
устранение омонимии и полисемии лексических единиц естественного языка.
Морфологический анализ, заключающийся в разделении слов естественного языка на основы, аффиксы (префиксы и суффиксы) и окончания, позволяет преобразовать сложные слова в словосочетания или сократить. Морфологический анализ выполняется по следующей схеме:
определяется грамматический класс слова по его буквенному составу;
существительные подвергаются анализу на определение отглагольных существительных;
сложные слова разделяются на самостоятельные единицы: префиксоид и основу. Например: сложное слово «самолетостроение» разбивается на префиксоид («самолето») и основу («строение»).
Различные словоформы одного слова приводятся к одной основе (путем опознавания и отсечения окончаний и суффиксов). Например: слова «библиотечный», «библиотека» в результате морфологического анализа будут приведены к одной форме «библиот». Слова, обозначающие предметы и пишущиеся через дефис, включаются в ИПТ в их натуральном виде. Например: «фотограф-любитель».
Омонимия и полисемия (многозначность) ключевых слов устраняются с помощью специальных помет (пояснений), являющихся частями лексических единиц. Специальные пометы помещаются в круглых скобках непосредственно после КС через пробел. Они указывают на соответствующую область знания, отнесение к более крупной категории, приведение синонима и т. д. Часто эти пометы называют реляторами. Например: «библиография (наука) – библиография (деятельность) – библиография (указатель литературы)». Иногда применяются лексические примечания, представляющие собой пояснительный текст на естественном языке. Приводятся в косых скобках и не являются частями лексических единиц.
Ключевые слова должны быть приведены в тезаурусе в унифицированной грамматической форме:
различные формы глагола заменяются существительными;
различные формы прилагательного, используемого в качестве отдельного КС, заменяются формой именительного падежа единственного числа мужского рода;
различные формы существительного заменяются формой именительного падежа;
существительные, имеющие две формы числа (единственное и множественное), приводятся к типовым формам согласно ГОСТ 18383–73.
Словосочетания приводятся в ИПТ в прямой форме (не инвертируются).