
- •Информация. Источники научной информации. Аналитико-синтетическая переработка информации
- •2.1. Информация: характеристика, свойства, виды
- •2.1.1. Виды документов
- •2.1.2. Книга как пример первичного документа
- •2.2. Аппарат книги и его элементы
- •2.3. О специфике информационного анализа и синтеза. Основные виды аналитико-синтетической переработки научных документов
- •2.3.1. Библиографическое описание и библиографическая запись
- •2.3.2. Аннотирование
- •2.3.3. Индексирование
- •2.3.4. Реферирование
- •2.3.5. Составление обзоров
- •2.4. Информационные потребности
- •2.5. Основы информационного поиска
2.3.3. Индексирование
В любой библиотеке или в информационном центре имеющаяся в фонде литература хранится не как придется, а в строгом соответствии с информационно-поисковой системой (ИПС). Именно это условие и обеспечивает быстрый поиск документов и их выдачу читателям. Для того чтобы включить новую единицу в фонд, необходимо ее проиндексировать, т.е. сопоставить содержание текста документа с терминами языка данной ИПС. К традиционным ИПС относятся каталоги и картотеки. ИПС строится на основе информационно-поискового языка (ИПЯ). Так называется искусственный язык, предназначенный для выражения содержания документов и информационных запросов. Он строится на базе соответственного естественного языка (например, английского или русского), но обладает рядом некоторых обязательных требований. К ним относятся:
· однозначность (каждая запись на ИПЯ должна иметь только один смысл, а любое понятие должно получить средствами языка единообразную запись);
· семантическое соответствие (способность отражать с необходимой полнотой и точностью смысловое содержание документов и запросов определенной предметной области);
· открытость, дающая возможность корректировки языка.
В качестве примеров ИПЯ могут быть названы:
· Десятичная классификация Дьюи (ДКД);
· Универсальная десятичная классификация (УДК);
· Библиотечно-библиографическая классификация (ББК);
· Классификация двоеточием Ш.Р. Ранганатана (КД);
· Библиографическая классификация Г.И. Блисса (БК);
· Классификация библиотеки Конгресса США (КБК).
Для каждого ИПЯ характерны своя лексика (словарный состав), базисные (аналитические) отношения, грамматика, система обозначений (алфавит), система ведения (изменения и дополнения), правила образования из простых лексических единиц (слов, рубрик, индексов) сложных или составных, а также правила интерпретации (перевода с естественного языка на ИПЯ и наоборот).
Процесс индексирования включает в себя:
· анализ содержания индексируемого материала и выбор из него лексических единиц, слов или словосочетаний, выражающих смысловое содержание текста;
· преобразование выбранных лексических единиц естественного языка в лексические единицы ИПЯ, т.е. нормализацию первых по форме и содержанию;
· формирование поискового образа документа (ПОД) или запроса с введением в него грамматических средств ИПЯ или без них. В качестве ПОД выступают сочетания предметных рубрик, индексов любой классификации (УДК, ББК и др.) или ключевых слов (дескрипторов).
Таким образом, индексирование означает кодирование по определенным правилам содержания документов для ее включения в данную ИПС.
Существуют два основных вида индексирования – систематизация и предметизация. При систематизации содержание документа или запроса выражено классификационными индексами в соответствии с правилами какого-либо классификационного ИПЯ (классификационной системы). При предметизации содержание документа или запроса выражено предметными рубриками в соответствии с правилами предметизационного ИПЯ.
При систематизации документов на первом этапе непосредственно знакомятся с документами, выявляют и отбирают их основные смысловые компоненты. Затем словесная форма по специальным таблицам классификации переводится на язык классификационных индексов. На заключительном этапе производится категориальный синтез - выявленные классификационные признаки объединяются в полном классификационном индексе.
При предметизации документа выделяют предмет (предметы) и аспект (аспекты) его рассмотрения. Затем данные смысловые компоненты формулируются в словесной форме в соответствии с принятыми правилами и принципами предметизации. На заключительном этапе предмет и аспекты рассмотрения обозначаются при помощи предметных рубрик предметного каталога данной библиотеки с необходимой и достаточной степенью адекватности. Если в словаре (списке) отсутствует предметная рубрика, позволяющая идентифицировать содержание документа, принимается решение о включении в него новой рубрики и одновременно вносятся изменения в справочно-методическую документацию.
В информатике часто оперируют термином «координатное индексирование», понимая под ним метод информационного анализа содержания документов или запросов, в результате которого лексические единицы (ключевые слова, словосочетания, рубрики и др.), извлеченные из текстов, соединяются между собой координатной (соподчинительной) связью; при этом они могут комбинироваться в любых отношениях, необходимых для более точного поиска информации.
Индексирование относится к числу «внутренних» библиотечных и информационных процессов, мало заметных постороннему глазу. Однако значение этого процесса трудно переоценить, поскольку именно он, нормализуя лексику, обеспечивает единство потоков информации в ИПС.