- •Блюменау Д. И.
- •ВВЕДЕНИЕ
- •Глава 1. СВЕРТЫВАНИЕ ИНФОРМАЦИИ КАК ОДНО ИЗ УСЛОВИЙ ЧЕЛОВЕЧЕСКОГО ОБЩЕНИЯ
- •1.1.0 СУЩНОСТИ «СВЕРТЫВАНИЯ»
- •1.2. ИНФОРМАЦИОННОЕ СВЕРТЫВАНИЕ
- •1.3. СВЕРТЫВАНИЕ В СФЕРЕ ИНФОРМАЦИОННОГО ОБСЛУЖИВАНИЯ
- •2.1. ИНДЕКСИРОВАНИЕ
- •2.1.1. Индексирование — его назначение
- •2.1.2. Индексирование на основе «традиционных» ИПЯ
- •2.1.2.1. УДК как представитель ИПЯ иерархического типа
- •2.1.2.2. ИПЯ алфавитно-предметных рубрик
- •2.1.2.3. ИПЯ библиографических описаний
- •2.1.3. Режимы индексирования
- •2.1.4. Координатное индексирование на основе дескрипторных языков
- •2.1.4.1. Избыточное индексирование
- •2.1.4.2. Критерии выдачи и стратегия поиска по запросу
- •2.1.6. Автоматизация процесса индексирования
- •2.1.6.1. Индексирование в АИПС «Пусто — Непусто»
- •2.1.6.2. Индексирование в ИПС «Артефакт»
- •2.1.6.3. Индексирование в поисковой машине «Яндекс»
- •2.2. БИБЛИОГРАФИЧЕСКОЕ ОПИСАНИЕ
- •2.3. АННОТИРОВАНИЕ И РЕФЕРИРОВАНИЕ
- •2.3.1. Функции аннотаций и рефератов
- •2.3.2. Способы раскрытия содержания текстов
- •Пример аннотативной фразы:
- •Пример реферативной фразы:
- •Пример типичной аннотации:
- •2.3.4. Виды аннотаций и рефератов
- •2.4. КОНСПЕКТИРОВАНИЕ КАК РАЗНОВИДНОСТЬ РЕФЕРИРОВАНИЯ
- •2.5.1. Генезис и сущность концептографического обслуживания
- •2.5.2. Виды концептографического обслуживания
- •2.5.3. Обзорно-аналитическая деятельность
- •2.5.3.1. Виды обзоров
- •2.5.3.2. Функции обзоров в системе научных коммуникаций
- •2.5.4. Основы методики написания обзоров
- •Глава 3. НЕКОТОРЫЕ ХАРАКТЕРИСТИКИ ТЕКСТА С ТОЧКИ ЗРЕНИЯ ЕГО СВЕРТЫВАНИЯ
- •3.1. ТЕКСТ И ЕГО ОБЩАЯ ХАРАКТЕРИСТИКА
- •3.2. СТРУКТУРЫ ТЕКСТА
- •3.2.1. Синтаксическая структура текста
- •3.2.1.1. О связности текста
- •3.2.1.2. Средства внутритекстовой связности
- •Разновидности коннекторов
- •3.2.2. Коммуникативная структура текста
- •Пример
- •Пример
- •Пример
- •3.2.3. Аспектная структура текста
- •3.2.4. Семантическая структура текста
- •3.2.5. Информативная структура текста
- •4.1. ВИДЫ И СРЕДСТВА ФОРМАЛИЗОВАННОГО СВЕРТЫВАНИЯ
- •4.2. ФРАГМЕНТИРОВАНИЕ КАК ОДНО ИЗ НАПРАВЛЕНИЙ ИНФОРМАТИВНОГО СВЕРТЫВАНИЯ
- •4.2.1 • Подходы к реализации идеи фрагментирования
- •4.2.1.1. Семантический подход к проблеме фрагментирования
- •4.2.1.2. Синтаксический подход к проблеме фрагментирования
- •5.1. КВАЗИХРЕСТОМАТИЯ КАК ПОСОБИЕ ДЛЯ САМООБРАЗОВАНИЯ
- •5.1.1. О познавательной профессиональной потребности
- •5.1.2. Лексический аппарат формирования квазихрестоматии
- •5.2. ЭТАПЫ СОЗДАНИЯ КВАЗИХРЕСТОМАТИИ
- •5.2.1 • Формирование запроса и составление учебной программы (оглавления)
- •5.2.2. Составление поискового предписания и процедура поиска
- •5.2.3. Формирование и оформление хрестоматии
- •5.2.4. Пример подготовки квазихрестоматии
- •(AлБ)v[(BvИvKvЛ)л(ГvДvE)]v(BлЖ)v(BлЗ)
- •Глава 6. РАЗВИТИЕ ИНДИКАТОРНОГО МЕТОДА КОМПЬЮТЕРНОГО СВЕРТЫВАНИЯ ТЕКСТОВ
- •6.1. СРЕДСТВА И МЕТОДЫ ФОРМАЛИЗОВАННОГО СВЕРТЫВАНИЯ
- •6.2. ТЕХНОЛОГИЧЕСКАЯ ДОКУМЕНТАЦИЯ, ОБЕСПЕЧИВАЮЩАЯ ИЗБИРАТЕЛЬНОЕ СВЕРТЫВАНИЕ ТЕКСТОВ
- •6.3. ЭТАПЫ ФОРМИРОВАНИЯ ВТОРИЧНЫХ ДОКУМЕНТОВ
- •6.3.1. Формирование аннотаций и рефератов
- •6.3.2. Формирование минимальных релевантных фрагментов
- •6.3.3. Формирование квазиконспекта
- •РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА
- •Вопросы для самопроверки
- •ПОСЛЕСЛОВИЕ
- •ОГЛАВЛЕНИЕ
онного обслуживания —документальной и фактографической — со всеми вытекающими из этого требованиями к их содержанию. Отсюда и несколько, быть может, нетрадиционный вывод: по некоторым рефе ратам можно иногда составить представление о содержании всего доку мента, в то время как аннотация должна обеспечить такое представле ние *
Итак, аннотации и рефераты — представители различных рядов вторичных документов, выполняют и различные функции в информа ционном процессе: первые, как уже указывалось в разделе 1.3, служат для ориентации потребителей информации в документальных потоках (выполняют сигнальные функции), вторые — для ориентации в инфор мационных потоках (познавательные функции). Это основные функ ции; есть и дополнительные: поисковые (определение местонахожде ния документов, о существовании которых потребителю информации известно на основе формальных признаков, приписанных искомым до кументам), коммуникативные (осведомление потребителя о существо вании документов, содержание которых представляет для него инте рес), оценочные (оценка содержательного соответствия между доку ментом и читателем и рекомендация данного документа тому или иному читателю).
2.3.2. Способы раскрытия содержания текстов
Переходя к вопросу о способах раскрытия содержания текстов в процессе свертывания, следует иметь в виду, что развитие этих спосо бов шло в основном в двух направлениях.
Одно из них, традиционно развиваемое библиографией, предусмат ривало поиски более совершенных способов «ручного» (интеллекту-
* Этот нетрадиционный вывод противоречит прежде всего основным положениям, сформулированным в библиографической литературе, в которой аннотация почти нико гда нс рассматривается как самостоятельный вторичный документ, а лишь как важней шая часть библиографической записи, дополняющая библиографическое описание теми сведениями, которые необходимы в пособии именно данного назначения. В этих услови ях аннотация вовсе нс всегда раскрывает (полностью) содержание документа (например, в указателях произведений того или иного автора, классиков художественной литерату ры и др.). Наличие в ней тех или иных элементов связано с видом пособия (рекоменда тельное или научно-вспомогательное) и его целями, а также с принципами отбора мате риала и структурой пособия. Мы рассматриваем аннотацию с точки зрения дедуктивно построенной «идеальной» модели, которая постоянно находится под влиянием факторов внешней среды, се «деформирующих»: вид пособия, его целевое и читательское назначе ние, принципы отбора и многое другое. Вопрос заключается не в том, всегда ли должна аннотация полноценно осведомлять о существовании произведений печати, а в том, на сколько реальная аннотация адекватна «деформирующим» ее факторам.
алыюго) свертывания. В русле этого направления возникли анкетные (или аспектные) методы реферирования и аннотирования, предусмат ривающие членение первоисточника на определенные содержательные аспекты типа: цель работы, методы и конкретные результаты, выводы, рекомендации, область применения, место и время проведения иссле дований и т. п. На основе такого членения предложены многочислен ные аспектные сетки, как универсального и отраслевого характера, так и рассчитанные на различные типы и виды документов (подробнее об этом см. в главе 3). В некоторых методиках, основанных на использова нии аспектных сеток, указывается важность тех или иных аспектов для включения их во вторичный документ, иногда — примерный уровень свертывания. Иными словами, были сделаны попытки создания моде лей вторичных документов для различных отраслей знания.
Применение анкетных методов свертывания в определенной степе ни повысило качество вторичных документов. Положенный в их осно ву принцип анализа первоисточников оказался плодотворным и для разработки более совершенных формализованных методик свертывания.
Недостатком этих методов является, с одной стороны, неизменное обращение в них к интуиции референта с требованием выделить в пер воисточнике «существенную информацию» —без указания, что такое существенная информация и как ее выделять, с другой,— стремление сделать методики (и сетки) как можно более детальными. Последнее на практике наталкивается на постоянное сопротивление референтов: слишком детальные методики значительно усложняют процесс рефе рирования. В этой связи уместно привести мнение Д. Г. Лахути, кото рый обращал внимание на то, что ручное индексирование с его потен циальными преимуществами в плане точности и глубины анализа текс та возможно разве что в лабораторных условиях, тогда как в реальной ситуации оно является сильно упрощенным алгоритмическим процес сом, только выполняемым людьми, т. е. устройствами, плохо приспо собленными для алгоритмической работы *.
Другое направление в свертывании, развиваемое в эти годы преиму щественно в сфере информатики, предусматривает разработку форма лизованных методов анализа содержания документов. В основе этого направления лежат попытки изыскания в плане выражения текстов (в его лексике, грамматике, логической структуре и т. н.) элементов, через которые можно было бы выразить план содержания данного текста, т. е.
* Лахути Д. Г., Рубашкин В. Ш. Средства совершенствования информационной тех нологии АНИС «Скобки-СПТ» / / Вопр. информ. технологии первой очереди ГАСНТИ: Тез. докл. 16-го Всесоюз. семинара «Системные исследования ГАСНТИ». Ч. 11.— М., 1987.- С. 15-16.
его семантику. Важность развития формализованных методов объяс няется тем, что они открывают перспективы широкого внедрения в процессы аналитико-синтетической переработки информации элек тронно-вычислительной техники, а это дает возможность перевести не которые виды свертывания «на рельсы» машинной технологии со свой ственными ей преимуществами и недостатками.
С этой целью в информатике и библиографии предлагаются более «жесткие» алгоритмы (избирательное свертывание текстов), где для каждого типа и жанра документа предлагается своя процедура сверты вания. В результате достигается не только боолыная последователь ность, но и экономичность свертывания в том смысле, что в «свертке» отражаются те элементы формальной и содержательной структуры ис ходного текста, которые играют активную роль в: процессе информаци онного поиска.
Параллельно с разработкой алгоритмов, регламентирующий дея тельность человека в процессах свертывания, велась и ведется работа но автоматизации индексирования, реферирования и аннотирования. Работы в первом направлении вышли на уровень «промышленной экс плуатации» уже в 1970 г., когда впервые в мире, как уже указывалось выше, во ВНИИ Информэлектро был применен метод пословного ав томатического индексирования.
2.3.3.Логико-грамматический (формализованный) подход к различению аннотаций и рефератов
К числу постоянно «тлеющих» проблем аннотирования и рефериро вания относится также проблема различения аннотаций и рефератов. Интуитивно все вроде бы достаточно четко различают эти виды вто ричных документов: в одних, мол, что, в других —о чем. Но когда дело доходит до отнесения конкретного вторичного документа к тому или иному виду, единомыслие далеко не всегда наблюдается. Не случайно даже в инструкциях для референтов в качестве примера реферата при водятся иногда реферативные аннотации. Или, к примеру, к какой раз новидности вторичных документов следует отнести такие записи?
Патентуется состав проявителя для электрографии. Для уменьше ния степени загрязнения чувствительного элемента тонером предлага ется добавлять в проявитель непигментированные частицы в количе стве до 10 % по весу. Предлагаются различные вещества для использова ния в качестве добавки.
В работе на основе изучения функционирования ИПС HUNDRED (Япония) делается вывод, что специалист, осуществляющий поиск, дол
жен обладать знаниями обуправлении конкретной базой данных в опре деленной ИПС.
Ультразвуковая сварочная установка снабжена контрольным уст ройством, которое обнаруживает негодные сварки и другие механичес кие неисправности в самой установке.
Даже опытные библиографы, которым показывались эти взятые на угад из реферативных журналов вторичные документы, не давали сразу однозначного ответа. Но в практике встречаются не столь элементар ные примеры. Неразличение этих видов вторичных документов при формировании вторичных потоков снижает уровень информативности этих потоков, а следовательно, и качество информационного обслужи вания.
Предлагаемый логико-грамматический подход к исследованию вто ричного потока с точки зрения выделения в нем аннотаций, рефератов и реферативных аннотаций основывается па совместном дополнении методов логического и грамматического анализов текстов.
Логический (содержательный) анализ предполагает выделение в предложении субъекта мысли (S) и предиката мысли (Р), а на уровне текста —текстового субъекта и текстового предиката.
Фразы, содержащие в своем составе лишь субъект мысли, называ ются аниотативными; имеющие в своем составе как субъект, так и пре дикат мысли,—реферативными.
Пример аннотативной фразы:
Описываются основные принципы построения Десятичной класси фикации Дьюи (ДК), ее эволюция, преимущества, недостатки.
Пример реферативной фразы:
Основным преимуществом системы РАМ-2 является возможность дополнения сведений путем съемки новых данных на свободные участки микрофиши.
Здесь в качестве предиката мысли выступает часть фразы, начинаю щаяся с глагола является.
В качестве текстового субъекта часто могут выступать заголовки, подзаголовки текста и т. п., тогда весь следующий за заголовком текст можно рассматривать как текстовой предикат. Так, аинотативпая фра за, отражающая тему того или иного содержательного аспекта докумен та, также может фигурировать как текстовой субъект, а описание соот ветствующего аспекта в первоисточнике —как текстовой предикат.
Аннотативиые фразы относятся к метаинформации, большая часть реферативных фраз —к «собственно» информации.