- •Блюменау Д. И.
- •ВВЕДЕНИЕ
- •Глава 1. СВЕРТЫВАНИЕ ИНФОРМАЦИИ КАК ОДНО ИЗ УСЛОВИЙ ЧЕЛОВЕЧЕСКОГО ОБЩЕНИЯ
- •1.1.0 СУЩНОСТИ «СВЕРТЫВАНИЯ»
- •1.2. ИНФОРМАЦИОННОЕ СВЕРТЫВАНИЕ
- •1.3. СВЕРТЫВАНИЕ В СФЕРЕ ИНФОРМАЦИОННОГО ОБСЛУЖИВАНИЯ
- •2.1. ИНДЕКСИРОВАНИЕ
- •2.1.1. Индексирование — его назначение
- •2.1.2. Индексирование на основе «традиционных» ИПЯ
- •2.1.2.1. УДК как представитель ИПЯ иерархического типа
- •2.1.2.2. ИПЯ алфавитно-предметных рубрик
- •2.1.2.3. ИПЯ библиографических описаний
- •2.1.3. Режимы индексирования
- •2.1.4. Координатное индексирование на основе дескрипторных языков
- •2.1.4.1. Избыточное индексирование
- •2.1.4.2. Критерии выдачи и стратегия поиска по запросу
- •2.1.6. Автоматизация процесса индексирования
- •2.1.6.1. Индексирование в АИПС «Пусто — Непусто»
- •2.1.6.2. Индексирование в ИПС «Артефакт»
- •2.1.6.3. Индексирование в поисковой машине «Яндекс»
- •2.2. БИБЛИОГРАФИЧЕСКОЕ ОПИСАНИЕ
- •2.3. АННОТИРОВАНИЕ И РЕФЕРИРОВАНИЕ
- •2.3.1. Функции аннотаций и рефератов
- •2.3.2. Способы раскрытия содержания текстов
- •Пример аннотативной фразы:
- •Пример реферативной фразы:
- •Пример типичной аннотации:
- •2.3.4. Виды аннотаций и рефератов
- •2.4. КОНСПЕКТИРОВАНИЕ КАК РАЗНОВИДНОСТЬ РЕФЕРИРОВАНИЯ
- •2.5.1. Генезис и сущность концептографического обслуживания
- •2.5.2. Виды концептографического обслуживания
- •2.5.3. Обзорно-аналитическая деятельность
- •2.5.3.1. Виды обзоров
- •2.5.3.2. Функции обзоров в системе научных коммуникаций
- •2.5.4. Основы методики написания обзоров
- •Глава 3. НЕКОТОРЫЕ ХАРАКТЕРИСТИКИ ТЕКСТА С ТОЧКИ ЗРЕНИЯ ЕГО СВЕРТЫВАНИЯ
- •3.1. ТЕКСТ И ЕГО ОБЩАЯ ХАРАКТЕРИСТИКА
- •3.2. СТРУКТУРЫ ТЕКСТА
- •3.2.1. Синтаксическая структура текста
- •3.2.1.1. О связности текста
- •3.2.1.2. Средства внутритекстовой связности
- •Разновидности коннекторов
- •3.2.2. Коммуникативная структура текста
- •Пример
- •Пример
- •Пример
- •3.2.3. Аспектная структура текста
- •3.2.4. Семантическая структура текста
- •3.2.5. Информативная структура текста
- •4.1. ВИДЫ И СРЕДСТВА ФОРМАЛИЗОВАННОГО СВЕРТЫВАНИЯ
- •4.2. ФРАГМЕНТИРОВАНИЕ КАК ОДНО ИЗ НАПРАВЛЕНИЙ ИНФОРМАТИВНОГО СВЕРТЫВАНИЯ
- •4.2.1 • Подходы к реализации идеи фрагментирования
- •4.2.1.1. Семантический подход к проблеме фрагментирования
- •4.2.1.2. Синтаксический подход к проблеме фрагментирования
- •5.1. КВАЗИХРЕСТОМАТИЯ КАК ПОСОБИЕ ДЛЯ САМООБРАЗОВАНИЯ
- •5.1.1. О познавательной профессиональной потребности
- •5.1.2. Лексический аппарат формирования квазихрестоматии
- •5.2. ЭТАПЫ СОЗДАНИЯ КВАЗИХРЕСТОМАТИИ
- •5.2.1 • Формирование запроса и составление учебной программы (оглавления)
- •5.2.2. Составление поискового предписания и процедура поиска
- •5.2.3. Формирование и оформление хрестоматии
- •5.2.4. Пример подготовки квазихрестоматии
- •(AлБ)v[(BvИvKvЛ)л(ГvДvE)]v(BлЖ)v(BлЗ)
- •Глава 6. РАЗВИТИЕ ИНДИКАТОРНОГО МЕТОДА КОМПЬЮТЕРНОГО СВЕРТЫВАНИЯ ТЕКСТОВ
- •6.1. СРЕДСТВА И МЕТОДЫ ФОРМАЛИЗОВАННОГО СВЕРТЫВАНИЯ
- •6.2. ТЕХНОЛОГИЧЕСКАЯ ДОКУМЕНТАЦИЯ, ОБЕСПЕЧИВАЮЩАЯ ИЗБИРАТЕЛЬНОЕ СВЕРТЫВАНИЕ ТЕКСТОВ
- •6.3. ЭТАПЫ ФОРМИРОВАНИЯ ВТОРИЧНЫХ ДОКУМЕНТОВ
- •6.3.1. Формирование аннотаций и рефератов
- •6.3.2. Формирование минимальных релевантных фрагментов
- •6.3.3. Формирование квазиконспекта
- •РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА
- •Вопросы для самопроверки
- •ПОСЛЕСЛОВИЕ
- •ОГЛАВЛЕНИЕ
1.3. СВЕРТЫВАНИЕ В СФЕРЕ ИНФОРМАЦИОННОГО ОБСЛУЖИВАНИЯ
Свертывание в сфере информационного обслуживания является ча стным случаем информационного свертывания. Специфика лишь в том, что если при информационном свертывании в качестве объекта выступает, как правило, мыслительный образ некоторой непосредст венной реальной (внешней или внутренней) ситуации, то при сверты вании в сфере информационного обслуживания та же ситуация, но опо средованная документом автора (отправителя информации). И в том, и в другом случае порождаются тексты.
Процесс порождения текста представляет собой ступенчатое раз вертывание информации, заключенной в ядре (теме текста), а восприя тие текста, напротив, выведение темы из конкретного текста. Одна и та же тема может быть реализована во многих текстах, которые могут рас сматриваться как парафразы. Два текста считаются изотематическими парафразами, если они выводятся из одной темы и сводимы к ней. Это положение охватывает не только тексты, имеющие одинаковый объем, но и разные объемы (экспресс-информация, резюме и др.), а также и со вершенно различно построенные тексты, в основе которых лежит одна тема.
Видеальном случае задача свертывания текста (документа) должна была бы сводиться к созданию ряда производных текстов (Tj, Т2, Т3), последовательно меньших по объему, чем исходный текст (Тисх), при сохранении их основного содержания: Тисх=> Tj э Т2=эТ3и т. д. Однако такая процедура, к сожалению, далеко не всегда возможна из-за харак тера текста в рамках какого-либо одного типа речи, не говоря уже о сложной (аспектной) структуре документа в целом.
Всфере информационного обслуживания свертывание (разверты вание) информации рассматривается в трех его основных видах — документального (прежде всего библиотечно-библиографического) об служивания, фактографического и коицеитографического. Теоретичес кой базой свертывания (развертывания) в этих сферах информацион ного обслуживания соответственно являются такие, в частности, дис циплины социалыю-коммуникативиого цикла, как библиотековедение
ибиблиографоведение, фактография и концептография.
Свертывание (развертывание) в этих областях информационного обслуживания сводится преимущественно к логико-лингвистическим преобразованиям текста (документа) с целью создания вторичного до кумента. При этом, как уже говорилось, в случае свертывания пресле дуют цель уменьшения физического объема свертываемого документа с
определенной потерей его информативности, а в случае развертыва ния —увеличение физического объема текста с некоторым приращени ем его информативности. В результате свертывания (развертывания) информации в указанных сферах информационного обслуживания об разуются относительно самостоятельные ряды вторичных документов, совокупность которых представляет собой средство, «инструмента рий», с помощью которого тот или иной вид обслуживания может функ ционировать.
Так, в сфере документального, библиотечно-библиографического, обслуживания сформировался ряд, включающий такие вторичные до кументы, как библиографическое описание, аннотация и библиографи ческий обзор. Основная функция этого ряда вторичных документов — ориентация потребителей информации в документальном потоке. Вто ричные документы, выполняющие эту функцию, раскрывают форму и содержание первичных документов с той степенью полноты и деталь ности, которая бы позволила, с одной стороны, достаточно точно иден тифицировать документ в потоке, а с другой,—потенциальному потре бителю информации принять решение о целесообразности обращения к первичному документу.
Задача документов этого ряда (прежде всего аннотации как типич ного представителя) —максимально полно отразить формальные при знаки и тематическое содержание свертываемого документа на основе документографического (библиографического) анализа, подразделяю щегося на учетно-регистрационный и тематический анализы.
Сущность учетно-регистрационного анализа сводится к фиксирова нию формальных признаков, заглавия и других элементов библиогра фического описания, сущность тематического анализа — к описанию главных и второстепенных тем (аннотированию). Последнее заключа ется в выявлении в тексте первичных документов или в формулирова нии на основе их осмысления метаинформативных элементов *
Можно сказать и так: тематический анализ заключается в формули ровании и представлении на необходимом уровне свертывания (обоб щения) субъектных элементов ** текста. Уровень детальности (точнос ти) свертывания определяется размерами аннотируемого документа, его структурой, жанром и практическими соображениями (целевым и читательским назначением), но чаще свертывание в случае тематичес
*О мстаинформации подробнее см. в этом же разделе ниже.
**В качестве субъектных элементов текста могут выступать заглавия ко всему тексту, его разделам, абзацам и даже еще меньшим структурным единицам.
кого анализа производится на уровне, близком к максимальному (макросвертываиие).
В сфере фактографического обслуживания сформировался ряд, включающий такие вторичные документы, как фактографические опи сания (справки, таблицы, статьи в справочниках и энциклопедиях), ре фераты, конспекты, реферативные обзоры и др. Основная функция это го ряда вторичных документов —ориентация потребителей информа ции в информационном потоке (т. е. в некоторой совокупности фактов и концепций в принципе вне связи с конкретными первичными докумен тами). Задача документов этого ряда — максимально точно отразить фактоконцептографическое содержание первичных документов. Сте пень полноты не зависит от размеров и особенностей первичного доку мента, а определяется преимущественно прагматическими соображе ниями, отсюда уровень свертывания в этих вторичных документах мо жет быть нулевым либо близким к минимальному (микросвертывание).
Этот ряд вторичных документов образуется на основе фактографи ческого анализа, сущность которого состоит в исследовании докумен тов с целью извлечения из них фактов и концепций, релевантных чита тельскому назначению подготавливаемого вторичного документа. Фак тографический анализ и синтез охватывают как субъектные, так и предикатные элементы текста.
Указанные ряды вторичных документов на практике часто пересе каются (соответственно пересекаются, дополняя друг друга, и виды анализов). Область пересечения этих рядов заполняют такие виды вто ричных документов, как реферативная аннотация, реферативно-библи ографический обзор и т. п., которые выполняют функции двух рядов одновременно.
Следует также отметить, что если библиографические вторичные документы образуют относительно замкнутый ряд, поскольку их по тенциальное развертывание ограничивается рамками конкретного до кумента, то фактографические вторичные документы таких жестких рамок не имеют и могут при развертывании «переходить» в ряды пер вичных документов (текстов) с большим уровнем информативности.
В сфере концептографического обслуживания, под которым пони мается формулирование и доведение до потребителей ситуативной ин формации, полученной в результате информационно-логического или концентографического анализа некоторой совокупности сообщений, сформировался ряд, включающий такие вторичные документы, как ре комендательные аннотации, «развернутые» рефераты, рецензии, ана литические обзоры и др. Основная функция этого ряда вторичных до кументов —интерпретированная ориентация потребителей в докумен-
талыюм и информационном потоках. При этом под интерпретировани ем понимается в данном случае не только высказывание суждений от носительно анализируемых документов, фактов и концепций, но и раз вертывание —внесение в текст необходимых деталей, уточнений, пояс нений и комментариев, обеспечивающих лучшее его понимание и восприятие.
Документы этого ряда образуются в результате не только докумен тографического или фактографического анализов, но и анализа кон цептографического, предусматривающего исследование (па основе существующего знания) содержащихся в документах фактов и концеп ций с точки зрения их достоверности и истинности, а устройств, спосо бов и материалов —с точки зрения непротиворечия знанию, лежащему в их основе, а также технико-экономической целесообразности, эффек тивности и перспективности.
Особым видом свертывания информации является индексирова ние * —описание содержания и формы сообщений средствами того или иного информационного языка, в результате которого образуется поис ковый образ данного сообщения.
Различают также информативное и метаинформативиое свертыва ние.
Дихотомию «информация —метаинформация», по-видимому, впер вые в сферу информатики ввел Ю. А. Шрейдер (23). Согласно Шрейде ру, к информации относятся элементы текста, в которых отражается ос новное содержание текста и приводятся оригинальные точки зрения па это содержание, к метаинформации — предложения, содержащие све дения о теме и организации данного текста, обеспечивающие доступ к собственно информации, являющиеся ключом к ее пониманию. Таким образом, «метаипформация» употребляется как обозначение информа ции об информации или, точнее, о способе кодирования информации. Метаинформацией в документах (или документальном потоке) будут поисковые индексы, оглавление, справочный аппарат, иногда введение, предисловие, комментарии, уточнения, логическая структура текста, способ организации фонда документов или отдельных фактов, правила «общения» с автоматизированными информационными системами и многое другое. В ряде случаев документ в целом представляет собой ме таинформацию о другом документе (например, библиографическое описание, аннотация, поисковый образ). Реферат (особенно рефератив ные аннотации) содержат в себе как метаинформацию о другом доку менте, так и элементы собственно информации из этого документа. Так,
Подробнее об индексировании см. главу 2.1.
например, в реферативной аннотации из реферативного журнала (РЖ ) «Информатика» заглавие, выходные данные, а также первая и вторая фразы содержат в себе метаинформацию о теме и содержании первич ного документа, о его объеме и месте опубликования, величине нристатейной или нрикиижпой библиографии; третья и четвертая фразы — собственно информацию: в них содержится оценка предлагаемой мето дики.
Пример. 2И227. Станиславская Э. В. Некоторые проблемы исследо вания парадигматики в ИПЯ / / Проблемы оптимизации библиотечно библиографических классификаций— Л.: ЛГИК— С. 168—175.
(1) Одной из основных задач данного исследования является выявле ние зависимости системы парадигматических отношений от целей и за дач, стоящих перед потребителем. (2) Описываются методика и экспе римент, позволившие проверить виды парадигматических отношений, подлежащих фиксированию в ИПЯ, и вскрыть факторы, влияющие на их установление. (3) Положительной стороной предлагаемой методики является простота и документальность, которые исключают трудо емкий процесс создания экспериментальной ИПС. (4) Другой положи тельной чертой является возможность изучения прагматических сооб ражений потребителя, что помогает создать ИПС, гибко реагирующую на изменения информационных потребностей.
Библ. 9.
Следует, однако, учитывать, что каждая собственно информация и каждая метаинформация содержат в себе соответственно элементы метаииформации и информации: на основании отдельных фактов и кон цепций (т. е. информации) первичного документа или реферата можно составить некоторое представление о теме и содержании всего доку мента. И наоборот, констатация в тех или иных метаинформативных элементах текста факта проведения какого-либо исследования, выпус ка изделия, разработки процесса или метода — все суть элементы ин формации, содержащейся в документах.
В каждом документе в зависимости от его целевого и читательского назначения должно быть оптимальное сочетание элементов информа ции и метаииформации. От этого зависит уровень восприятия данного документа, его информативность. В свою очередь в тезаурусе потреби теля также должно соблюдаться определенное соответствие между за пасом информации и метаинформации.
Это соответствие определяется требованиями компетенции, кото рым должен удовлетворять потребитель, относящийся к той или иной научной среде. Если потребитель не удовлетворяет этим требованиям, то в этом случае либо запас его метаииформации недостаточен и он не
сумеет распознать структуру сообщения, взаимосвязи между его эле ментами, т. е. «раскодировать» содержание сообщения, либо априор ный уровень тематических знаний (собственно информации) мал и то гда не произойдет содержательной перестройки тезауруса, т. е. количе ство воспринятой информации опять-таки будет минимальным.
Разделение информации и метаинформации имеет важное методо логическое значение, так как позволяет достаточно четко отделить сфе ру информационной деятельности (как части научно-исследовательс кой) от сферы информационного обслуживания. Если первая имеет де ло с содержательной обработкой научно-технической информации с целью получения новой информации в области своей профессиональ ной деятельности, то вторая занимается кодированием, храпением и распространением этой информации с помощью метаинформации.
Правильное сочетание собственно информации и метаинформации в отдельных текстах и информационных потоках в целом является не обходимым условием для хорошей организации информационного об служивания.
В связи с различением информации и метаинформации выделяются два подхода к свертыванию информации: метаинформативпый и ин формативный. П е р в ы й (метаинформативное свертывание) предпо лагает создание ряда документов, основная цель которых — в той или иной степени раскрыть тему и содержание других документов. Назовем этот ряд библиографическим. К нему отнесем не только традиционные виды вторичных документов —библиографические описания, аннота ции, библиографические обзоры, но и авторефераты диссертаций, пре дисловия и введения к книгам, программы учебных курсов, справочные аппараты изданий и др. Во всех этих документах содержится «инфор мация об информации». Более того, в качестве метаинформативных элементов могут выступать и отдельные фразы текста первичных доку ментов — предваряющие, результирующие, обобщающие определен ные фрагменты данного документа или его в целом. В них также «в сня том виде» содержится «информация об информации» в рассматривае мом контексте или документе.
В т о р о й подход (информативное свертывание) предполагает соз дание ряда документов, основная цель которых —служить непосредст венным источником информации при решении определенных задач. Назовем этот ряд фактографическим. Он может включать в себя как первичные, гак и вторичные документы различного уровня свертыва ния. Так, ряд фактографических первичных документов образует, на пример, цепочки: отчет, статья, краткие сообщения, информационный листок; фактографический ряд вторичных документов —рефераты ти
на экспресс-информация, информативные рефераты типа РЖ ВИНИТИ, самостоятельные фрагменты текстов, цитаты, фактографические справ ки, реферативные обзоры и другие документы, использование которых, как правило, не вызывает для определенной категории потребителей информации необходимости обращения к первоисточнику.
Таким образом, представляется возможным говорить о двух видах свертывания: научном, в ходе которого порождаются новые единицы знания, и информационном, связанном с текстовыми преобразования ми. Информационное свертывание в свою очередь разделяется на свер тывание семантическое, сопровождающееся изменением информатив ности текста, и лексическое, сопровождающееся преобразованиями в плане выражения без изменения плана содержания.
Информационные виды свертывания используются в различных сферах информационного обслуживания при создании (и редактирова нии) как первичных, так и вторичных документов. При этом можно го ворить об информационном свертывании (развертывании) как опера ции, лежащей в основе создания и редактирования первичных доку ментов, о метаинформативном и информативном свертывании как операциях, лежащих в основе подготовки вторичных документов соот ветственно в сфере документального и фактографического обслужива ния, наконец, об информативном и метаинформативном свертывапии/развертываиии, лежащем в основе концептографического обслу живания.
Свертывание можно классифицировать и по ряду других критери ев, например по степени формализации процесса —интуитивное, алго ритмизированное (анкетное в том числе), автоматизированное сверты вание (о чем речь будет идти ниже); по количеству свертываемых доку ментов —отдельных или некоторого множества (к примеру, реферат и реферативный обзор); по глубине (степени) свертывания (библиогра фическое описание, аннотация) и т. д. Однако наиболее важным осно ванием классификации видов свертывания, в результате которого обра зуются относительно самостоятельные параллельные ряды вторичных документов, обеспечивающих функционирование рассмотренных вы ше видов информационного обслуживания, является вид анализа —до кументографический, фактографический и концептографический. Ви ды свертывания и порождаемые на его основе документы приведены в табл. 1.1
Таблица 1.1
Виды свертывания и порождаемые на его основе документы
Сфера |
Сфера информационного обслуживания |
|||
информационной |
Документальное |
Фактографическое |
Концептографическое |
|
деятельности |
||||
обслуживание |
обслуживание |
обслуживание |
||
|
||||
Методы книгове |
Методы библио- |
Методы факто |
Методы концепто- |
|
дения (редакти |
графоведения и |
графии |
графии |
|
рования) |
библиотековеде |
|
|
|
|
ния |
|
|
|
Видыдокументов, создаваемых в результате свертывания |
||||
Создание и |
Библиографиче |
Фактографиче |
Рекомендательные |
|
оформление раз |
ское описание |
ские справки |
аннотации |
|
личных видов |
Аннотации |
Рефераты |
«Развернутые» ре |
|
первичных доку |
(справочные и |
Экспресс-инфор |
фераты |
|
ментов в зависи |
реферативные) |
мация |
Рецензии |
|
мости от их целе |
Библиографиче |
Реферативные |
Аналитические обзо |
|
вого и читательс |
ские обзоры |
обзоры |
ры |
|
кого назначения |
Классификаци |
Конспекты |
Критические биб |
|
|
онные индексы |
Сопоставитель |
лиографические об |
|
|
Предметные |
ные таблицы |
зоры и др! |
|
|
рубрики |
Фрагменты |
|
|
Функциональное назначение документов |
|
|||
Обеспечение ин |
Идентификация |
Ориентация в ин Интерпрстирован- |
||
формационных |
произведений пе формационном |
пая ориентация в до |
||
коммуникаций |
чати и ориента |
потоке |
кументальных и ин |
|
|
ция вдокумен |
|
формационных по |
|
|
тальном потоке |
|
токах |
|
Преимущественные виды свертывания |
|
|||
Информацион |
Мстаииформаци- |
Информацион |
Информационное и |
|
ное свертывание |
оннос свертыва |
ное свертывание |
мстаииформациои- |
|
(развертывание) |
ние |
|
нос свертывание |
|
|
|
|
(развертывание) |
Глава 2. ВИДЫ ИНФОРМАЦИОННОГО АНАЛИЗА И СИНТЕЗА (ВИДЫ АНАЛИТИКО-СИНТЕТИЧЕСКОЙ ПЕРЕРАБОТКИ ИНФОРМАЦИИ)
Различают обычно шесть основных разновидностей информацион ного свертывания — индексирование, библиографическое описание, аннотирование, реферирование (с фрагментированием), конспектиро вание и обзорно-аналитическая деятельность.
В учебном пособии последовательно рассматривается каждая из этих разновидностей аналитико-синтетической переработки информа ции. Однако прежде чем перейти к такому рассмотрению, представля ется целесообразным предварительно ознакомиться с изложением не которых положений структурной лингвистики, которые заимствованы информатикой из этой области знания. Эти положения приведены в Приложении 6.
Каждый из видов свертывания, в результате которого образуются функционально самостоятельные ряды вторичных документов, отли чается своим функциональным назначением, уровнем свертывания, применяемыми методами информационного анализа/синтеза. Однако все их объединяет единый принцип, сформулированный в «золотом правиле» коммуникации — эффективное общение возможно лишь па оптимальном уровне свертывания. Эта оптимальность в значительной степени определяется как особенностями свертываемого первичного источника, так целевым и читательским назначением вторичного доку мента, однако прежде всего — знаниями и опытом работы референта, независимо от того, осуществляет ли он интеллектуальное («ручное») или машинное (компьютерное) свертывание.