Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Основы реферирования.doc
Скачиваний:
90
Добавлен:
09.06.2015
Размер:
6.12 Mб
Скачать

8. Свёртывание информации

В науке мы постоянно сталкиваемся с различными «свёртками» и «сгустками» информации. Это законы, теоремы, постулаты и прочие формы сконцентрированных знаний, являющиеся результатом обобщения («свёртывания») иногда огромного фактического материала.

Под свёртыванием (развёртыванием) информации понимается изменение физического объёма документа в результате аналитико-синтетической переработки, сопровождающееся уменьшением (увеличением) его информативности.

Подобно анализу и синтезу, свёртывание и развёртывание информации - это взаимозависимые и взаимопереходящие операции. Логично предположить, что эти операции в научной деятельности являются отражением процессов и явлений, наблюдаемых в природе: ассимиляция и диссимиляция, соединение атомов и их диссоциация и т. п. Поэтому обычно, употребляя понятие «свёртывание», подразумевают и «развёртывание». Можно предположить, что вся эволюция - это последовательное чередование свёртывания и развёртывания, с которыми человечество столкнулось на самых ранних этапах развития цивилизации. В попытках коротко и ясно выражать свои мысли часто для обозначения одной и той же сущности употребляют различные термины: «сжатие», «уплотнение», «компрессия», «конденсация», «кумуляция», «минимизация», «упрощение».... Эти синонимические варианты не все полностью идентичны понятию «свёртывание».

В монографии [15] разновидности свёртывания представлены в виде следующей схемы (см. рис.1).

Из схемы видно, что свёртывание подразделяется на научное и инф ор м ационно е.

Кратко остановимся на научном свёртывании. Известно, что в развитии знания как системы наблюдается тенденция не только к увеличению его количества, но и к относительному уменьшению этого количества за счёт повышения информационной ёмкости научных сведений. Этот процесс называют уплотнением знания, он приводит к порождению новых семантических единиц, понятий, теорий, законов, принципов и др. Научное свёртывание связано с качественной стороной роста количества знаний, в отличие от количественной стороны этого роста, обусловливающего увеличение фактуального фонда знаний, что характерно для экстенсивного пути развития науки. «Экспликация» (в случае развёртывания) этих

113

семантических единиц, полученных в одной какой-либо области знаний, распространяется на другие области.

Свёртывание

Научное

свёртывание

(развёртывание)

Ин формационное

свёртывание

(развёртывание)

Уплотнение знаний

« Экспликация»

Семантическое

Лексическое

в языке

в речи

отпущением

совме­щением

обобщением

переводом в иную систему понятий

заме­щением

Пере­водом в иную знаковую систему

Рис 1. Разновидности свёртывания

Устранение недостоверных фактов и ошибочных концепций (в результате практической деятельности в форме критических статей, рецензий, аналитических обзоров, научных дискуссий и т. п.) приводит к уменьшению объёма активного фонда науки, которое понимается как конденсация знаний. Если явление уплотнения знаний развивается преимущественно в недрах системы знаний, то конденсация знаний в значительной своей части протекает в системе научных коммуникаций, составляя основу концептографического информационного обслуживания.

8.1. Виды информационного свёртывания

Свёртывание (развёртывание) в сфере информационных коммуникаций рассматривается как информационное свёртывание, которое может быть семантическим и лексическим. Семантическое свёртывание связано с изменением информативности сообщения. Семантическое свёртывание в

114

языке - это стихийный процесс терминообразования, в ходе которого возникают понятия более краткие, чем нх синонимические предшественники. Например, электронно-вычислительная машина и компьютер. Семантическое свёртывание в речи связано или с изменением информативности путём обобщения или опущения некоторых деталей, подробностей, уточнений (случай 1), или с изменением информативности путём перевода в иную систему понятий (случай 2). Примером высокого уровня обобщения больших фрагментов текстов могут служить заголовки н подзаголовки в документах, фразы в аннотациях, тезисы к докладам н т. д. Пример свёртывания в случае 2:

Синонимы - снова, отличающиеся друг от друга звуковой формой, стилистической окраской, но совпадающие, сходные или очень близкие по значению, выражающие одно и то же понятие.

Синонимы -разные знаки, имеющие общий денотат.

При лексическом свёртывании производится преобразование знаковой формы сообщения с сохранением его информативности. Здесь необходимо сделать два уточнения. 1). Преобразование знаковой формы, дающее эффект сокращения числа используемых символов, может повысить ёмкость знания, что связано с семантическим свёртыванием. 2). В отдельных случаях в результате лексического свёртывания информативность может даже возрастать за счёт повышения «читабельности» текста (путём опущения неинформативных, паразитных слов, упрощения синтаксической конструкции и т. п.).

Различают следующие способы лексического свёртывания (с сохранением информации в полном объёме):

  • Опущение (исключение, отбрасывание) - пропуск слова или словосочетания без ущерба для смыслового содержания текста реферата. Пропуску подлежат сведения аргументирующего характера, поясняющие н иллюстрирующие основные положения первичного документа. Пропуску подлежат также слова типа «данная статья», «настоящая работа», «итак», «таким образом», «следовательно», «например», «в частности», «в том числе», «при этом» и т. п. (Пример: В котором часу начинается лекция ? — В первом);

  • Совмещение - операция, при которой два или несколько предложений, содержащих совпадающие (тождественные) элементы, накладываются друг на друга, образуя более короткую конструкцию, где тождественные компоненты называются только один раз. При этом все связи с нетождественными частями совмещённых предложений сохраняются.

  • Замещение - замена повторяющегося или неповторяющегося фрагмента текста (предложения, его части, словосочетания) более коротким, с сохранением в последнем необходимого уровня смысла первого (например, замена местоимением слова или выражения, применение более коротких синонимичных вариантов). Замещение обеспечивает ясность и понятность текста. Эта операция используется также в случаях, когда экстрагированное

115

предложение содержит слова типа «эти», «такие», «подобный», «вышеприведённый», «рассмотренный ранее» и т. п. Их значение следует непременно раскрыть, сделав «шаг назад» (то есть отыскать в тексте первичного документа соответствующий этим словам фрагмент). Рассматриваемый приём используется также и в том случае, когда маркированное предложение, включённое в реферат-экстракт, содержит сокращения или аббревиатуры, смысл которых может быть неясен читателю.

На этапе редактирования реферата могут использоваться одновременно все операции, то есть опущение, совмещение и замещение.

Таблица 11

Использование операций опущения, замещения и совмещения при

редактировании предложений, подлежащих включению в реферат [1]

Предложения, включенные в реферат-экстракт

Неправильно

Правильно

1

2

ЗАМЕЩЕНИЕ

Проанализируем опыт работы с базами ВИНИТИ

Анализируется опыт работы с базами данных ВИНИТИ

Методика рассчитана на отработку навыков управления самолетом при СМУ

Методика рассчитана на отработку навыков управления самолётом при сложных метеорологических условиях

ОПУЩЕНИЕ

В данной работе предлагается количественный метод оценки информативности научных документов

Предлагается количественный метод оценки информативности научных документов

Таким образом, эксперимент, описанный в данной статье, показал, что больше половины информации, содержащейся в научных книгах, нельзя выявить из-за ограниченных поисковых возможностей каталогов

Эксперимент показал, что больше половины информации, содержащейся в научных книгах, нельзя выявить из-за ограниченных поисковых каталогов

ЗАМЕЩЕНИЕ + ОПУЩЕНИЕ

Нами будут рассмотрены роль и место персональных ЭВМ в информационно - библиотечной технологии

Рассматривается роль и место персональных ЭВМ в информационно - библиотечной технологии

СОВМЕЩЕНИЕ

116

Предпринята попытка оценить творческую активность сотрудников НИИ, При этом, в качестве показателя творческой активности сотрудников НИИ использовалось отношение числа оригинальных публикаций к суммарному числу оригинальных и повторных публикаций

Предпринята попытка оценить творческую активность сотрудников НИИ, использовав в качестве её показателя отношение числа оригинальных публикаций к суммарному числу оригинальных и повторных публикаций

ЗАМЕЩЕНИЕ + ОПУЩЕНИЕ + СОВМЕЩЕНИЕ

В данной стать е авторы описывают способ раскроя круглого леса на доски резанием. Предлагаемый способ раскроя резанием отличается тем, что подлежащее раскрою бревно подают на неподвижный нож со скоростью, превышающей скорость расщепления древесины

Описывается способ раскроя круглого леса на доски резанием, при котором подлежащее раскрою бревно подают на неподвижный нож со скоростью, превышающей скорость расщепления древесины

К этим видам лексического свёртывания можно также добавить применение аббревиатур, условных сокращений и пр. Возможно, в качестве одной из форм лексического свёртывания можно рассматривать употребление метафор, но для научно-технической литературы этот приём не представляет большого интереса.

В общем случае информационное свёртывание направлено на экономию смысла и языковых средств, но при этом текст не просто сокращается, а «сворачивается», причём так, чтобы затем его можно было бы снова развернуть (на основе сохранённых «смысловых вех», «опорных пунктов», «следов»). Содержащаяся в квалифицированном реферате информация должна позволить потенциальному потребителю настолько развернуть в своём тезаурусе информацию, чтобы принять на этой основе правильное решение по вопросу использования первоисточника. Поэтому качество свёртывания определяется, главным образом, тем, насколько оно богато потенциальными возможностями развёртывания.

При свёртывании (развёртывании) документа мы получаем новый документ (в общем случае вторичный). Операция «свёртывание информации» при этом может быть не единственной операцией аналитико-синтетической переработки документа наряду с дословным извлечением (или опущением), сокращением или, наоборот, добавлением фраз (или фрагментов), изменением логической структуры документа и т. д. Например, при свёртывании документа из него могут быть извлечены отдельные фрагменты на «нулевом» уровне свёртывания информации. Нулевой уровень

117

свёртывания документа, видимо, невозможен (если не считать перевод документа, то есть преобразование его в иную знаковую систему).

8.2. Способы раскрытия содержания текста в процессе свёртывания

Развитие способов раскрытия содержания текстов в процессе свёртывания шло в основном в двух направлениях.

Первое, традиционно развиваемое библиографией, это поиски более совершенных способов «ручного» (интеллектуального) свёртывания. В русле этого направления возникли аспектные (или анкетные) методы реферирования, предусматривающие разбиение первоисточника на определённые содержательные аспекты. Были предложены многочисленные аспектные сетки (перечни аспектов) как универсального и отраслевого характера, так и рассчитанные на различные типы и виды документов. Примеры таких перечней рассмотрены в главе 7.

В некоторых методиках, основанных на использовании аспектных сеток, указывается важность тех или иных аспектов для включения их во вторичный документ, иногда - примерный уровень свёртывания. Иными словами, были сделаны попытки создания моделей вторичных документов для различных отраслей знания.

Применение аспектных методов свёртывания повысило качество вторичных документов. Положенный в их основу принцип анализа первоисточника оказался плодотворным и для разработки более совершенных формализованных методик свёртывания.

Однако эти методы имеют свои недостатки. С одной стороны в них имеет место постоянное обращение к интуиции референта с требованием выделить в первоисточнике «существенную информацию» - без разъяснения, что же это такое «существенная информация» и без каких-либо указаний на то, как её выделять. С другой стороны, наблюдается стремление сделать методики (и перечни аспектов) как можно более детальными, что постоянно наталкивается на сопротивление референтов, так как слишком детальные методики значительно усложняют процесс реферирования.

Другое направление в свёртывании, развиваемое в настоящее время преимущественно в сфере информатики, предусматривает разработку формализованных методов анализа содержания документов. В основе этого направления лежат попытки изыскания в плане выражения текстов (в его лексике, грамматике, логической структуре и т. п.) элементов, через которые можно было бы выразить план содержания данного текста, то есть его семантику. Эти методы открывают перспективы широкого внедрения в процессы аналитико-синтетической переработки информации электронно-вычислительной техники, что даёт возможность перевести некоторые виды

118

свёртывания «на рельсы» машинной технологии. Поэтому предлагаются более «жёсткие» алгоритмы (избирательное свёртывание текстов), в которых для каждого типа и жанра документа указывается своя процедура свёртывания. В результате в «свёртке» отражаются те элементы формальной и содержательной структуры исходного текста, которые играют активную роль в процессе информационного поиска.

Параллельно с разработкой алгоритмов, регламентирующих деятельность человека в процессах свёртывания, ведётся работа по автоматизации реферирования и аннотирования. Работы по автоматическому индексированию вышли на уровень «промышленной эксплуатации» уже в 1970 г., когда впервые в мире был применён метод пословного автоматического индексирования.