Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
3280.pdf
Скачиваний:
25
Добавлен:
15.11.2022
Размер:
17.07 Mб
Скачать

Глава 3. НЕКОТОРЫЕ ХАРАКТЕРИСТИКИ ТЕКСТА С ТОЧКИ ЗРЕНИЯ ЕГО СВЕРТЫВАНИЯ

В качестве объекта свертывания в нашем пособии выступают преж­ де всего, научно-технические тексты. Качественные характеристики текстов, их структура определяют специфические требования к сверты­ ванию, в результате которого образуются также тексты.

Вплоть до 60-х годов прошлого столетия для аналитико-синтетиче­ ской переработки информации характерен был содержательный, каче­ ственный подход к тексту. Документ анализировался преимущественно с точки зрения жанра, целевого и читательского назначения, вида из­ дания, актуальности, оперативности и полноты содержащейся в нем информации. Такой подход был свойствен для библиографического и редакторского отношения к документу (шире —книговедческого). Ин­ терес к тексту как к сложному структурно-многоуровневому и многоп­ лановому явлению возник прежде всего в связи с попытками примене­ ния формализованных (машинных) методов обработки информации (компьютерного индексирования, реферирования, перевода и ир.). Текст стал объектом пристального внимания не только стилистов, ли­ тературоведов, библиотековедов и книговедов, но и лингвистов, психо­ логов, кибернетиков, ииформатиков. Проблематика текста выдвину­ лась на одно из первых мест в языкознании, в рамках которого сформи­ ровалось новое направление —лингвистика текста, поставившая перед собой задачу найти текстообразующие закономерности, присущие всем текстам. Итак, что же понимается под текстом?

3.1. ТЕКСТ И ЕГО ОБЩАЯ ХАРАКТЕРИСТИКА

Как часто бывает, наибольшие трудности возникают при стремле­ нии сформулировать «само собой разумеющиеся» понятия. К таким, вероятно, относится и понятие «текст». Дефиниций «текст», по-види- мому, столько, сколько и авторов, предпринимавших попытки дать это­ му явлению определение. Из широкого спектра дефиниций достаточно привести несколько, лежащих на крайних флангах семиотики, чтобы показать, сколь различны могут быть подходы авторов к формулировке этого понятия.

1. Текст — это знак, обладающий некоторой внутренней структу­ рой. Или: текст — это четверка из словаря t/, множества мест М, набора отношений на этом множестве ср и отображения 0 множества мест в сло­ варе. Символически это записывается следующим образом: Т = [U, М, ср/ - фт, 0/ Так трактуют текст сторонники формализованного подхода

копределению.

2.Текст — это изложенное в письменной или печатной форме логи­ чески стройное и грамматически правильное авторское сочинение или высказывание. Или: последовательность из нескольких (или многих) предложений, построенных согласно правилам языка. Так трактуют текст представители умеренно гуманитарного фланга.

Естественно, что приведенные формулировки «текста» попросту несопоставимы, поскольку являются элементами различных систем, но даже если рассматривать существующие определения понятия «текст» в рамках одной какой-либо системы (логической, семантической, грам­ матической и т. д.), то и здесь обнаружим самое цветистое разнообразие определений.

Не вдаваясь в анализ приведенных выше дефиниций (как и многих других), поскольку авторы в своих определениях исходили из стоящих перед ними задач, мы (также руководствуясь своими задачами) будем придерживаться самого тривиального определения, согласно которому текст —это линейная последовательность знаков, обладающая смыс­ лом. Для того чтобы такая последовательность обладала смыслом, она должна содержать в себе суждение —либо логическое, либо текстовое. По этой причине в качестве текста может выступать как отдельное предложение *, так и их совокупность, в которой одни предложения вы­

* Всякое суждение выражается в предложении, но нс всякое предложение выражает суждение.

ражают предмет речи (текстовой субъект), а другие —информацию об этом предмете (текстовой предикат), (элементы текста II лингвистиче­ ского уровня), сложные синтаксические целые (элементы текста III лингвистического уровня) *.

В качестве элементов линейной последовательности выступают в случае естественных языков слова и устойчивые словосочетания (эле­ менты текста I лингвистического уровня), предложения **

Одним из исходных понятий текста, как известно, является знак. Под знаком будем понимать чувственно воспринимаемый (материаль­ ный) объект, который условно представляет некоторый предмет, явле­ ние, свойство, связь или отношение предметов, явлений и свойств. Ос­ новная его задача —обозначить нечто за пределами языка и дать этому нечто знаковую жизнь. Можно сказать и так: знак —это форма фикса­ ции содержания знания и средство передачи содержания информации. Элементарным знаком считается наименьшая единица языка, имею­ щая значение. Отсюда отдельные буквы алфавита в естественном языке элементарными знаками обычно не являются (если они в свою очередь не являются знаком знака). Элементарный знак — эго прежде всего слово и устойчивое словосочетание. Знаки, составляемые из элемен­ тарных знаков но правилам синтаксиса, образуют тексты.

*Отсюда следует, что не всякая совокупность предложений, в нашем понимании, об­ разует текст, а только такая, в которой одни (одно) предложения выражают предмет речи,

адругие — предикат.

**Понятие «предложение» понимается нами как минимальная целостная единица ре­ чи, обладающая смысловой законченностью. Поскольку единого определения понятия «предложение» не существует, мы под предложением будем понимать прежде всего рече­ вое образование, синонимичное словам «суждение», «высказывание», «фраза». Вообще говоря, предложение, видимо, следует рассматривать в трех аспектах — синтаксическом, семантическом и прагматическом. С точки зрения синтаксиса предложение — это то, что «от точки до точки»; с точки зрения семантики предложение — речевая единица любой протяженности, в рамках которой возможны «разумные» коннскторныс связи. При этом непринципиально, сколько синтаксически понимаемых предложений такое речевое обра­ зование будет включать, важно только, чтобы в смысловом плане это образование пред­ ставляло б ы собой граф с общей вершиной. Наконец, с точки зрения прагматики предло­ жения — такие речевые образования, которые позволяют оптимально воспринимать и ос­ мысливать текст. Из психологии известно, что точка в конце речевого образования — сигнал законченности определенного «кванта» мысли, дающий «команду» для осмысле­ ния данного образования и ввода его в «оперативную память». Текст, правильно (с уче­ том читательского назначения) квантированный в синтаксическом плане, наиболее легко воспринимаем. В противном случае каждый из нас в процессе чтения разбивает интуи­ тивно речевые образования на отрезки-предложения, удобные для собственного воспри­ ятия. Правильно было бы I лингвистическим уровнем считать фонологический (фонети­ ческий) уровень, но в данном пособии его опускаем, поскольку к нему не будем обращаться.

Вербальное выражение знака в естественном языке назовем именем. С точки зрения семантики знак обозначает денотат (нечто за преде­ лами знака) и выражает концепт (то, что мы знаем об этом нечто). Один и тот же денотат может иметь несколько имен (слов) — явление сино­ нимии знаков, с другой стороны, один и тот же знак (слово) может обо­ значать несколько денотатов (омонимия). И в каждом из этих случаев он будет иметь свое значение, свой концепт (см. приложение 6). Итак, знак есть социально признанное единство значения и имени, т. е. плана

содержания и плана выражения (А. В. Соколов *).

Основной характеристикой знака является его з н а ч е н и е **. Зна­ чение знака —это содержание, закрепившееся за ним в определенной лексико-семантической системе языка (результат социального опыта). М. В. Арапов и др. указывают, что все говорящие на данном языке не­ сколько по-разному употребляют слова этого языка. Эти различия оп­ ределяются воспитанием, образовательным цензом, региональными особенностями и другими факторами, однако они (различия) не выхо­ дят за границы некоторой нормы. Эта норма «вариативности» (понима­ ния) может быть различной для отдельных слов, но подразумевает для каждого из них некоторый инвариант употребления (общепринятое значение).

Таким образом, значение знака (слова) определяется употреблени­ ем его в некоторой знаковой системе — языке, и знак может иметь в этой системе несколько значений (например, слово автоматический и как самодействующий, и как машинальный, непроизвольный).

Конкретное значение слово (знак) приобретает в лингвистической системе другого уровня — тексте, высказывании, предложении, т. е. в

*Соколов А. В. Информационно-поисковые системы. - М.: Радио и связь, 1981.—

151 с.

**Проблема «значения и смысла», рассматриваемая здесь, принадлежит к числу древ­ нейших. От античных стоиков через У Оккама к Т. Гоббсу, Г. Фреге, Ч. Пирсу, Р. Карна­ пу, к многочисленным современным исследователям прослеживается путь, на котором непосредственно или попутно затрагивалась эта проблема. Даже очень краткий обзор на эту тему показал бы, что у каждого из авторов свое видение, свое толкование указанных понятий, в большей или меньшей степени пересекающееся, но редко полностью совпа­ дающее: в одних случаях эти понятая вообще не различаются, в других — значение опре­ деляется через смысл, а смысл — через значение, в третьих — значение рассматривается как «общее для всех членов общества знание», а смысл — как личностное отношение ин­ дивида к содержанию слова, в четвертых — смысл характеризует семантику целого вы­ сказывания или текста, а значение — семантику только слова, в пятых — смысл как сово­ купность внеязыковых характеристик суждения, а значение как обобщение его внутри­ языковых характеристик, в шестых... Мы будем придерживаться четвертой точки зрения.

определенной речевой ситуации. Еще Оккам (ок. 1281—1349) указы­ вал, что значение термина всецело определяется его функцией в выска­ зывании. Так, слово вентиль имеет в системе языка (в словаре) несколь­ ко значений (по числу реальных денотатов): как элемент духового инструмента, трубопроводный кран, электрическое устройство и др. Включенное в лингвистическую систему другого уровня (текст) это слово приобретает конкретное значение, определяемое данной речевой ситуацией. Например: Пользуясь вентилем, исполнитель извлекает на­ туральный звукоряд на другой высоте.

В отличие от «значения» «смысл» —семантическая категория иного (II, III) лингвистического уровня. Смысл непосредственно связан с текстом. Выше уже говорилось, что текст —это линейная последова­ тельность знаков, обладающая смыслом, и для этого она должна содер­ жать в себе либо логическое, либо текстовое суждение (субъект и пре­ дикат, или тему и рему). В качестве рабочего примем следующее опре­ деление: смысл —это отражение в нашем сознании содержания связи и отношений между предметами и явлениями реального мира, или отра­ жение содержания мысли. В элементарном виде смысл в речи выража­ ется в виде трехчленной формулы —подлежащего, сказуемого и связ­ ки. Так, выражение Красный дом (Das rote Haus) смыслом не обладает (есть только значение), в выражении Долг красный (Dieses Haus ist rot) смысл содержится. То же можно сказать и о конструкциях более раз­ вернутых. Так, заглавие «Субстанция и атрибутивные категории сис­ темного исследования» или рубрика УДК «Электродвигатели тяговые однофазные коллекторные переменного тока» имеют лишь значение, но не смысл.

На трехкомпонентность элементарного смысла обращал внимание И. М. Сеченов: «...предметная мысль отображает не просто изолирован­ ные объекты, а предметные отношения. Отношения же по самой своей природе минимум двухкомпонентны. Раскрытие отношений, в свою очередь, требует сопоставления этих двух компонентов, или соотнося­ щихся объектов. Тем самым в структурной формуле речевой оболочки мысли должны быть представлены эквиваленты не только самих соот­ носящихся объектов, но и эквивалент акта их соотнесения».

Мысль о зависимости конкретного значения слова от смысла вы­ сказывания выдвигалась неоднократно и после Оккама (например, Дж. Локком, И. Гердером). Ученые считают, что само высказывание выступает не только как конструктивное целое, но и как смысловая

перспектива, на фоне которой каждое отдельное слово определяется и уточняется в своем значении. Слово в высказывании не тождественно слову как отдельно взятой единице. Все это, безусловно, так. Нам пред­ ставляется, что в ряде случаев значение слова может проявляться и в лингвистических конструкциях, меньших (точнее, более простых), чем высказывание, например в лексических синтагмах. Поэтому, возможно, правильнее было бы говорить, что значение слова определяется ситуа­ цией (как речевой, так и неречевой). В противном случае, как можем мы понимать значение выражений, не имеющих форму высказывания? Например, те же заголовки или рубрики УДК, примеры которых приве­ дены выше. Впрочем, здесь мы находимся в плену известного «пороч­ ного круга», когда смысл текста вроде бы выводится из значений ком­ понентов, а значение компонентов определяется смыслом текста.

Отнесенность понятий «значение» и «смысл» к различным лин­ гвистическим уровням обращает наше внимание па явление, имеющее важное практическое значение. Известно, что каждый из уровней (фо­ нетический, лексический, синтаксический) обладает некоторой автоно­ мией, выражающейся в том, что свойства единиц одного уровня невыводимы непосредственно из свойств единиц другого. Из этого, в частно­ сти, следует, что смысл конкретного предложения далеко не всегда можно вывести из простой совокупности значений входящих в него слов. Или, иными словами, совокупность значений отдельных слов не­ обязательно равна смыслу предложения (иногда эта «совокупность» может иметь и противоположный смысл). На это указывает, в частнос­ ти, В. М. Солнцев: «Смысл порождается с помощью значений, но не сводится ни к отдельным значениям, ни к их сумме. Сама мысль есть нечто большее, чем сумма языковых значений...»*. В случае же индек­ сирования мы стремимся с помощью текстовых единиц I лингвистиче­ ского уровня моделировать в поисковом образе единицы II и III лин­ гвистических уровней, т. е. с помощью отдельных ключевых слов и классификационных рубрик (значений) выразить смысл не только от­ дельных предложений, но и всего текста в целом. Естественно, что по­ добное моделирование не всегда достигает успеха, а отсюда и неизбеж­ ный поисковый шум.

Далее, автор (коммуникант), пытаясь выразить мысль при помощи тех или иных лексических конструкций, вкладывает в высказывание

* Солнцев В. М. К вопросу о семантике или языковом значении / / Проблемы семан­ тики. М.: Наука, 1974.— С. 3—11.

один смысл. Но, включив высказывание в коммуникативный процесс, он уже теряет право на его однозначное толкование * (особенно это ха­ рактерно для абстрактных рассуждений и в еще большей степени для поэтической речи). Чтобы конкретизировать смысл предложения, при­ дать ему по возможности однозначность, автор включает его в кон­ текст — развертывает, уточняет смысл высказывания с помощью дру­ гих высказываний.

Таким образом, и здесь мы сталкиваемся с подобным явлением: сум­ ма смыслов отдельных предложений не равна смыслу текста в целом. Взятая вне контекста, вырванная из текста фраза, как хорошо известно, может иметь иной смысл, чем смысл фрагмента в целом.

Эту особенность текстовых элементов различного уровня прихо­ дится учитывать при попытках формализованного (машинного, а так­ же и интеллектуального) получения вторичных документов методом экстрагирования отдельных фраз, совокупность которых образует так называемый машинный реферат (квазиреферат). Извлеченные из текс­ та первоисточника тем или иным способом на основе формальных при­ знаков фразы могут иногда значительно отличаться по смыслу от иден­ тифицируемых ими фрагментов текста и документа в целом.

Знание, информация, информативность. Выше уже указывалось, что знак можно рассматривать как форму фиксации содержания зна­ ния и передачи содержания информации. Тем самым мы хотели об­ ратить внимание на двойственную —статическую и динамическую — функцию знака. В первом случае знак имеет два плана: план выражения и план содержания (область семантики); во втором —в знаке обнару­ живается третий план —план интерпретации знака потребителем (сфе­ ра прагматики). Знак в статике —это текст, потенциально фиксирую­ щий некоторое знание. Знак в динамике (в процессе коммуникации, восприятия) — это сообщение, несущее потенциально некоторую ин­ формацию.

В литературе понятия «знание» и «информация» употребляются часто как синонимичные, тем не менее нам представляется, что их сле­ дует различать. В нашем случае —чтобы определить понятие «инфор­ мативность», трактуемое в разных источниках но-разиому.

Знание есть результат, с одной стороны, осмысления субъектом вза­ имосвязей предметов и явлений объективного мира (внутреннее зна­ ние), с другой — выражения этих взаимосвязей в знаковой форме (внешнее знание). Информация (в рамках данной работы) —это резуль­ тат интерпретирования, усвоения реципиентом (читателем, слушате­

* Кроме случаев намеренного применения двусмысленных выражений.

лем, пользователем...) содержания знакового выражения. Поэтому, если говорить строго, предметом изучения информатики выступать должна не только и не столько информация, сколько знание, которое и записы­ вается, и хранится, и передается в системе научных коммуникаций.

Итак, если представить себе коммуникативный процесс в сфере ин­ формационного обслуживания в виде традиционной трехзвенной це­ почки (т. е. в рамках формальных коммуникаций), то можно следую­ щим образом проследить путь передачи знания: коммуниканты порож­ дают высказывания*, в которых выражаю тся, ф иксирую тся их внутренние знания о каком-то фрагменте (ситуации) реального мира. Эти высказывания в виде текстов, несущих уже внешнее знание, по­ ступают к информантам и после определенной обработки (редактиро­ вания, свертывания и т. п.) включаются в систему коммуникаций. Ре­ ципиентами эти тексты воспринимаются как сообщения. Если в этих сообщ ениях содержатся знания, способные изменить структуру тезауруса реципиента, сообщение становится информационным. Ин­ формация (определенное ее количество), составляющая некоторую часть знания, содержащегося в сообщении, превращается снова во внутренние знания, но уже реципиента.

Во всех этих переходах знание (и информация) остается категорией идеальной, но в случае внутреннего знания — субъективной реальнос­ тью, в случае внешнего знания —реальностью объективной.

Выше рассматривался процесс передачи знаний, но, строго говоря, никакой буквальной передачи не существует. Если допустить опреде­ ленную аналогию между понятием «мысль» и «знание» (и информа­ ция), то, следуя В. М. Солнцеву, можно сказать, что мысль не передает­ ся (передаются знаки). В голове воспринимающего речь появляется не переданная ему извне мысль, а своя собственная, но аналогичная (в случае взаимопонимания) мысли коммуниканта. Отсюда «передача мысли» (а следовательно, знания и информации) не более как метафо­ ра. Мысль не передается буквально, она лишь резонансно возбуждается.

В отличие от субъективной реальности —информации, количество которой мы потенциально можем измерить лишь но степени изменения структуры индивидуального тезауруса, существует понятие информа­ тивность — объективная реальность, характеризующая степень разно­

* В данном случае под высказыванием мы понимаем нс предложение какого-либо языка, оцениваемое лишь с точки зрения его истинности (как принято в логике), а как продукт речевой деятельности, обладающий смыслом (необязательно минимальным). Рассмотрение одного и того же знака в трех «лицах» — знак-высказывание, знак-текст, знак-сообщение — чисто условно, чтобы подчеркнуть различное отношение к знаку со стороны участников коммуникативного процесса.

образия двух или более текстов, имеющих один денотат *. Различные сообщения обладают различной информативностью не по отношению к какому-либо индивидуальному тезаурусу, а лишь по отношению друг к другу. Таким образом, информативность —свойство не информации (а следовательно, и не сообщения), а свойство знания (текста). Помимо информативности, знания характеризуются также содержательнос­ тью — мерой воздействия на структуру общественного тезауруса**. Чем богаче знание в своих следствиях, предсказаниях, приложениях, тем оно содержательнее.

По мере познания (изучения, создания) некоторого объекта порож­ дается цепочка текстов, отражающих определенный этап познания это­ го объекта. Иногда в литературе подобную цепочку называют «доку­ ментальным сопровождением» развития научно-технического объекта. Звенья этой цепочки — различные виды документов (D) (в частном случае это могут быть патентные описания, отчеты о НИОКР, статьи, монографии...) — отличаются друг от друга уровнем содержательности (0),*** т. е. уровнем познания (создания) данного объекта: D01 с D02 с DQз ... Z)0n (здесь каждое последующее звено более содержательно, чем предыдущее, и в каждом последующем звене знания представлены на все более высоком уровне научного свертывания).

Различающиеся по уровню содержательности тексты D0i, Z)02 и т. д. могут в системе коммуникации порождать в свою очередь цепочки дру­ гих текстов (d), различающихся уже не по содержательности, а по уров­ ню информативности (d„) и метаинформативиости (d^ (или по уров­ ню информативного и метаинформативного свертывания).

* Излагаемая здесь точка зрения на информативность противоречит мнениям многих авторов. Например, Г. Г. Воробьев понимает под информативностью «то количество ин­ формации, которое извлекает из документа конкретный потребитель»; Т. М. Дридзс: «Под информативностью имеется в виду потенциальная интерпретационная характерис­ тика текста, в известной степени позволяющая прогнозировать меру адекватности смыс­ лового восприятия»; А. В. Соколов и В. П. Леонов под информативностью понимают свойство информационных сообщений удовлетворять информационные потребности и интересы. Она зависит от большого числа факторов, которые делятся на две группы: фак­ торы, влияющие на содержание сообщения, и факторы, определяющие его полезность для данного потребителя. Нетрудно заметить, что во всех перечисленных выше случаях информативность связывается с реакцией потребителя на сообщение и по сути дела ото­ ждествляется с количеством воспринятой им информации.

** «Общественный тезаурус» не менее абстрактное понятие, чем «тезаурус индивиду­ альный», оно включает в себя то, что известно всему человечеству, но нс известно в пол­ ном объеме ни одному человеку.

*** Здесь, конечно, не исключаются случаи, когда элементы такой цепочки будут раз­ личаться не содержательностью, а лишь уровнем сверйутости (что на практике нередко и бывает).

В первом случае формируется, к примеру, цепочка текстов вида De3 —>dn1 с= dn2 с: dnj ... dm . Так, информация, связанная с каким-либо изоб­ ретением и фиксирующая определенный момент в развитии того или иного научно-технического объекта, может быть отражена не только в описании к авторскому свидетельству, но и в кратком журнальном со­ общении, в статье научно-технического сборника, в брошюре по обмену опытом, информационном листке, в популярной газетной заметке, в ру­ ководстве, обзоре и т. д.— везде на различном уровне информативности (или информативного свертывания). Подобное явление (когда одни и те же сведения, отражающие определенный этап в развитии объекта, на различном уровне свернутости публикуются в различных видах доку­ ментов) названо нами «расслоением» документального потока — явле­ ние, которое вызвано к жизни в свою очередь функциональным рассло­ ением информационной потребности и которое обусловило значитель­ ную избыточность современного документального потока.

Во втором случае формируется цепочка текстов вида D03 —> dm7, с dm2, с dm3 ... d ^ где каждый последующий текст отличается от преды­ дущего уровнем метаииформативности (например, заглавие, поиско­ вый образ, аннотация 1, аннотация 2... и т. н.).

Если руководствоваться приведенными выше рассуждениями, то между документами, различающимися по уровню информативности (независимо от того, к числу каких — первичных или вторичных —от­ несла их традиция), нет принципиальной разницы. Так, статья, краткое сообщение, реферат, информационный листок и фактографическая справка могут находиться в одной цепочке документов (различающих­ ся лишь уровнем информативного свертывания).

Таким образом, об информативности текста можно говорить лишь в сопоставлении его с другим текстом или текстами, имеющими общий денотат.

Если вернуться к упомянутой выше трехзвеиной структуре комму­ никативного процесса, то можно задаться вопросом, каково отношение каждого из элементов этой трехзвенной цени к знаку, с какой точки зре­ ния оценивает знак коммуникант, информант и реципиент? Для комму­ никанта, как уже указывалось, знак выступает в качестве высказыва­ ния, и его оценка ведется им с точки зрения содержательности, т. е. соответствия уровню развитости общественного тезауруса (или соот­ ветствия общественной информационной потребности). }\пя реципиен­ та знак выступает в качестве сообщения, и его оценка ведется им с точ­ ки зрения количества содержащейся в сообщении информации: на­

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]