Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
mol_a_sociodinamika_kultury.pdf
Скачиваний:
46
Добавлен:
06.02.2015
Размер:
5.25 Mб
Скачать

Янко Слава (Библиотека Fort/Da) || http://yanko.ru

110

называть среднее количество оригинальности в расчете на один знак, поскольку, как было показано выше, количество оригинальности в принципе не зависит от числа используемых знаков. Информация есть мера новизны получаемого нами сообщения. Но это лишь некоторая мера сообщения, а не само сообщение, и поэтому ни в коем случае нельзя смешивать предмет (сообщение) с его мерой (информацией). Наконец, следует подчеркнуть, что, как бы парадоксально это ни звучало, информация не имеет отношения к «значению», ведь сообщение, максимально насыщенное информацией, обрушивается на получателя как лавина нового и поэтому кажется ему совершенно непонятным и, следовательно, лишенным значения (смысла).

136

Все то, что сверх набора знаков заранее известно как получателю, так и отправителю сообщения, мы будем называть «кодом». Таким образом, код — это все то, что накладывает какие-то ограничения на произвольный выбор символов, все правила, создающие в сознании получателя большую или меньшую возможность предсказывать сообщение, все, что служит упорядочению множества знаков и делает сообщения более понятными.

В состав кода входят различные правила грамматики, синтаксиса, логики, здравого смысла, правдоподобия и т. д. Все они накладывают ограничения на осуществляемый отправителем сообщения выбор слов и, если они известны получателю, позволяют ему с определенной вероятностью предсказывать содержание сообщения. Так, последний знает, что если первые слова фразы произнесены на немецком языке, то имеется очень большая вероятность, что дальше в этой фразе встретится глагол и слова в ней будут следовать в определенном порядке. Это и позволяет ему уловить конструкцию фразы и заранее оценить ее некоторой величиной математического ожидания.

§ 4. Структура знаковых наборов

Одно из основных правил организации сообщения, то есть кода, который определяет эту организацию, — это правило построения самого набора знаков. Оно определяет организацию языка в приближении первого порядка. Выше мы видели, что сообщение можно рассматривать как последовательность элементов, выбранных из какого-то перечня. В нашем примере таким перечнем служил словарь, точнее, словник, или просто список слов, которые могут употребляться в сообщениях.

Можно показать, что в сообщениях средняя величина информации на знак, или общая величина информации, поделенная на число слов, будет наибольшей в том случае, если все знаки (слова) будут обладать в среднем равной употребительностью. Это значит, что ни одному знаку не будет отдаваться предпочтение перед другими, все они будут обладать равной вероятностью выбора. Понятно, что при этом появление какого-либо знака в некоторый момент не будет нести в себе никакого предсказания относительно характера следующего знака.

Приведем пример текста, составленного из таких равновероятных * слов: сюжет злосчастный телевидение помеха происхождение обвалять фабрикант разочарование панцирь лысый щетка облегчить похищение подражание приплясывать подвесить неглиже скандал щипцы ксенофобия потеря бесполезный сердить.

* Здесь и в следующем примере дается русский перевод приводимых Молем французских слов. (Прим. перев.)

137

Моль Абраям. Социодинамика культуры: Пер. с фр. / Предисл. Б. В. Бирюкова. Изд. 3-е. — М.: 110 Издательство ЛКИ, 2008. — 416 с.

Янко Слава (Библиотека Fort/Da) || http://yanko.ru

111

Таблица III-1. Структуры корреляции некоторых важных аспектов культуры речи и образования (по Вернону)

 

Артикля гласных

Правильн ость

 

Граммати ческая

Граммати ческая

Объем словаря

Интеллект уальный

Факторы

 

 

Длина фраз

 

 

 

Переменная величина

I

II

III

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

Артикуляция гласных

 

0,64

0,60

0,61

0,62

0,16

0,12

0,8

0,14

0,08

2

 

 

 

 

 

 

 

 

 

 

Правильность

 

 

0,62

0,80

0,57

0,36

0,49

0,73

0,42

0,08

произношения

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

Длина фраз

 

 

 

0,65

0,80

0,56

0,78

0,52

0,73

0,18

4

 

 

 

 

 

 

 

 

 

 

Грамматическая

 

 

 

 

0,74

0,41

0,55

0,8

0,32

0,24

правильность

 

 

 

 

 

 

 

 

 

 

5

 

 

 

 

 

 

 

 

 

 

Грамматическая

 

 

 

 

 

0,56

0,59

0,62

0,46

0,46

сложность

 

 

 

 

 

 

 

 

 

 

6

 

 

 

 

 

 

 

 

 

 

Объем словаря

 

 

 

 

 

 

0,52

0,11

0,48

0,64

7

 

 

 

 

 

 

 

 

 

 

Интеллектуальный

 

 

 

 

 

 

 

0,13

0,85

0,27

возраст

 

 

 

 

 

 

 

 

 

 

Подобное сообщение бесполезно и недопустимо, так как его разнообразие превосходит наши способности понимания.

В обычных реальных текстах разговорного языка так никогда не бывает. В этом нетрудно убедиться на примере большинства произведений печати. Знаки перечня, используемого в обычных текстах, обладают далеко не равной вероятностью. Отдельные слова употребляются в них намного чаще, чем другие. Так, например, в английском языке какой-нибудь десяток наиболее частых слов составляет до 50% любого текста. Примерно так же обстоит дело и с любым другим языком. Такие слова, как «утконос» или «полисемия», встречаются в них в тысячи раз реже, чем слова «быть», «иметь > или «этот».

Приведем пример текста, в котором уже соблюдены вероятностные закономерности встречаемости слов: эластичный часто душа которая мы забывали начало сильный два шага или тоннаж перегрузка жадно что там автобус который к подлинному слабые описывают имел грубый запрещает нам только.

138

Рис. III-4. Пример «созвездия» признаков, объединяющих исходное слово («налоги») и ряд слов, ассоциированных с ним.

Схема отражает данные конкретно-социологического исследования, проведенного Шмольдерсом. Нетрудно видеть, что ассоциированные признаки понятий являются существенным компонентом того, что мы выше назвали «оснащением ума». Сети ассоциаций, подобные приведенной на рисунке, составляют как бы связующую канву нашего сознания. Пока что мы еще не умеем выявлять их все полностью.

Различные слова набора употребляются совершенно по-разному, и эта неоднородность

Моль Абраям. Социодинамика культуры: Пер. с фр. / Предисл. Б. В. Бирюкова. Изд. 3-е. — М.: 111 Издательство ЛКИ, 2008. — 416 с.

Янко Слава (Библиотека Fort/Da) || http://yanko.ru

112

является одной из фундаментальных особенностей, свойственных всем языкам мира. Можно поэтому попытаться точнее определить структуру нашего набора, расположив

слова не в алфавитном порядке, который, по, существу, случаен и представляет собой лишь удобное правило для поиска слов по их написанию, а в порядке их частотных рангов, то есть начиная с самого частого слова и кончая самым редким. Опыты составления подобных словарей проделывались неоднократно (Торндайк и Лордж, Ван дер Беке, Кединг)40.Чем чаще употребляется слово, тем легче его найти в таком словаре. Такая организация словаря глубоко оправданна: количество строк словаря, которые необходимо просмотреть начиная с самого начала, чтобы найти некоторое слово, прямо пропорционально относительной редкости употребления искомого слова.

В этой связи вырисовывается возможность аналитического исследования словесного «оснащения ума», составляющего, как мы уже говорили, весьма важный аспект духовной деятельности человека.

Абсолютную или относительную частоту употребления слова можно представить на графике как функцию его ранга, понимаемого в определенном выше смысле. Эту форму классификации мы будем называть диаграммой Ципфа. Важнейший результат, полученный Ципфом, заключается в следующем. Он обнаружил, что встречаемость (частотность) слова, то есть вероятность его употребления, не просто уменьшается с увеличением его ранга, (что, в общем, самоочевидно и тавтологично, поскольку ранги и определяются по убывающим частотам), но что это уменьшение частоты — и это уже не самоочевидно—следует некоторой четкой закономерности, выражаемой очень простой числовой формулой, получившей название закона Цапфа:

fr — const,

где f — частота, а r — ранг слова или другого рассматриваемого знака.

Это интересное наблюдение открыло новые перспективы для лингвистических исследований. Оно показало, что употребление слов в речевом обще-

139

нии людей управляется законами «экономического» характера, и в частности стремлением к оптимизации соотношения между требованием разнообразия, предъявляемым говорящему обществом, с одной стороны, и свойственной говорящему тенденцией к наименьшей затрате усилий

с другой.

Всамом деле, примечательно, что ранг слова представляет собой его универсальную качественную характеристику, которая не зависит от конкретных особенностей того или иного отправителя сообщения. Ранг, то есть большая или меньшая доступность слова, определяется общественной средой; ранги слов являются числовой характеристикой языковой культуры общества в целом. В отличие от ранга частота, или, в относительном выражении, вероятность встречаемости, слова представляет собой количественную характеристику какой-то конкретной выборки языка. Ее можно рассматривать как проявление особенностей того или иного сообщения и, следовательно, как характеристику автора этого сообщения и его умения пользоваться словами данного ранга. То, что частота обратно пропорциональна рангу, в конечном счете является отражением конформизма индивидуума по отношению к социальной среде, в которой он живет. На уровне слов такой конформизм несомненно существует. В дальнейшем нам еще представится возможность рассмотреть, существует ли подобный конформизм и на уровне идей.

Итак, знаки используемого набора употребляются в языковых сообщениях с неодинаковой вероятностью. Слова обладают, следовательно, разной степенью «оригинальности»: редкое слово несет в себе гораздо больше непредсказуемого, чем частое. Употребление каждого слова подчиняется своей особой закономерности. Это неодинаковое распределение слов по закону равномерного убывания создает определенное равновесие, что и составляет первейшее практическое требование построения кода. Требование это является до такой степени всеобщим, что, как известно, на нем построены методы дешифровки, позволяющие в сообщении, написанном тайнописью, содержание и код которого неизвестны, обнаружить сначала код, а затем и содержание, исходя из предположения, что это сообщение написано на человеческом языке и подчиняется общим законам словесного «оснащения» ума.

Мера оригинальности, или информация, передаваемая сообщением, таким образом, действительно зависит от количества непредсказуемого, содержащегося в сообщении, то есть от величины, обратной степени возможности заранее реконструировать сообщение заданной длины. Стало быть, величина оригинальности зависит прежде всего от длины сообщения — роман в триста страниц содержит больше информации (больше непредсказуемого), чем одна страница этого романа. Предположение, что во всем романе ее в триста раз больше, чем на одной странице, представляется правдоподобным, но лишь в самом грубом приближении, поскольку фактически оригинальность зависит от большей или меньшей вероятности слов в тексте романа, что и выражается количеством информации.

Как мы видели, информация, вообще говоря, обратно пропорциональна логарифму предсказуемости сообщения. (Это согласуется с одним из основных законов психологии, сформулированном Вебером и Фехнером)41. Точнее, если pi — вероятность

Моль Абраям. Социодинамика культуры: Пер. с фр. / Предисл. Б. В. Бирюкова. Изд. 3-е. — М.: 112 Издательство ЛКИ, 2008. — 416 с.

Янко Слава (Библиотека Fort/Da) || http://yanko.ru

113

встречаемости i-го символа из данного набора, а N — общее число

140

знаков в последовательности знаков, которой является сообщение то, по Шеннону, информация Я будет равна: '

Рис. III-5. Словарный состав —«валютный фонд» языка.

Распределение слов подчиняется точным статистическим закономерностям, установленным Ципфом, Мандельбротом, Гиро и др. Частота слова изменяется как величина, обратная его рангу, с поразительной точностью (при логарифмической шкале координат график представляет собой прямую); это закон Ципфа. Число значений слова изменяется как корень квадратный из его ранга (закон Юла). Наконец, длина слова систематически возрастает с увеличением его ранга, что может служить теоретическим обоснованием одного из основных положений эмпирического правила Флеша о понятности текста (связь между длиной слова и трудностью).

Существует следующая простая интерпретация этой формулы: в конечном счете величина Я оказывается равной числу общих вопросов—вопросов, требующих ответов типа «да/нет» («двоичных», или «бинарных», вопросов)—ответов на которые достаточно для передачи того же количества информации, что и передаваемое данным сообщением с помощью содержащихся в нем N элементов. Следовательно, количество информации на знак можно выразить как

Поясним это примером. Толковый словарь французского языка «Ларусс» содержит примерно 30 тыс. слов. В некоторых словесных играх, а также при расшифровке секретных сообщений и при разгадывании кроссвордов за

141

отсутствием сведений об искомом слове иногда приходится подбирать его по словарю. Подсчитано, что информация, передаваемая в таком случае словом, составит 15 бит (двоичных

единиц) (216 = 32 768). Это значит, что отыскать загаданное слово в словаре можно, задав пятнадцать вопросов. Самый простой способ, который можно применить в данном случае,— это сначала спросить, содержится ли искомое слово в первой половине словаря. Если да, то спросить, содержится ли оно в первой или во второй четверти, затем, если окажется, что оно во второй четверти, спросить, содержится ли оно в третьей или четвертой восьмой и т. д. После пятнадцати подобных вопросов мы получим класс, состоящий всего из одного слова.

Таким путем мы автоматически получаем значение нормы информации, характеризующее данный словарь. Следует подчеркнуть, однако, что если любое из 30 000 слов является одинаково доступным в лежащем перед нами печатном списке, то в реальной практике употребления слов, хранимых в памяти, дело обстоит совсем иначе. Поэтому и нужна группировка слов по рангам.

Определим реальную плотность информации в среднем на знак. Согласно закону Ципфа,

pirαi = const,

или

где i — номер знака в наборе, α — параметр, а К — постоянная формулы Ципфа. Тогда получаем

Реальное значение этой величины всегда меньше того, которое имело бы место при использовании равновероятных знаков.

Моль Абраям. Социодинамика культуры: Пер. с фр. / Предисл. Б. В. Бирюкова. Изд. 3-е. — М.: 113 Издательство ЛКИ, 2008. — 416 с.