1.4.2 Вторичные коды и их свойства

В соответствии с представленным выше определением кода и изложенным ещё раньше описанием процесса формирования сообщений, основой формирования, всех вторичных кодов являются всевозможные вторичные алфавиты. Их, как мы убедились, огромное множество. В состав этого множества попадают:

- языки народов мира,

- мертвые языки и

- искусственные языки, типа эсперанто;

- Код Морзе,

- код Боде и другие телеграфные и шифровальные коды;

- иероглифическое письмо и используемые не очень цивилизованными племенами:

- узелковые письмена,

- язык свиста,

- барабанный телеграф и многое другое.

С точки зрения статистической теории связи всё это, действительно, вторичные коды. Отличать друг от друга все эти коды и оценивать их пригодность для описания разных вещей и явлений мы уже умеем не только по объёму алфавита, но и по энтропии алфавита.

Более подробное их рассмотрение, мы начнём с принятого в теории информации разделения всего множества кодов (мы дальше не будем употреблять слова «вторичные» потому, что выше, «как бы отвергли» существование первичных кодов в природе), на естественные и искусственные.

1.4.2.1 Коды с вероятностными ограничениями

Естественный (не естественный потому, что первичный, а естественный среди вторичных) код – это такой код, который специально не придумывали и не создавали для представления сообщений, это код, который сложился сам собой, возник и развивается своим естественным путём. К таким кодам относятся естественные языки народов мира.

Язык, как средство общения людей никто не придумывал, он возник естественным путём. Вначале это была только речь – код, состоящий из естественных звуковых символов (фонем). Речь не смогла удовлетворить потребности человеческого общения в полной мере. Сообщение, составленное из символов такого кода, существовало только в момент его формирования и не могло быть сохранено или отправлено так далеко, как это иногда требовалось.

Позже возникла письменность – новый код, такой способ представления сообщений в рамках человеческого общения, который позволял хранить сообщения и переносить их достаточно далеко. Таких кодов (письменных языков) также много, как и языков разговорных. Они, как правило, основываются на буквенные алфавиты. Как правило, потому, что основой многих письменностей являются, символы, которыми обозначены не звуковые элементы речи, а смысловые элементы ситуации – целые понятия. Речь идет об иероглифическом письме – о коде, алфавит которого может содержать тысячи символов.

Письменные языки сложились не совсем естественным путём, но они, все же, относятся к первой, обсуждаемой здесь группе кодов. Причину этого мы узнаем позже.

Вторую группу кодов образуют такие коды, как азбука Морзе, код Боде другие телеграфные и шифровальные коды, главная черта которых состоит в том, что они полностью искусственные. Они придуманы, специально разработаны для представления сообщений. В их появлении нет естественных причин, а в истории – периода естественного развития. Причины их появления и средства реализации, в основном, – технические.

Чтобы представленное разделение кодов на две группу выглядело более обоснованным, обратимся к основному признаку, отличающему эти коды друг от друга. Для этого вначале вспомним, что делает первичный алфавит кодом. Выше мы это выясняли.

Вначале мы говорили о «правилах чередования состояний» и т.п., но потом (вспомните пример с солдатом) выяснили, что это законы природы и законы собственного устройства системы (последние – часто, следствия из тех же законов природы) ограничивают свободу поведения системы. Вторичный алфавит тоже становится кодом, когда на него накладываются какие-то ограничения.

Теперь для ясного понимания этого важнейшего положения статистической теории связи попытаемся представить, как формировался разговорный язык.

Вначале первобытный человек непроизвольно произносил всевозможные нечленораздельные звуки: сопел, пыхтел, икал, всхлипывал, постанывал и вскрикивал. Звуки, естественным образом слетая с его уст, выражали его внутренние состояния и никому не предназначались. Хотя рядом часто находилась другая, точно такая же, особь. Обе одинаковые материальные системы, находились, обычно, в одинаковом (и осознаваемом ими) состоянии. «Осознаваемом», – значит отображаемым внутрь себя и там себя понимающим.

Осознавая усталого (или удовлетворённого) себя, постанывающий (или сыто урчащий) дикарь, одновременно видел и слышал (отображал внутри себя) такие же стоны (или урчание) своего соплеменника. Через тысячи лет одновременного восприятия себя и другого, его осенило, – он стал воспринимать одну из компонент (звуки) внешнего выражения состояния соседа, как сообщения об этих его состояниях, потому, что стал понимать состояния другого – так похожие на его собственные состояния.

Во всей этой упрощенной картинке зарождения разговорного языка, главным моментом является естественность произносимых звуков и их связь с состоянием их источника. По мере развития, речь усложнялась, развивался речевой аппарат, но он формировал только те звуки, формировать которые позволяло его (речевого аппарата) устройство, хотя позже эти звуки уже не были так тесно и непосредственно связаны с внутренними состояниями говорящего. В разговорном языке со временем сложился более или менее чёткий алфавит, состоящий из нескольких десятков фонем. Те из них, которые при разговорах формировались легко и естественно (без натуги и задержек, не сбивая дыхания) встречаются в словах и словосочетаниях чаще, чем труднопроизносимые и, например, мешающие дыханию.

Состояние речевого аппарата, только что произнёсшего один звук («м»,– например), для формирования другого звука («ы») не годиться. Переходы из одного состояния в другое требуют внимания и усилий – разных при разных переходах. Сказать «ах», «ох» – естественнее, чем сказать «мы»», но сказать «мф» – почти противоестественно. Хотя и такие звукосочетания в речи «имеют место быть».

Таким образом, естественные ограничения со стороны организма человека сформировали определённый алфавит речевого кода, в котором одни звуки имеют более высокую вероятность появления в речи, чем другие.

Всё это означает, что

человеческая речь – звуковой (акустический)

разговорный код с вероятностными ограничениями.

Это не единственный код такого типа. К таким же кодам относится и письменный русский язык, для которого специальные составлены таблицы наиболее вероятных букв в текстах. В них можно найти относительные частоты (это и есть – вероятности) появления в составе письменных сообщений, отдельных букв и их сочетаний (двухбуквенных, трёхбуквенных, четырёхбуквенных и т. д.). Очевидно, что эти вероятности определяются вероятностями появления соответствующих звуков в устной речи. Такие же таблицы существуют для многих других языков.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 1011 / 5111 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в папке Методичка по теории информации

#
02.05.201444.54 Кб49МетТИ.doc
#
02.05.201428.67 Кб45МУВхКТИ.doc
#
02.05.20144.88 Mб98Полный теорин.doc
#
02.05.201451.2 Кб46Прил7.doc
#
02.05.2014378.88 Кб47ПриМат1.doc