Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методические указания по дискретной математике.doc
Скачиваний:
106
Добавлен:
22.11.2018
Размер:
4.5 Mб
Скачать

4.2. Элементы кодирования

Вопросы кодирования издавна играли заметную роль в математике. В частности:

  • десятичная позиционная система счисления – это способ кодирования натуральных чисел. Римские цифры – другой способ кодирования натуральных чисел;

  • декартовы координаты – способ кодирования геометрических объектов числами.

Однако, ранее средства кодирования играли вспомогательную роль и не рассматривались как отдельный предмет математического изучения, но с появлением компьютеров ситуация кардинально изменилась. Кодирование буквально пронизывает информационные технологии и является центральным вопросом при решении самых разных задач программирования:

  • представление данных произвольной природы (чисел, текста, графиков) в памяти компьютеров,

  • защита информации от несанкционированного доступа;

  • обеспечение помехоустойчивости при передаче данных по каналам связи;

  • сжатие информации в базах данных и т.д.

4.2.1. Формулировка задачи кодирования.

Пусть заданы алфавиты и функция , где – некоторое множество слов в алфавите , . Функция называется кодированием, элементы множества сообщениями, а элементы кодами соответствующих сообщений. Обратная функция (если она существует) называется декодированием.

Если , то называется –ичным кодирование. Наиболее распространен случай – двоичное кодирование. Именно этот случай рассматривается в дальнейшем.

Типичная задача теории кодирования формулируется следующим образом: при заданных алфавитах , и множестве сообщений найти такое кодирование , которое обладает определенными свойствами и оптимально в некотором смысле.

Свойства, которые требуются от кодирования, бывают самой разной природы:

  • существование декодирования – естественное свойство, однако даже оно требуется не всегда. Например, трансляция программы на языке высокого уровня в машинные коды – это кодирование, для которого не требуется декодирования;

  • помехоустойчивость, или исправление ошибок: функция декодирования обладает таким свойством, что , если в определенном смысле близко к ;

  • заданная сложность (или простота) кодирования и декодирования. Например, в криптографии изучаются такие способы кодирования, при которых имеется просто вычисляемая функция , но определение функции требует очень сложных вычислений.

4.2.1. Алфавитное (побуквенное) кодирование

Кодирование может сопоставлять код всему сообщению из множества как единому целому или же строить код сообщения из кодов его частей. Элементарной частью сообщения является одна буква алфавита . Этот простейший случай, когда кодируется каждая буква сообщения , называется алфавитным кодированием.

Если , то называется префиксом (или началом) слова, а – постфиксом (концом) слова.

Алфавитное кодирование задается схемой (или таблицей кодов) :

.

Множество букв называется множеством элементарных кодов. Таким образом, буква кодируется словом в алфавите .

Алфавитное кодирование пригодно для любого множества сообщений :

.

Пример. Рассмотрим алфавиты ={0,1,2,3,4,5,6,7,8,9} и схему

Эта схема однозначна, но кодирование не является взаимно однозначным: , а значит невозможно декодирование. С другой стороны, схема

, известная под названием «двоично–десятичное кодирование», допускает однозначное декодирование.

Схема алфавитного кодирования называется разделимой, если любое слово, составленное из элементарных кодов, единственным образом разлагается на элементарные коды. Алфавитное кодирование с разделимой схемой допускает декодирование.

Схема называется префиксной, если элементарный код одной буквы не является префиксом элементарного кода другой буквы.

Теорема. Префиксная схема является разделимой.

Чтобы схема алфавитного кодирования была разделимой, необходимо, чтобы длины элементарных кодов удовлетворяли определенному соотношению, известному как неравенство Макмиллана.

Теорема. Если схема разделима, то , где .

Неравенство Макмиллана является не только необходимым, но и достаточным условием разделимости схемы алфавитного кодирования. Поэтому теорему можно переформулировать следующим образом.

Теорема. Если числа удовлетворяют неравенству , то существует разделимая схема алфавитного кодирования , где .

Пример. Для схемы кодирования

левая часть неравенства Макмиллана может быть записана в виде

.

Отсюда следует, что данная схема кодирования не разделима.

Для случая двоично–десятичного кодирования –

– имеем

,

что говорит о разделимости схемы кодирования.

Пример. Схему кодирования, лежащую в основе азбуки Морзе, можно записать

,где по историческим и техническим причинам 0 называется точкой, а 1 – тире. Проведя проверку на разделимость получим

Таким образом схема азбуки Морзе не является разделимой. На самом деле, в азбуке Морзе используются дополнительные элементы – паузы между буквами и словами, что позволяет декодировать сообщение.