Алгоритм кодирования и декодирования Хаффмена

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Самарский Государственный Архитектурно-Строительный Университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Практикум_ЗИ.doc

Скачиваний:

Добавлен:

29.03.2015

Размер:

524.29 Кб

Скачать

☆

<<< < Предыдущая 12 / 122 3 4 5 6 7 8 9 10 11 12 > Следующая >>>

Алгоритм кодирования и декодирования Хаффмена

Алгоритм Хаффмена [2] применяется при передаче информации по сети при удаленном доступе (протокол Тelnet ) . Предположим, что у нас есть алфавит из n символов. Нужно закодировать сообщение в виде строки бит. Присвоим каждому символу алфавита определенную последовательность бит (код). Затем соединим отдельные коды символов, составляющих сообщение, и получим кодировку сообщения. Пусть символам назначены следующие коды: A = 010; B = 100; C = 000; D = 111. Сообщение ABACCDA кодируется как 010100010000000111010.

Такая кодировка считается неэффективной. Более эффективным считается подход, который использует частоту повторения кода, а именно: чаще всего повторяющемуся символу присваивается более короткий код, а менее частому более длинный. Введем в рассмотрение таблицу следующего вида:

Таблица 2.1. Назначение кодов, соответствующих частоте повторения символов

Символ	Частота	Код
А	3	0
B	1	110
C	2	10
D	1	111

При использовании этих кодов сообщение ABACCDA кодируется как 0110010101110, что требует лишь 13 бит. В очень длинных сообщениях, которые содержат символы, встречающиеся чрезвычайно редко, экономия существенна. Обычно коды создаются не на основе частоты вхождения символов в отдельно взятом сообщении, а на основе их частоты во всем множестве сообщений.

Отметим, что если используются коды переменной длины, то код одного символа не должен совпадать с началом кода другого символа. Такое условие должно соблюдаться, если декодирование происходит слева направо.

Такой подход к кодированию на основе учета частоты повторения символов в сообщениях позволяет реализовывать оптимальное кодирование информации. Операция предполагает использование структуры бинарного дерева. Каждый лист представляет символ исходного алфавита. Каждый узел представляет соединение символов из потомков данного узла.

На рис.2.1 приведено бинарное дерево, построенное с использованием рассмотренного выше примера. Каждый узел содержит символ и его частоту. Бинарное дерево строится снизу вверх, учитывая тот факт, что число предшественника узла со стороны левого поддерева меньше числа узла, а число предшественника узла со стороны правого поддерева больше числа левогопредшественника узла. Здесь листья есть символы сообщения, через запятую от символа обозначена его частота.

ACBD,7

A,3 CBD,4

C,2 BD,2

B,1D,1

Рис. 2.1. Дерево Хаффмена

Такие деревья называются деревьями Хаффмена, по имени изобретателя этого метода кодирования. Как только дерево построено, код любого символа алфавита может быть определен просмотром дерева снизу вверх, начиная с листа, представляющего этот символ. Начальное значение кода – пустая строка. Каждый раз, когда мы поднимаемся по левой ветви, к коду слева приписывается 0; каждый раз при подъеме по правой ветви к коду слева приписывается 1, т.е. А имеет код 0; B имеет код 110 и т.д.

Алгоритм декодирования работает в обратном порядке. Проход по дереву начинается с корня дерева. Каждый раз, когда встречается 0, двигаемся по левой ветви, и каждый раз, когда встречается 1 , двигаемся по правой ветви, отнимая от кода слева соответствующий символ 0 или 1. Дойдя до листа, все откинутые от кода сообщения цифры образуют код расшифрованного символа. Повторяем этот процесс опять от корня к листу, но уже сменьшим кодом. Процесс повторяется до тех пор, пока в коде сообщения не останется цифр.

Пример. 2.1. Пусть известна таблица частот повторения символов вида:

Таблица 2.2. Кодировки букв по частоте

Символ	A	B	C	D	E	F	G	H	I
Частота	15	6	7	12	25	4	6	1	15

Используя таблицу, построить бинарное дерево для кодирования и декодирования сообщения IHFBDEGCA.

Решение.

IHFBDEGCA,91

IHFBD,38EGCA,53

I,15HFBD,23E,25GCA,28

HFB,11 D,12 GC,13 A,15

HF,5 B,6 G,6 C,7

H,1F,4

Рис. 2.2. Дерево Хаффмена для рассматриваемой задачи

После построения дерева проведем кодировку символов. Оформим результат в виде таблицы.

Таблица 2.3. Кодировки букв по частоте

Символ	A	B	C	D	E	F	G	H	I
Код	111	0101	1101	011	10	01001	1100	01000	00

Учитывая результат кодировки, можно декодировать любое сообщение из заданного набора символов. Например, имеем код сообщения 1110100010111011, необходимо представить его в виде символов:

1110100010111011

110100010111011

10100010111011

0100010111011

Таким образом, дойдя до листа, мы получили отброшенные цифры в следующей последовательности 111, то есть код символа A, согласно таблице кодов. Построим следующий проход дерева от вершины с оставшимся кодом и т.д. Продолжая процесс декодирования, получим сообщение AHEAD.

<<< < Предыдущая 12 / 122 3 4 5 6 7 8 9 10 11 12 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
12.03.2016451.71 Кб150практикум по физике.pdf
#
29.03.2015159.23 Кб16ПРАКТИКУМ_2.doc
#
01.05.2025265.73 Кб0ПРАКТИКУМ_3.doc
#
16.09.2019754.69 Кб13Практикум_4.doc
#
01.05.2025292.35 Кб0ПРАКТИКУМ_4.doc
#
29.03.2015524.29 Кб51Практикум_ЗИ.doc
#
03.09.2019111.62 Кб7Практическая работа 3 оос.doc
#
01.05.202530.59 Кб0Практичсекие работы .docx
#
19.09.2019108.03 Кб8ПРЕДВАРИТЕЛЬНЫЙ РАЗОГРЕВ БЕТОННОЙ СМЕСИ.doc
#
01.07.202524.43 Mб0пример задач Защита от коррозии.doc
#
29.03.201539.42 Кб20пример заполнения договора.doc