4.1.2. Краткое описание метода Хаффмена.

Входной поток: алфавит {a₁, a₂, …, a_N}.

Выходной поток: алфавит {0, 1}.

Пусть у нас буквы a, b, c, d расположены в терминальных вершинах дерева:

Рис.1.

Каждой букве мы можем приписать путь до нее от корня дерева, считая, например, передвижение по ветви влево — 0, вправо — 1:

a ~ 0, b ~ 10, c ~ 110, d ~ 111.

Разберем на примере процедуру построения дерева по входной последовательности, состоящей из a₁, a₂, a₃, a₄, a₅.

Пусть a₁, a₂, a₃, a₄, a₅ встретились 5, 3, 10, 1 и 4 раза соответственно. Строим гистограмму частот этих символов.

Рис.2.

1. Берем две самые редкие буквы: a₂ и a₄, создаем временный узел a₆, для которого a₂ и a₄ — нижние листья, (частота a₆) = (частота a₂) + (частота a₄) = 4. a₂ и a₄ в дальнейшем не рассматриваем.

2. Из a₁, a₃, a₅, a₆ выбираем две самые редкие буквы: a₅ и a₆, создаем временный узел a₇ с частотой 4 + 4 = 8, для которого a₅ и a₆ — нижние листья. a₅ и a₆ в дальнейшем не рассматриваем.

3. Из a₁, a₃, a₇ выбираем две самые редкие буквы: a₁ и a₇, создаем a₈ с частотой 13, для которого a₁ и a₇ — нижние листья. a₁ и a₇ в дальнейшем не рассматриваем.

4. Создаем a₉, с нижними листьями a₃, a₈.

Получаем дерево:

Рис.3.

Свойства метода Хаффмана:

Код Хаффмана оптимален (в смысле результата наименьшей длины в пределе) в классе алгоритмов, использующих префиксный код.
Таблицу частот символов можно или строить для каждой входной последовательности свою, или использовать фиксированную таблицу кодов, или строить ее динамически по имеющимся на каждый момент данным.

Кодирование Хаффмана используется, например, в JPG.

При описании реализации этого метода многие авторы пишут о том, что список символов должен быть упорядочен по вероятностям символов, и это упорядочение нужно обновлять после каждой склейки. Так поступать, конечно, неразумно. После начального упорядочения (символы располагаются по возрастанию их вероятностей) дополнительных упорядочений производить не требуется. Достаточно организовать еще один список для новых символов. Добавление идет в конец этого списка, и возрастание вероятностей в нем обеспечивается само по себе. А при выборе двух символов с наименьшими вероятностями мы используем виртуальный список — результат слияния старого и нового списков. Поскольку размер нового списка известен, (на один элемент короче исходного) такой список реализуется обычным массивом.

Метод Хаффмена легко допускает всевозможные "усовершенствования". Например, при заметном преобладании какого-либо из символов, вызывающем его многократные повторы, можно сначала заменить последовательности повторов более экономной записью, а затем уже использовать метод Хаффмена.

Из рассмотрения задач поиска и кодирования следуют некоторые практические рекомендации качественного характера: полезно называть длинными именами те объекты в программах, которые редко используются, и короткими именами — используемые часто. Нужно располагать ближе и удобнее то, что используется чаще, и т. п.

Первоначально возможность сжатия текстов была интересна только специалистам по телеграфной и радиосвязи (включая очень рано появившиеся работы по экономной передаче телевизионных изображений). С появлением персональных компьютеров программы сжатия текстов вошли в обиход практически всех потребителей вычислительной техники, а в последних версиях операционных систем, например в MS DOS начиная с версии 6.0, сжимающие программы становятся уже системной частью. Некоторые из схем сжатия информации запатентованы, и выпускаются реализующие их электронные устройства.

<<< < Предыдущая 1 2 3 4 5 6 7 8 910 / 3810 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
23.09.2019138.24 Кб99-17.doc
#
18.05.201571.86 Кб3592-125.docx
#
19.09.2019166.91 Кб329_-----_10_11.doc
#
18.05.2015280.43 Кб24ahd-b-kurs.pdf
#
29.09.20193.02 Mб20alinco-dj-195.doc
#
01.07.202560.29 Mб0all of DiskretMat.rtf
#
01.05.2025118.27 Кб6All-round english quiz 2013.doc
#
01.07.20253.97 Mб4Anatomia_Lektsii.doc
#
18.05.2015203.98 Кб80anglisk2.docx
#
18.05.20152.51 Mб70Anomalies1.pdf
#
21.09.201995.74 Кб17Antiaritmiki.doc