Метод Хаффмена

Методика разработки алгоритмов и процедур технологий сжатия по этому методу достаточно проста и включает в себя формирование двух элементов: треугольную матрицу вероятностей и построение кодового древа. Треугольная матрица вероятностей имеет размерность (L,L), где L – количество элементов входного алфавита. Элементы столбцов этой матрицы – это вероятности. Первый столбец задается как вероятности элементов входного алфавита, а элементы последующих столбцов формируются по методике Хаффмена. Процесс формирования матрицы поясняется таблицей.

Знаки	Вероятности	Вспомогательные столбцы
Знаки	Вероятности	1	2	3	4	5	6	7
Z¹	0,22	0,22	0,22	0,26	0,32	0,42	0,58	1
Z²	0,2	0,20	0,20	0,22	0,26	0,32	0,42
Z³	0,16	0,16	0,16	0,20	0,22	0,26
Z⁴	0,16	0,16	0,16	0,16	0,20
Z⁵	0,1	0,10	0,16	0,16
Z⁶	0,1	0,10	0,10
Z⁷	0,04	0,06
Z⁸	0,02

Кодовое древо для формирования элементов выходного алфавита строится на основе матрицы вероятностей. Из точки (первый элемент последнего столбца), соответствующий вероятности 1, направляем две ветви, причем ветви с большей вероятностью присваиваем – 1, а с меньшей – 0. Такое последовательное ветвление продолжаем до тех пор, пока не дойдем до вероятности каждого элемента входного алфавита. На рис. 3.1 показана иллюстрация этого процесса.

После построения кодового древа, двигаясь сверху вниз записываем, (определяем) элементы выходного алфавита. Словарь будет иметь следующий вид, в котором символы Z¹,Z²,Z³,Z⁴,Z⁵,Z⁶,Z⁷,Z⁸ первой строки обозначают буквы входного алфавита и соответствующие им бинарные цепочки фиксированной длины, а бинарные цепочки переменной длины во второй строке – это буквы выходного алфавита.

Z¹	Z²	Z³	Z⁴	Z⁵	Z⁶	Z⁷	Z⁸
01	00	111	110	100	1011	10101	10100

Рис.3.1.

Приложение 2

Методы эффективного кодирования коррелированных цепочек символов Метод l-грамм

Методы Шеннона-Фано и Хаффмена не учитывают корреляционные связи между символами, входящими в состав следующих друг за другом сочетаний. Естественно, они проявляются тем меньше, чем больше символов входит в каждое сочетание.

Отмеченный недостаток устраняется при кодировании по методу диаграмм триграмм или l - грамм. l - граммой называется сочетание l - символов входного алфавита в сообщении или тексте.

В процессе кодирования исходного информационного объекта (текста) l - грамма непрерывно (со сдвигом в один или более символов) перемещается по тексту сообщения:

_первая_l_{-грамма}

a₁a₂a₃ a₄ . . .a_n

_вторая_l_{-грамма}

В этом случае строится таблица информационной насыщенности l - граммами исходного IO, т.е. l - граммы являются элементами входного алфавита. А элементы выходного алфавита словаря определяются на основании методики Шеннона-Фано или Хаффмена.

На первый взгляд покажется, что использование этого метода неэффективно для разработки технологий сжатия и архивации. На самом же деле этот метод очень сильный, если смотреть в корень, т.е. в этом случае решение задачи сводится к нахождению оптимальной логической структуры заголовка словаря.

Эффективность этого метода проявляется в том, что решать задачу оптимизации логической структуры заголовка нужно с учетом корреляционных связей l - грамм. Это обстоятельство позволяет не только достигнуть эффекта сжатия, но и усилить помехозащищенность IO, хотя этот метод традиционно не относится к методам помехоустойчивого кодирования.

ЛАБОРАТОРНАЯ РАБОТА №3

<<< < Предыдущая 1 2 3 4 56 / 96 7 8 9 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
11.06.201532.77 Кб26Лабораторная работа 2 ООП.doc
#
01.03.2025983.04 Кб0Лабораторная работа 3 Листы.doc
#
11.06.2015219.65 Кб29Лабораторная работа 3.doc
#
11.06.201593.18 Кб13Лабораторная работа №3.doc
#
11.06.2015113.51 Кб21Лабораторная работа №4.docx
#
01.04.2025437.76 Кб1Лабораторный практикум_1Мышеву2_отпр.doc
#
21.09.201940.49 Кб1Лабузов С. В. Жизнь и деятельность Ивана Петров...docx
#
11.06.20151.34 Mб125Лев Николаевич Гумилев От Руси к России.doc
#
01.03.202580.9 Кб2Лексика - 1 лекция Документ Microsoft Word (7).doc
#
01.05.202546.59 Кб0Лексика-2 Word.doc
#
11.11.20195.36 Mб34Лекции 012.doc