10.2.2. Код Хаффмена

Самым экономичным (оптимальным) из всех возможных является код Хаффмена: ни для какого другого метода кодирования букв некоторого алфавита среднее число элементарных сигналов, приходящихся на одну букву, не может быть меньше того, какое получается при кодировании по методу Хаффмена. Построение этого кода опирается на простое преобразование, называемое сжатием алфавита. Суть этого метода такова.

1. Буквы а₁, а₂, … ,а_n_-1, a_n алфавита А располагают в порядке убывания вероятностей их появления: p₁≥ p₂≥…≥ p_n_-1≥ p_n.

2. Две последние буквы принимают за одну - b, получая новый алфавит А₁, состоящий из букв а₁, а₂,…, b с вероятностями р₁, р₂,…, (р_n_-1+р_n). Эта операция называется однократным сжатием. Буквы алфавита А₁ располагаются в порядке убывания вероятностей.

3. Аналогичным образом подвергается сжатию алфавит А₁. Эта операция по отношению к алфавиту А называется двукратным сжатием. В результате этой операции получается алфавит А₂, содержащий n–2 буквы, который также располагают в порядке убывания вероятностей.

4. Операция сжатия продолжается до тех пор, пока не образуется алфавит А_n_-2, содержащий всего две буквы ((n–2) - кратное сжатие). Этим буквам присваивают кодовые обозначения 1 и 0.

5. Если кодовое обозначение уже приписано всем буквам алфавита A_j, то буквам предыдущего алфавита A_j_-1, сохранившимся и в алфавите A_j, приписываются те же кодовые обозначения, которые они имели в алфавите A_j_-1, двум буквам и алфавита A_j, слившимся в букву b алфавита A_j_-1, приписываются обозначения, получающиеся из кодового обозначения буквы b добавлением 1 и 0 в конце.

Пример 10.4. Исходный алфавит А состоит из 6 букв с вероятностями использования 0,4; 0,2; 0,2; 0,1; 0,05; 0,05 соответственно. Требуется осуществить кодирование алфавита по методу Хаффмена.

Решение. В нашем случае n=6. Используя четырехкратное сжатие исходного алфавита, получаем алфавит A₄, содержащий 1 и 0. Результаты вычислений представлены в таблице 10.3. Кодирование алфавита по методу Хаффмена позволяет всегда построить кодовое дерево, аналогичное тому, которое было получено в частном случае при кодировании кодом Шеннона–Фано (Рисунок 10.1 примера 10.2). Код является префиксным, допускает однозначное декодирование.

Среднее число элементарных сигналов, приходящихся на одну букву:

Таким образом, экономичность кодов для примеров 10.2 и 10.4 одна и та же.

Для кодов с основанием k основная теорема о кодировании при отсутствии помех может быть представлена следующим образом.

При любом методе кодирования, использующем код с основанием k,

где Н – энтропия одной буквы сообщения. При этом , если кодировать сразу блоки, состоящие из n букв.

Таблица 10.3. – Результаты вычислений

Номер буквы	Вероятности и кодовые обозначения
	Исходный алфавит А	Сжатые алфавиты
	Исходный алфавит А	А₁	А₂	А₃	А₄
1	0,4 0	0,4 0	0,4 0	0,4 0	0,6 1
2	0,2 10	0,2 10	0,2 10	0,4 11	0,4 0
3	0,2 111	0,2 111	0,2 111	0,2 10
4	0,1 1101	0,1 1101	0,2 110
5	0,05 11001	0,1 1100
6	0,05 11000

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 1819 / 2519 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.07.2025508.93 Кб1Брошюра МП для ГК-12.doc
#
01.07.202554.5 Кб0БТЖ.docx
#
04.06.2015206.34 Кб88буксы с роликовыми подшипниками.doc
#
01.05.2025867.33 Кб0в путь еще.doc
#
04.06.20152.28 Mб22Вариант 1.doc
#
01.07.20253.78 Mб0Введение в теорию информации.doc
#
04.06.20151.58 Mб109Введение Программная инженерия (лекции).pdf
#
01.07.2025285.19 Кб0Ветрогенератор мощностью 7кВт.docx
#
02.08.201970.51 Кб7ВильмоваРоль ВТО в регулировании международной....docx
#
04.06.20152.18 Mб12Виноразливочная станция.doc
#
04.06.2015207.36 Кб16ВИСХАГИ отчет.doc