Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Саратовский Государственный Технический Университет им. Ю.А. Гагарина

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Основы+теории+информации.doc

Скачиваний:

Добавлен:

01.07.2025

Размер:

702.46 Кб

Скачать

☆

<<< < Предыдущая 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 2829 / 3229 30 31 32 > Следующая >>>

2. Эффективное посимвольное кодирование для сжатия данных.

Основные моменты сводятся к следующему:

идея такого кодирования базируется на том, чтобы использовать для часто встречающихся символов более короткие кодовые цепочки, а для редких - более длинные. В результате средняя длина кода будет меньше, чем при равномерном кодировании;
согласно теореме Шеннона, наилучшее кодирование позволяет сократить l_ср.до величены энтропии Н, подсчитанной для данного набора символов;
неравномерное кодирование позволяет автоматически устранить избыточность, связанную с тем, что количество символов в алфавите может быть не кратно степени двойки (так, например, чтобы закодировать одинаковым числом разрядов 5 разновидностей символов потребуется 3 бита, так же как и для 8 символов).

Идея неравномерного кодирования, в котором длина кодовой цепочки зависит от частоты появления соответствующего символа, реализована еще в знаменитой «азбуке Морзе». Однако там наряду с «точками» и «тире» использовался третий кодовый символ – разделитель «пауза». Если ограничиться только «O» и «1», то при построении кода необходимо учесть дополнительное требование: чтобы все кодовые цепочки однозначно выделялись в непрерывном потоке битов, ни одна из них не должна входить как начальный участок в кодовую, цепочку другого символа. Такое свойство кода называется префиксностью.

Наибольшее распространение получил способ построения эффективного кода предположенный Хаффменом. Рассмотрим его на примере. Пусть задан алфавит из 5 разновидностей символов Z₁ – Z_{5, и} их вероятности. В таблице 5.1 наряду с этими исходными данными приведены так же результаты кодирования по Хаффмену: кодовые цепочки K_i их длинны l_i. Процедуру построения кода иллюстрирует таблица и рисунок 1

На первом этапе символы упорядочивают по убыванию вероятностей, а затем выполняют несколько шагов «объединения», на каждом из которых суммируются вероятности наиболее редко встречающихся символов и столбец вероятностей пересортировывается .

Пример кода Хаффмена

Z_i

P_i

K_i

l_i

Z₁

Z₂

Z₃

Z₄

Z₅

0,25

0,17

0,08

0,35

0,15

010

011

l_ср

На втором этапе строится «дерево кода», ветви которого отображают в обратном порядке процесс «объединения вероятностей». При построении дерева принимается правило соответствия большей вероятности одному из направлений ветви (например «левому») и определенному значению бита кода (например, «1») . Цепочки битов от «корня» до конца каждой ветви соответствуют кодам исходных символов (табл.5.1 – 5.2).

Таблица 2 Объединение вероятностей символов

Z_i

P_i

Шаги объединения

K_i

Z₁

Z₂

Z₃

Z₄

Z₅

0,35

0,25

0,17

0,15

0,08

0,35

0,25

0,23

0,17

0,40

0,35

0,25

0,60

0,40

1,00

011

010

Процедура кодирования сводится к выбору из кодовой таблицы цепочек, соответствующих каждому символу источника. Декодирование предусматривает выделение в битовом потоке кодов символов и их расшифровку в соответствии с таблицей.

Код Хаффмена может быть двухпроходным и однопроходным. Первый строится по результатам подсчета частот (вероятностей) появления различных символов в данном сообщении. Второй использует готовую таблицу кодирования, построенную на основе вероятностей символов в сообщениях похожего типа. Например, кодирование текста на русском языке в первом случае включает его предварительный анализ, подсчет вероятностей символов, построение дерева кода и таблицы кодирования индивидуально для данного сообщения. Во втором случае будет работать готовая таблица, построенная по результатам анализа множества русскоязычных текстов. Двухпроходный код более полно использует возможности сжатия. Однако, при этом вместе с сообщением нужно передавать и кодовую таблицу. Однопроходный код не оптимален, однако прост в использовании, поэтому на практике обычно применяют именно его.

В целом код Хаффмена проигрывает по сравнению с «цепочечными» кодами и его редко используют самостоятельно, однако он часто фигурирует как элемент более сложных алгоритмов сжатия.

<<< < Предыдущая 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 2829 / 3229 30 31 32 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.05.2025580.26 Кб0Основы микроэкономики, менеджмента и маркетинга...docx
#
23.11.2019289.28 Кб55Основы партизанской войны.doc
#
20.11.2018916.48 Кб17Основы теории поля.doc
#
01.07.20251.9 Mб0Основы Теплотехники.doc
#
15.03.20151.64 Mб34Основы цифровой обработки сигналов.pdf
#
01.07.2025702.46 Кб1Основы+теории+информации.doc
#
01.05.2025110.29 Кб0основыные фонды бла бла ал.docx
#
20.08.2019652.29 Кб16Особенности инженерного рачсчета однородных экр...doc
#
01.07.202527.3 Кб0Особенности работы с кадровыми документами.docx
#
01.05.20251.72 Mб2Осциллограф.doc
#
12.02.201522.73 Mб342ответики по физике от Ксюни.doc