Добавил:

AAA1 aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Харьковский национальный университет радиоэлектроники

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

1-1 Теория информации и кодирования / Лекции / Лекция 5.doc

Скачиваний:

154

Добавлен:

31.01.2021

Размер:

675.33 Кб

Скачать

☆

<<< < Предыдущая 1 23 / 83 4 5 6 7 8 > Следующая >>>

Избыточность кода Хаффмена

Из теоремы 4.1 следует, что для построенных по алгоритму Хаффмана кодов средняя длина кодовых слов удовлетворяет неравенству

, (4.6)

где — энтропия ансамбля.

Разность называется избыточностью неравномерного кода. При кодировании с избыточностью на каждое сообщение затрачивается на бит больше, чем в принципе можно было бы потратить, если использовать теоретически наилучший (возможно, нереализуемый) способ кодирования.

Итак, из (4.6) следует, что для кода Хаффмана избыточность г < 1. Хотелось бы получить более точную оценку средней длины кодовых слов. Гораздо более точную оценку избыточности получил Р. Галлагер, наложив ограничение на максимальную из вероятностей сообщений.

Теорема 4.3. Пусть — наибольшая из вероятностей сообщений конечного дискретного ансамбля. Тогда избыточность кода Хаффмана для этого ансамбля удовлетворяет неравенствам:

где — энтропия двоичного ансамбля; .

Код Шеннона-Фано

Алгоритм Шеннона-Фано заключается в следующем.

Символы алфавита источника (первичного или укрупненного) записываются в порядке не возрастающих вероятностей.
Затем они разделяются на две части так, чтобы суммы вероятностей символов, входящих в каждую из таких частей, были примерно одинаковыми. Всем символам первой части приписывается в качестве первого символа комбинации неравномерного кода ноль, а символам второй части — единица.
Затем каждая из этих частей (если она содержит более одного сообщения) делится в свою очередь на две, по возможности равновероятные части и к ним применяется то же самое правило кодирования.
Этот процесс повторяется до тех пор, пока в каждой из полученных частей не останется по одному сообщению.

Таблица 4.4

Буква	р_i	I	II	III	IV	V	VI	Kод	m_i	m_i  p_i
А	0.6	1						1	1	0.6
Б	0.2	0	1	1				011	3	0.6
В	0.1		1	0				010	3	0.3
Г	0.04		0	1				001	3	0.12
Д	0.025			0	1			0001	4	0.1
Е	0.015				0	1		00001	5	0.075
Ж	0.01					0	1	000001	6	0.06
З	0.01					0	0	000000	6	0.06

Пример. Пусть алфавит А источника состоит из 8 символов А, Б, В, Г, Д, Е, Ж, З с вероятностями р(А) = 0,6; р(Б) = 0,2; р(В) = 0,1; р(Г) = 0,04; р(Д)=0,025; р(Е) = 0,015, р(Ж)=0,01; р(З) = 0,01. Процедура построения неравномерного кода Шеннона-Фано задаётся в таблице 4.4.

На первом этапе производится деление на два множества А, и Б, В, Г, Д, Е, Ж, З, так как вероятность р(А)=0,6 и сумма вероятностей

примерно одинаковы. При этом символу А присваивается «1», а всем остальным Б, В, Г, Д, Е, Ж, З присваивается «0».

На втором этапе производится деление второго множества на два множества Б, В, и Г, Д, Е, Ж, З. Множеству Б, В присваивается «1», а множеству Г, Д, Е, Ж, З присваивается «0».

Hа третьем этапе производится деление множества Б, В, на два множества (уже символа) Б и В. Символу Б присваивается «1», а символу В присваивается «0». Множество Г, Д, Е, Ж, З делится на множества Г и Д, Е, Ж, З. Символу Г присваивается «1», а множеству Д, Е, Ж, З присваивается «0».

На четвёртом этапе производится деление множества Д, Е, Ж, З на два множества Д и Е, Ж, З. Символу Д присваивается «1», а множеству Е, Ж, З присваивается «0».

На пятом этапе производится деление множества Е, Ж, З на два множества Е и Ж, З. Символу Е присваивается «1», а множеству Ж, З присваивается «0».

На шестом этапе производится деление множества Ж, З на два множества Ж и З. Символу Ж присваивается «1», а символу З присваивается «0».

Легко проверить, что данный код оказывается префиксным и средняя длина кодовой комбинации 1,915, что менее чем на 7 % превышает энтропию данного источника, равную 1,7813. A избыточность кода составит

Отметим, что хотя, деление на части с "примерно равными вероятностями" не является однозначной процедурой, но при увеличении длин блоков m укрупнённого источника сообщений эти погрешности будут сглаживаться, а средняя длина приближаться к предельному значению.

Пример. Источник дискретных сообщений для формирования сообщений использует алфавит из 7 знаков.

а_k	а₁	а₂	а₃	а₄	а₅	а₆	а₇
Р(а_k)	1/32	1/8	1/32	1/8	1/16	1/2	1/8

Построить код Шеннона-Фано для кодирования заданного алфавита

Р(а₆)	1/2	0
Р(а₂)	1/8	1	0	0
Р(а₄)	1/8	1	0	1
Р(а₇)	1/8	1	1	0
Р(а₅)	1/16	1	1	1	0
Р(а₁)	1/32	1	1	1	1	0
Р(а₃)	1/32	1	1	1	1	1

а₆-0

а₂ – 100

а₄ - 101

а₇ - 110

а₅ - 1110

а₁ - 11110

а₃ - 11111

<<< < Предыдущая 1 23 / 83 4 5 6 7 8 > Следующая >>>

Соседние файлы в папке Лекции

#
31.01.2021617.47 Кб161Лекция 10.doc
#
31.01.2021336.9 Кб146Лекция 11.doc
#
31.01.2021403.97 Кб159Лекция 2.doc
#
31.01.2021710.14 Кб262Лекция 3.doc
#
31.01.2021153.6 Кб153Лекция 4.doc
#
31.01.2021675.33 Кб154Лекция 5.doc
#
31.01.20211.14 Mб147Лекция 6.doc
#
31.01.2021731.14 Кб154Лекция 7.doc
#
31.01.2021696.83 Кб156Лекция 8.doc
#
31.01.2021569.86 Кб155Лекция 9.doc