Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Омский Государственный Университет Путей Сообщения

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

a4.doc

Скачиваний:

Добавлен:

19.12.2018

Размер:

11.89 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 78 / 458 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

2.4. Эффективное кодирование

Эффективные коды были предложены Шенноном, Фано и Хафманом [24]. Сущность кодов заключается в том, что они неравномерные, то есть с неодинаковым числом разрядов, причем длина кода обратно пропорциональна вероятности его появления. Еще одна замечательная особенность эффективных кодов – они не требуют разделителей, то есть специальных символов, разделяющих соседние кодовые комбинации. Это достигается при соблюдении простого правила: более короткие коды не являются началом более длинных. В этом случае сплошной поток двоичных разрядов однозначно декодируется, поскольку декодер обнаруживает вначале более короткие кодовые комбинации. Эффективные коды долгое время были чисто академическими, но в последнее время успешно используются при формировании баз данных, а также при сжатии информации в современных модемах и в программных архиваторах [39].

Ввиду неравномерности вводят среднюю длину кода. Средняя длина – математическое ожидание длины кода:

(2.22)

Здесь – длина -той кодовой комбинации; – ее вероятность; – число различных комбинаций. Особенностью эффективных кодов является то, что средняя длина кода приближается к энтропии источника:

(2.23)

причем, стремится к сверху (то есть ).

Выполнение условия (2.23) усиливается при увеличении .

Существует две разновидности эффективных кодов: Шеннона-Фано и Хафмана. Рассмотрим их получение на примере. Предположим, вероятности символов в последовательности имеют значения, приведенные в таблице 2.1.

Таблица 2.1

Вероятности символов

	1	2	3	4	5	6	7	8	9
	0,1	0,2	0,1	0,3	0,05	0,15	0,03	0,02	0,05

Символы ранжируются, то есть представляются в ряд по убыванию вероятностей. После этого по методу Шеннона-Фано периодически повторяется следующая процедура: вся группа событий делится на две подгруппы с одинаковыми (или примерно одинаковыми) суммарными вероятностями. Процедура продолжается до тех пор, пока в очередной подгруппе не останется один элемент, после чего этот элемент устраняется, а с оставшимися указанные действия продолжаются. Это происходит до тех пор, пока в последних двух подгруппах не останется по одному элементу. Продолжим рассмотрение нашего примера, которое сведено в таблице 2.2.

Таблица 2.2.

Кодирование по методу Шеннона-Фано

		1	2	3	4	5
4	0,3		I				11
2	0,2	I	II				10
6	0,15		I	I			011
3	0,1			II			010
1	0,1			I	I		0011
9	0,05	II			II		0010
5	0,05		II		I		00001
7	0,03			II	II	I	000001
8	0,02					II	000000

Как видно из таблицы 2.2, первый символ с вероятностью участвовал в двух процедурах разбиения на группы и оба раза попадал в группу с номером I . В соответствии с этим он кодируется двухразрядным кодом II. Второй элемент на первом этапе разбиения принадлежал группе I, на втором – группе II. Поэтому его код 10. Коды остальных символов в дополнительных комментариях не нуждаются.

Обычно неравномерные коды изображают в виде кодовых деревьев. Кодовое дерево – это граф, указывающий разрешенные кодовые комбинации [24]. Предварительно задают направления ребер этого графа, как показано на рис.2.10 (выбор направлений произволен).

Рис. 2.10. Кодовое дерево для табл. 2.2

По графу ориентируются следующим образом: составляют маршрут для выделенного символа; количество разрядов для него равно количеству ребер в маршруте, а значение каждого разряда равно направлению соответствующего ребра. Маршрут составляется из исходной точки (на чертеже она помечена буквой А). Например, маршрут в вершину 5 состоит из пяти ребер, из которых все, кроме последнего, имеют направление 0; получаем код 00001.

Вычислим для этого примера энтропию и среднюю длину слова:

Как видно, средняя длина слова близка к энтропии.

Коды Хафмана строятся по иному алгоритму. Процедура кодирования состоит из двух этапов. На первом этапе последовательно проводят однократные сжатия алфавита. Однократное сжатие – замена двух последних символов (с низшими вероятностями) одним, с суммарной вероятностью. Сжатия проводят до тех пор, пока не останется два символа. При этом заполняют таблицу кодирования, в которой проставляют результирующие вероятности, а также изображают маршруты, по которым новые символы переходят на следующем этапе.

На втором этапе происходит собственно кодирование, которое начинается с последнего этапа: первому из двух символов присваивают код 1, второму – 0. После этого переходят на предыдущий этап. К символам, которые не участвовали в сжатии на этом этапе, приписывают коды с последующего этапа, а к двум последним символам дважды приписывают код символа, полученного после склеивания, и дописывают к коду верхнего символа 1, нижнего – 0. Если символ дальше в склеивании не участвует, его код остается неизменным. Процедура продолжается до конца (то есть до первого этапа).

Таблица 2.3.

Кодирование по алгоритму Хафмана

N		код	I	II	III	IV	V	VI	VII
4	0.3	11	0.3 11	0.3 11	0.3 11	0.3 11	0.3 11	0.4 0	0.6 1
2	0.2	01	0.2 01	0.2 01	0.2 01	0.2 01	0.3 10	0.3 11	0.4 0
6	0.15	101	0.15 101	0.15 101	0.15 101	0.2 00	0.2 01	0.3 10
3	0.1	001	0.1 001	0.1 001	0.15 100	0.15 101	0.2 00
1	0.1	000	0.1 000	0.1 000	0.1 001	0.15 100
9	0.05	1000	0.05 1000	0.1 1001	0.1 000
5	0.05	10011	0.05 10011	0.05 1000
7	0.03	100101	0.05 10010
8	0.02	100100

В таблице 2.3 показано кодирование по алгоритму Хафмана. Как видно из таблицы, кодирование осуществлялось за семь этапов. Слева указаны вероятности символов, справа – промежуточные коды. Стрелками показаны перемещения вновь образованных символов. На каждом этапе два последних символа отличаются только младшим разрядом, что соответствует методике кодирования. Вычислим среднюю длину слова:

Недостатком кода Хафмана можно считать то, что нулевая кодовая комбинация не всегда соответствует наименее вероятному символу. Это может привести к потере этого символа при передаче нулей низкими уровнями.

Оба кода удовлетворяют требованию однозначности декодирования: как видно из таблиц, более короткие комбинации не являются началом более длинных кодов.

При увеличении количества символов эффективности кодов возрастают, поэтому в некоторых случаях кодируют более крупные блоки (например, если речь идет о текстах, можно кодировать некоторые наиболее часто встречающиеся слоги, слова и даже фразы).

Эффект от внедрения таких кодов определяется в сравнении их с равномерным кодом:

(2.24)

где – количество разрядов равномерного кода, который заменяется эффективным.

<<< < Предыдущая 1 2 3 4 5 6 78 / 458 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
09.04.20151.41 Mб408_Лаб.практ. Электромагнитные явления.doc
#
09.04.2015762.88 Кб1678а_Краткий курс физики (часть 1).doc
#
10.04.20151.35 Mб549 Электроника Лекции в презентациях 2012.pdf
#
09.04.20151.25 Mб319_Колебания и волны. Задачи.doc
#
20.09.201950.86 Кб39ЛР моделир Гел.docx
#
19.12.201811.89 Mб45a4.doc
#
09.04.2015288.26 Кб7akt_tam_dosmotra.doc
#
10.04.201590.9 Кб2458Answer_key_Technical English Wbook 1A.pdf
#
15.03.2016363.01 Кб76Answer_Key_Unit_1B_Test.doc
#
10.04.2015873.01 Кб39Avtonomnye-25_56.pdf
#
18.11.2018150.53 Кб2bestref-195943.doc