Блочное кодирование Хаффмена.

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Московский государственный технический университет им. H.Э.Баумана

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Teoria_informatsii_Gordeev_5sem.docx

Скачиваний:

Добавлен:

01.07.2025

Размер:

758.94 Кб

Скачать

☆

<<< < Предыдущая 2 3 4 5 6 7 8 9 10 11 12 1314 / 2814 15 16 17 18 19 20 21 22 23 24 25 26 > Следующая >>>

Блочное кодирование Хаффмена.

Алгоритм Хаффмена применяется не к самим буквам а к их блокам Тогда теорема Шеннона распространяется уже не буквы, а на блоки. В качестве вероятности блока берется произведение вероятностей, входящих в него букв. Если стоимость блока поделить на количество букв в нем, то «получим стоимость кодирования на одну букву».

Пример.

Пусть случайный источник генерирует 0 с вероятностью 0,25 и единицу с вероятностью 0,75. Стоимость кодирования равна 1 при энтропии 0,81.

Если поток из 0 и 1 будем интерпретировать как пары (блоки из двух букв), то это будет равносильно необходимости передавать четыре буквы с вероятностями:

a	00	1/16	000
b	01	3/16	001
c	10	3/16	01
d	11	9/16	1

Применяем алгоритм Хаффмена:

(a, b, c, d) → ((a, b), c, d) → (a, b, c), d)

Стоимость на блок l (xx) = ∑ p_i l_i = 3/16 + 9/16 + 6/16 + 9/16 = 27/16.

Стоимость на одну букву l(x) = 27/32 = 0, 844.

Если перейти теперь к блокам длины три, то получим:

a 000 1/64 00000

b 001 3/64 00001

c 010 3/64 00010

d 011 9/64 010

e 100 3/64 00011

f 101 9/64 001

g 110 9/64 001

h 111 27/64 1

Алгоритм Хаффмена:

(a, b, c, D, e, f, g, H) → ((a, b), c, D, e, f, g, H) → ((a, b), (c, e), D, f, g, H) → ((a, b, c, e), D, f, g, H) → ((a, b, c, e), (D, f), g, H) → ((a, b, c, e, g), (D, f), H) → ((a, b, c, D, e, f, g), H)

(a,b,c,d,e,f,g)

(d,f)

(a,b,c,e,g)

(c,e)

(a,b)

(a,b,c,e)

Стоимость кодирования на блок l(xxx) = 5/64 + 15/64 + 15/64 + 15/64 +28/64 + 15/64 +27/64 +27/64 +27/64 = 50/64 +108/64 = 158/64 = 2,46875.

В переводе на одну букву получаем l(x)=0,823.

Процесс можно продолжать.

Ниже будет показано, что при неограниченном росте длины блока стоимость кодирования на одну букву может быть сколь угодно близка к значению энтропии.

Алгоритм арифметического кодирования

Появление этого алгоритма было связано с попыткой обойти сложности кодирования (декодирования) блочного алгоритма. Однако сравнивать его с предыдущими алгоритмами математически некорректно. Дело в том, что блочное кодирование не дает префиксного кода и, вообще, оно не переводит двоичные слова в двоичные слова. В нем используется третий символ – разделитель (обозначим его *). Уже на канальном уровне приемник различает его от 0 и 1.

Поэтому сравнивать стоимость арифметического кода, например, в блочным кодом Хэмминга – некорректно, т.к. все зависит от стоимости разделителя. Очевидно, что, если его передача стоит много дороже передачи бита, то использование его нецелесообразно. Обратно, если его передача стоит много дешевле передачи бита, то математическая задача перешла в инженерную.

Единственная почва для сравнения – считать, что разделитель , с точки зрения стоимости, эквивалентен биту.

Принципы арифметического кодирования заключаются в следующем:

- кодовое слово. Ему ставится в соответствие точка
Строится разбиение отрезка на совокупность отрезков:
Длина отрезка пропорциональна «вероятности» слова, закодированной точкой этого отрезка.
Точка имеет вид

_{Кодовое
слово имеет}_p_{разрядов и кодируется в двоичную запись
числителя}_k_{.
Таким образом, при одинаковых числителях
слова будут различаться количеством
разрадов.}

_{Так
как разбиение отрезка и точки на нем
известны кодеру и декодеру, то алгоритм
декодирования очевиден.}

_{Декодирование}_.

Шаг 1: Определяем интервал, содержащий текущий код. По нему определяем 1 символ исходящего сообщения. Если этот маркер кодирование заканчивает.

_{Шаг 2:}_{Из текущего
кода вычитается нижняя граница содержащего
его интервала, и полученная разность
делится на длину интервала. Получаем
новое число. Находим интервал для него
и т.д.}

<<< < Предыдущая 2 3 4 5 6 7 8 9 10 11 12 1314 / 2814 15 16 17 18 19 20 21 22 23 24 25 26 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
10.02.201517.73 Mб53teopiya_tanka_sergeev.djvu
#
01.03.20251.19 Mб3Teoria (1).doc
#
15.04.20195.54 Mб10teoria ответы.doc
#
23.09.201924.91 Mб11teoria-ilyukhina.docx
#
10.02.20153.26 Mб26teoria.pdf
#
01.07.2025758.94 Кб1Teoria_informatsii_Gordeev_5sem.docx
#
10.02.20151.77 Mб9teoria_na_bilety_2013.pdf
#
09.11.20193.24 Mб46Teoria_polya_mp.doc
#
22.08.2019433.66 Кб23teoria_rk_po_fizike_dlya_raspechatki.doc
#
01.03.2025783.69 Кб1Teplofizicheskie_protsessy.docx
#
09.02.2015221.7 Кб13Termekh_shpory.doc

Блочное кодирование Хаффмена.

Алгоритм арифметического кодирования