Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Московский государственный технический университет им. H.Э.Баумана

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

OTI Lections2011.doc

Скачиваний:

Добавлен:

01.04.2025

Размер:

1.74 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 1516 / 2216 17 18 19 20 21 22 > Следующая >>>

8Алгоритмы кодирования

8.1Алгоритм Шеннона (Фано)

Есть некоторые буквы:

(кодируем номером числа в двоичном виде)

H = 1/4 log 4 + 1/4 log 4 + 1/8 log 8 + 1/8 log 8 + 1/8 log 8 + 2 * 1/16 log 16 = 1 + 9/8 + 1/2 = 2, 625

Шаги алгоритма:

Упорядочиваем по вероятности
«Дихотомия»: разбиваем на части, вероятности которых одинаковы.

Т аким образом:

a₁ 00

a₂ 01

a₃ 100

a₄ 101

a₅ 110

a₆ 1110

a₇ 1111

l_ш = 21/7 = 3

Пример:

l = 3, l_ш = 12/5 = 2,4

H = 7/18 log 18/7 + 1/2 log 6 + 1/5 log 9 = 2,17

8.2Алгоритм Хаффмана

Заведомо дает меньшее решение, чем по Шеннону.

a ₁ 1/4

a₂ 1/4

a₃ 1/8

a₄ 1/8

a₅ 1/8

a₆ 1/16

a₇ 1/16

В этом алгоритме идут итерации, по сути это построение листьев бинарного дерева. (1, 2, 3, 4, 5, 6, 7) → (1, 2, 3, 4, 5, (6, 7)) → (1, 2, (3, 4), 5, (6, 7)) → (1, 2, (3, 4), (5, 6, 7)) → ((1, 2), (3, 4), (5, 6, 7)) → ((1, 2), (3, 4, 5, 6, 7))

еперь, начиная с конца, строим бинарное дерево:

(6,7)

(5,6,7)

(3,4)

(3,4,5,6,7)

(1,2)

и код:

1 00

2 01

3 100

4 101

5 110

6 1110

7 1111

8.3Блочное кодирование

П оток из 0 и 1 будем интерпретировать как пары:

a 00 1/16 000

b 01 3/16 001

c 10 3/16 01

d 11 9/16 1

H (xx) = H(x) + H(x) = 2H(x) = 1,62

Хаффман: (a, b, c, d) → ((a, b), c, d) → (a, b, c), d)

l (xx) = ∑ p_i l_i = 3/16 + 9/16 + 6/16 + 9/16 = 27/16

l(x) = 27/32 = 0, 844

a 000 1/64 00000

b 001 3/64 00001

c 010 3/64 00010

d 011 9/64 010

e 100 3/64 00011

f 101 9/64 001

g 110 9/64 001

h 111 27/64 1

(a, b, c, D, e, f, g, H) → ((a, b), c, D, e, f, g, H) → ((a, b), (c, e), D, f, g, H) → ((a, b, c, e), D, f, g, H) → ((a, b, c, e), (D, f), g, H) → ((a, b, c, e, g), (D, f), H) → ((a, b, c, D, e, f, g), H)

(a,b,c,d,e,f,g)

(d,f)

(a,b,c,e,g)

(c,e)

(a,b)

(a,b,c,e)

l = 5/64 + 15/64 + 15/64 + 15/64 +28/64 + 15/64 +27/64 +27/64 +27/64 = 50/64 +108/64 = 158/64 = 2,46875

Тогда:

X → l = 1

XX → l = 0,844

XXX → l = 0,823

H = 0,81

Пусть q (количество букв в кодируемом алфавите) = 2:

H(α) ≤ l(x) ≤ H(x) + 1

l(x) – 1 ≤ H(x) ≤ l(x)

H^k(x) = H(xx….x) → (по т. Шеннона) l^k(x) – 1 ≤ H^k(x) ≤ l^k(x)

Тогда H^k(x) = k H(x)

По определению l^k(x) = k l(x) (правильнее l(x) = 1/k l^k(x)). Получим: l(x) – 1/k ≤ H(x) ≤ l(x). Устремляем к бесконечности и делаем l(x) сколь угодно близким к H(x).

За такую точность приходится платить трудоемкостью алгоритмов кодирования (декодирования).

8.4Алгоритм арифметического кодирования

Его появление было связано с попыткой обойти сложности кодирования (декодирования) блочного алгоритма.

0 2/3

1 1/3

l(x) = 2/3 * 1 + 1/3 *1 = 1

H(x) = 2/3 log 3/2 + 1/3 log 3 = 0,918

Разбиваем отрезок

½ ¾

0 0 2/3 1 1

2) Берем точку следующего вида: k/2^m , k, m – натуральные, m – минимально возможное

3) Двоичная запись числа k

Этот метод используется при более сложных случаях:

0 1

00 01 10 11

000 001 010 011 100 101 110 111

0 8/27 4/9 16/27 2/3 22/27 8/9 26/27 1

a 000 1/4 01 8/27 01

b 001 3/8 011 4/27 110

c 010 2/4 1 4/27 000

d 011 5/8 101 2/27 100

e 100 3/4 11 4/27 001

f 101 7/8 111 2/27 101

g 110 15/16 1111 2/27 1110

h 111 31/32 11111 1/27 1111

Если k/2^m и k/2^p, то существуют варианты:

Ставим маркеры-разделители (код не префиксный)
p > m, число с 2^m кодир. BIN(k), а с 2^p - дописываем 0: 0BIN(k)

= 16/27 + 12/27 + 4/27 + 6/27 + 8/27 + 6/27 + 8/27 + 5/27 = 65/27 = l_A(xxx)

lA(x) = 65/81 = 0,802 (т.к. код не префиксный)

Если добавим эффективный алгоритм построения маркера, то попадем между H(x) и 1.

(a, b, c, d, e, f, g, h) → (a, b, c, d, e, f, (g, h)) → (a, b, c, (d, f), e, (g, h)) → (a, (b, g, h), c, e, (d, f)) → (a, (c, e), (d, f), (b, g, h)) → (a, (c, e), (d, f, b, g, h)) → ((a, c, e), (b, f, d, g, h))