4.3.1. Метод кодирования Шеннона - Фано.

Буквы исходного алфавита записываются в порядке убывающей вероятности. Упорядоченное таким образом множество букв разбивается так, чтобы суммарные вероятности двух подмножеств были примерно равными. Всем буквам верхней половины в качестве первого символа кода присваивают 1, а буквам нижней половины – 0. Затем каждое подмножество снова разбивается на два подмножества с соблюдением того же условия примерного равенства вероятностей и с тем же условием присвоения кодовых элементов в качестве второго символа. Такое разбиение продолжается до тех пор, пока в подмножестве не останется только по одной букве кодового алфавита.

Пример: Провести эффективное кодирование ансамбля из восьми букв (знаков).

Буква x_i	Вероятности p_i	Кодовая последовательность				Длина кодового слова n_i	p_in_i	-p_ilog₂p_i
		Номер разбиения
		1	2	3	4
x₁	0,25	1	1			2	0,5	0,50
x₂	0,25	1	0			2	0,5	0,50
x₃	0,15	0	1	1		3	0,45	0,41
x₄	0,15	0	1	0		3	45	0,41
x₅	0,05	0	0	1	1	4	0,2	0,22
x₆	0,05	0	0	1	0	4	0,2	0,22
x₇	0,05	0	0	0	1	4	0,2	0,22
x₈	0,05	0	0	0	0	4	0,2	0,22

= = (0,25*2+0,25*2+0,15*3+0,15*3+0,05*4+0,05*4+0,05*4+0,15*4)=2,7 бит

= - (2*0,25*log₂ 0,25 + 2*0,15*log₂ 0,15 + 4*0,05*log₂0,05) = 2,7 бит

= 1

Метод Шеннона - Фано не всегда приводит к однозначному построению кода, так как при разбиении на подмножества можно сделать большей по вероятности как верхнюю, так и нижнюю подгруппу. Следовательно, такое кодирование хотя и является эффективным, но не всегда будет оптимальным.

4.3.2. Метод кодирования Хаффмана.

Этот метод кодирования всегда дает оптимальный код, т.е. получаемая является минимальной.

Буквы алфавита сообщения выписываются в порядке убывания вероятностей. Две последние буквы объединяют в один составной знак, которому приписывают суммарную вероятность. Заново переупорядочивают буквы по убыванию вероятностей и снова объединяют пару с наименьшими вероятностями. Продолжают этот процесс до тех пор, пока все значения не будут объединены. Такая процедура называется редукцией.

Затем строится кодовое дерево из точки, соответствующей вероятности 1, причем ребрам с большей вероятностью присваивают 1, а с меньшей - 0. Двигаясь по кодовому дереву от корня к оконечным узлам, можно записать кодовое слово для каждой буквы исходного алфавита.

Пример 1 (ПЗ№8):

Знаки(буквы)	Вероятность	Редукция								Кодовое слово по кодовому дереву
Знаки(буквы)	Вероятность	1	2	3	4	5	6	7
x₁	0,22		0,22	0,22	0,26	0,32	0,42	0,58	1		01
x₂	0,20		0,20	0,20	0,22	0,26	0,32	0,42			00
x₃	0,16		0,16	0,16	0,20	0,22	0,26				111
x₄	0,16		0,16	0,16	0,16	0,20					110
x₅	0,1		0,1	0,16	0,16						100
x₆	0,1		0,1	0,1							1011
x₇	0,04		0,06								10101
x₈	0,02										10100

корень

Пример №2 :

Буква x_i	a	b	c	d	e	f
Вероятности p_i	0,05	0,15	0,05	0,4	0,2	0,15
Кодовое слово	1001	110	1000	0	111	101
Длина кодового слова n_i	4	3	4	1	3	3

I I способ: Редукция по уровням.

x_i	x₁	x₂	x₃	x₄	x₅	x₆	x₇	x₈
p_i	0,22	0,20	0,16	0,16	0,1	0,1	0,04	0,02
код	01	00	111	110	100	1011	10100	10110
n_i	2	2	3	3	3	4	5	5
n_ip_i	0,44	0,4	0,48	0,48	0,3	0,4	0,2	0,1
-p_ilog₂p_i

= =2,8

Заметим:

1) Во втором способе при построении кодового дерева для присвоения ребрам его значений 1 и 0 необходимо использовать тот же принцип: 1 – ребру с большей вероятностью, 0 – ребру с меньшей вероятностью

2) В случае, когда в процедуре редукции несколько знаков имеют одинаковые вероятности, необходимо выбрать для очередного объединения те два из них, которые до этого имели наименьшее число объединений. Этим достигается выравнивание длин кодовых слов.

Из примера видно, что чем больше разница между вероятностями букв исходного алфавита, тем больше выигрыш кода Хаффмана по сравнению с простым блоковым кодированием.

Декодирование кода Хаффмана легко представить, используя кодовое дерево. Принятая кодовая комбинация анализируется посимвольно, в результате чего, начиная с корня дерева, мы попадаем в оконечный узел, соответствующий принятой букве исходного алфавита.

При всей простоте коды Хаффмана обладают недостатками:

1.Различные длины кодовых слов приводят к неравномерным задержкам кодирования.

2.Сжатие снижает избыточность, что соответственно повышает предрасположенность к распространению ошибок, т.е. один ошибочно принятый бит может привести к тому, что все последующие символы будут декодироваться неверно.

3.Предполагаются априорные знания вероятности букв, которые на практике не известны, а их оценки часто бывают затруднены.

<<< < Предыдущая 1 23 / 63 4 5 6 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
20.03.2016722.94 Кб189Лекции по рцб.doc
#
28.10.20181.26 Mб76Лекции по философии.doc
#
15.11.2019230.4 Кб83Лекции по химии.docx
#
24.11.20181.69 Mб152Лекции по экологии.doc
#
01.05.2025420.35 Кб3ЛЕКЦИИ СТРАХОВАНИЕ.doc
#
01.04.20252.34 Mб8Лекции-ТИ-ИС-Т_4.rtf
#
01.04.20253.57 Mб7Лекции-ТИ-ИС-Т_5.rtf
#
01.04.20254.76 Mб0Лекции-ТИ-ИС-Т_8.rtf
#
01.05.20254.25 Mб0Лекции1.doc
#
25.09.2019656.9 Кб49Лекции_Банки и базы данных.doc
#
01.03.2025398.34 Кб1Лекция 1 Принцип функционирования устройств СВЧ...doc