Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Кузбасский государственный технический университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Turchin_D_E_Teoria_informatsii_Praktikum_2013.doc

Скачиваний:

Добавлен:

01.05.2025

Размер:

2.06 Mб

Скачать

☆

<<< < Предыдущая 3 4 5 6 7 8 9 10 11 12 13 14 1516 / 2716 17 18 19 20 21 22 23 24 25 26 27 > Следующая >>>

4.4. Контрольные вопросы

В чем заключается сущность эффективного кодирования?
Каковы основные задачи эффективного кодирования?
Как определяется средняя длина кодового слова?
Чему равна нижняя граница эффективного кодирования?
Как определяется эффективность и избыточность кода?
Как осуществляется кодирование источника по методу Шеннона-Фано?
В каком случае метод Шеннона-Фано гарантированно обеспечивает получение эффективного кода?
С помощью какой операции в методе Хаффмана обеспечивается получение вспомогательных символов?
Как получают кодовые слова по методу Хаффмана?

5. Сжатие информации методом арифметического кодирования

5.1. Цель работы

Цель работы – приобрести умение сжимать информацию с помощью метода арифметического кодирования, а также умение декодировать арифметический код.

Работа рассчитана на 4 часа.

5.2. Основные теоретические сведения

5.2.1. Описание метода арифметического кодирования. Декодирование арифметического кода

Описание метода арифметического кодирования.

Арифметическое кодирование представляет собой метод сжатия информации, в котором кодируемая последовательность символов представляется в виде дробного числа x, принимающего значения из интервала 0 < x < 1.

Пусть задан дискретный источник сообщений [S, p(s_i)] с алфавитом S={s₁, … , s_m} и распределением вероятностей p(s_i). На выходе источника задана последовательность символов

;

где i – порядковый номер символа в алфавите; k – порядковый номер символа в последовательности.

Для заданной последовательности требуется получить кодовое слово:

;

где x_j = 0 или 1.

Определим величины, называемые кумулятивными вероятностями символов s_i:

q(s₁) = 0; q(s₂) = p(s₁); … .

В рекурсивной форме данные вероятности можно записать следующим образом:

q(s_i) = q(s_i_–1) + p(s_i_–1). (5.Х)

Определим величины F_k и G_k, представляющие собой нижнюю границу и длину интервала вероятностей на шаге k:

F_k = F_k_{– 1} + q(s_i)∙G_k_–
1; (5.Х)

G_k = p(s_i)∙G_k_–
1. (5.Х)

При k=0 (начальный шаг алгоритма) принимают F=0, G=1.

Искомое кодовое слово определяется как L знаков после запятой в двоичной записи числа F_M + G_M/2, где F_M G_M – нижняя граница интервала вероятностей и его длина, соответствующие последнему (M-му) символу последовательности:

bin[F_M + G_M/2] = 0, → (5.Х)

Таким образом, метод арифметического кодирования заключается в последовательном нахождении величин q(s_i), F_k, G_k, для i = 2, 3, … , m и k = 1, 2, … , M, пока не будут определены значения F_M и G_M. На основе последних значений F_M и G_M определяется искомое кодовое слово.

Длина L кодового слова , обеспечивающая однозначное декодирование последовательности символов определяется следующим образом:

где – округление числа, стоящего в скобках, до целого в большую сторону.

Для пояснения метода арифметического кодирования можно прибегнуть к его графической интерпретации. В этом случае интервал [0, 1) вероятностей появления символов рассматривается в виде отрезка длиной 1. При этом символам на данном отрезке будут соответствовать непересекающиеся полуинтервалы длинами, равными вероятностям появления символов (рис 5.1). Кумулятивные вероятности соответствуют началам этих полуинтервалов. Эти точки идентифицируют сообщения источника.

Рис. 5.1. Графическая интерпретация арифметического кодирования

На каждом шаге алгоритма производится пересчет границ всего отрезка, в котором будет расположено число, соответствующее кодовому слову. Число F_k в этом случае является начальной точкой отрезка на шаге k, а число G_k является длиной данного отрезка.

❒ Пример 5.1. Арифметическое кодирование заданной последовательности символов.

Пусть задан дискретный источник сообщений с алфавитом S={s₁, s₂, s₃} и распределением вероятностей p(s₁)=0,1, p(s₂)=0,6, p(s₃)=0,3. Произведем арифметическое кодирование последовательности длиной M=5. Процесс арифметического кодирования последовательности представлен в таблице 5.1.

Длина кодового слова будет

, то есть после запятой в кодовом слове должно быть не меньше 9 знаков.

Таблица 5.1.

Арифметическое кодирование последовательности

Шаг k	s_i		p(s_i)	q(s_i)	F( )	G( )
0	–	–	–	–	0	1
1	s₂	s₂	0,6	0,1	0,1	0,6
2	s₃	s₂s₃	0,3	0,7	0,52	0,18
3	s₂	s₂s₃s₂	0,6	0,1	0,538	0,108
4	s₁	s₂s₃s₂s₁	0,1	0	0,538	0,0108
5	s₂	s₂s₃s₂s₁s₂	0,6	0,1	0,53908	0,00648

Отсюда кодовое слово запишется следующим образом:

x = (0,53908 + 0,00648/2)₁₀ = (0,54232)₁₀ =

= 0,100010101₂ → = 100010101.

Графическая интерпретация арифметического кодирования показана на рис. 5.2. ❒

<<< < Предыдущая 3 4 5 6 7 8 9 10 11 12 13 14 1516 / 2716 17 18 19 20 21 22 23 24 25 26 27 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
10.05.2015215.04 Кб56Titulny_list.doc
#
10.05.201560.87 Кб8TMM.docx (фи).docx
#
01.07.202513.34 Mб1TOM1_Shestaki.doc
#
04.12.20182.05 Mб106transport_kursovaya.doc
#
08.05.20192.68 Mб5Tunneling Shaft sinking and drifting.doc
#
01.05.20252.06 Mб0Turchin_D_E_Teoria_informatsii_Praktikum_2013.doc
#
01.05.20255.93 Mб0UMK_PO_EKONOMIKE_KURSOVIK.doc
#
10.05.2015389.63 Кб8Unit 4.doc
#
14.11.201990.11 Кб0UNIT I.doc
#
10.05.2015831.49 Кб8Unit2.doc
#
10.05.2015188.93 Кб9Unit3.doc