Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Национальный аэрокосмический университет имени Н. Е. Жуковского

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Sabelnikov_RGR3_2_2_CodingTheory.docx

Скачиваний:

Добавлен:

01.07.2025

Размер:

227.33 Кб

Скачать

☆

1 / 41 2 3 4 > Следующая >>>

МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИ

Національний аерокосмічний університет ім. М.Є. Жуковського

“Харківський авіаційний інститут”

Кафедра комп’ютерних систем та мереж

Титульный лист заполняется на украинском языке

Остальная часть отчета может быть как на украинском, так и на русском

Розрахунково-графічна робота № 2

з дисципліни “Теорія інформації та кодування”

Метод арифметичного кодування

ХАІ.503.535.14В.050102, 1105079 ПЗ

Виконав студент гр. 535Б Сабельніков І.В.Фамилия И.О.

15.04.2014

(підпис, дата)

Перевірив канд.т.н., доцент

(науковий ступінь, вчене звання, посада)

Брежнєв Є.В.

(підпис, дата) (П.І.Б.)

Харків 2014

Постановка задачи Тема работы: Сжатие текстовой информации методом арифметического кодирования. Задание:

Закодировать арифметическим кодом произвольное сообщение на русском языке (с учетом пробелов). Число символов сообщения приведено ниже для каждого варианта.
Случайным образом задать вероятностное распределение всех символов сообщения.

Вариант	Среднее число символов текста
14.	125

Для выполнения обоих задания должен быть разработан проект.

Проект должен обеспечивать вывод результатов:

- сообщение для кодирования, число символов в нем, вероятности появления символов;

- пошаговую реализацию алгоритма кодирования;

- арифметический код в двоичном и числовом виде.

Письменный отчет должен содержать:

Титульный лист. (Название РГР. Фамилия, имя, отчество, номер группы исполнителя, дата сдачи.)
Все требуемые математические соотношения для вычислений.
Распечатку текстов подпрограмм.

Выводы содержат сравнительный анализ методов Хаффмана и арифметического кодирования.

Реализация метода

Так как описание метода не требуется, приступим сразу к его реализации.

В первую очередь, всплывает проблема хранения интервалов. На каждом шаге алгоритма появляются все новые и новые цифры после запятой, и очень скоро тип Double (64 бита) уже не справляется с кодированием.

Нужно обеспечить огромную точность. Для этого будем представлять числа в виде дробей, причем в знаменателе будет находится число, которое является степенью двойки. Например, интервал . Это обеспечит легкое преобразование в двоичный вид, а также избавит нас от необходимости использовать тип с плавающей запятой.

При возрастании длины текста будет возрастать числитель. Возникает необходимость хранить большие числа целого типа. С этой задачей справится класс BigInteger, который присутствует в языках C# и Java. Этим и обусловлен выбор данных объектно-ориентированных языков.

Теперь нужно определить, как мы будем находить, какой именно знаменатель нам нужно подставлять, чтобы обеспечить дальнейшее однозначное декодирование. Худшим вариантом для алгоритма является текст, который состоит из символов, имеющих наименьшую вероятность. Для этого выберем этот "наихудший" символ и возведем его вероятность в степень длины текста. Например, длина текста k = 20, а вероятность появления символа p('ф') = 0.002. Тогда искомая величина равна . Потом переворачиваем данную дробь, получаем 9.5367431640625e+53. И последним шагом округляем полученное число в большую сторону к степени двойки. Для нашего примера это будет . Теперь наш стартовый диапазон представлен в виде . При этом знаменатели не изменяются во время выполнения алгоритма, этому подвержены только числители.

И последнее замечание. Чтобы работать с вероятностями вида 0.002, лучше их умножить на 1000, перевести в BigInteger, произвести требуемые умножения и деления, а потом не забыть разделить на 1000. При этом появляется новое ограничение: вероятности можно задавать с точностью (или любой другой, но все равно фиксированной).

1 / 41 2 3 4 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.05.20251.76 Mб1Sabelnikov_lab3_2_2_DataBases.docx
#
01.05.20251.99 Mб1Sabelnikov_lab3_2_4_DataBases.docx
#
01.05.2025711.93 Кб1Sabelnikov_lab3_2_6_DataBases.docx
#
01.05.20251.29 Mб1Sabelnikov_Report_PTICA.docx
#
01.07.2025159.98 Кб1Sabelnikov_RGR3_2_1_CodingTheory.docx
#
01.07.2025227.33 Кб1Sabelnikov_RGR3_2_2_CodingTheory.docx
#
01.07.2025779.45 Кб1Sabelnikov_RGR3_2_3_CodingTheory.docx
#
01.07.202510.39 Mб2SAFETY OF HUMAN ACTBVETEES.docx
#
01.07.2025196.1 Кб1Schodennik_3.doc
#
10.07.201992.16 Кб4SEMINAR ONE.doc
#
27.08.2019154.15 Кб2seti_petri.docx

Метод арифметичного кодування

Постановка задачи Тема работы: Сжатие текстовой информации методом арифметического кодирования. Задание:

Реализация метода