3.2. Кодирование Хаффмана

Кодирование Хаффмана - это технология кодирования символов, которая может быть эффективной для сжатия различных символов, встречающихся с разной частотой. Основная идея этой технологии заключается в кодировании отдельных символов битовыми строками различной длины, причем наиболее часто встречающиеся символы кодируются строками наименьшей длины. Кроме того, код любого символа длиной n не должен совпадать с первыми n символами кода какого-либо другого символа.

Предположим, что некоторые данные написаны с помощь символов А, Б, В, Г, Д, тогда с учетом относительной частоты с которой эти символы встречаются, у них различные коды (табл. 1).

Таблица 1

Коды символов

Символ	Частота, %	Код
А	35	1
В	30	01
Г	20	001
Д	10	0001
Б	5	0000

Символ А встречается чаще остальных, и потому имеет самый короткий код, состоящий из одного бита. Все остальные коды должны быть длиннее, однако нельзя использовать код на основе одного нуля, так как он будет совпадать с начальной частью других, более длинных кодов. Оценочно можно сказать, что в среднем общая длина закодированного текста на 40% меньше, чем при отсутствии кодирования.

Глоссарий

Диспетчер дисков	Программное обеспечение, контролирующее перемещение данных между оперативной памятью и диском
Диспетчер файлов	Программное обеспечение, управляющее размещением данных на диске и структурами данных
Индекс	Средство ускорения операции поиска записей в таблице, а также выполнения других операций, использующих поиск: извлечение, модификация, сортировка и т.д.
Индексный файл	Файл, в котором хранится информация индекса
Кодирование Хаффмана	Технология кодирования символов, которая может быть эффективной для сжатия различных символов, встречающихся с разной частотой
Сжатие на основе различий	Технология сжатия данных в БД, которая предусматривает замену некоторого значения сведениями о его отличиях от предыдущего значения
Словарь данных	Часть СУБД, определяющая структуру пользовательских данных и возможности их использования
Стратегический селектор	Программное обеспечение, преобразующее требование пользователя в эффективную для исполнения форму
Транзакция	Последовательность операций над БД, рассматриваемых СУБД как единое целое
Хеширование	Технология быстрого прямого доступа к хранимой записи на основе заданного значения некоторого поля, при этом, поле не обязательно должно быть ключевым

<<< < Предыдущая 1 2 3 4 56 / 66

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
04.03.20161.55 Mб112EUMK_Strategichesky_marketing.doc
#
04.03.2016190.98 Кб258femp.doc
#
20.04.2019299.01 Кб10Filosofia_-_konspekty.doc
#
04.03.20161.85 Mб41filosofia_3_kurs(1).rtf
#
04.03.2016124.42 Кб26fiz.doc
#
04.03.201649.95 Кб31FIZIChESKAYa_ORGANIZATsIYa_BAZ_DANN_Kh.docx
#
04.03.2016175.57 Кб236fizika.docx
#
04.03.201647.83 Кб244fizra.docx
#
06.09.201958.37 Кб2FOTO_VID.doc
#
15.09.2019306.18 Кб9gdi.doc
#
04.03.201625.45 Кб20Glava_1.docx