Алгоритмы сжатия без потерь

Многоцелевые (т.е. можно применять для графики, аудио и т.д.):

Кодирование длин серий (RLE);

Пиксельное изображение при хранении преобразуется в цепочку данных. Цепочка данных может включать в себя:

описание цвета пикселя (три / четыре числа) является кодом цвета в соответствии с той или иной цветовой моделью;
размер изображения в пикселях.

В такой последовательности встречаются цепочки (последовательности) одинаковых байтов. Самым простым способом, который позволяет уменьшить объем файла, является поиск повторяющихся кодов (символов, цвета и т. п.) — серий одинаковых значений. Каждая такая серия фиксируется двумя числами: первое указывает количество одинаковых значений, а второе — само значение. Алгоритм рассчитан на деловую или декоративную графику — изображения с большими областями локального (повторяющегося) цвета.

Исходное значение:АВСАВС;

Итоговое значения: 1А1В1С1А1В1С

Ø метод Хаффмана;

Алгоритм Хаффмана основан на определенном анализе документа и вычислении частоты встречаемости цветовых значений (или значений других видов информации), а затем этим значениям в соответствии с рангом присваиваются коды сначала с минимальным количеством битов, а затем по мере снижения частоты (уменьшения ранга) используется все большее количество двоичных разрядов. Такой способ кодирования иногда называют алфавитным кодированием.

Пример:

В следующей последовательности букв ААСАААВАВАВВАВСАСВСАСААССС заметно, что чаще всего встречается символ А (12 раз), затем символ С (9 раз) и, наконец, символ В (5 раз). Следовательно, символ А можно заменять кодом 0, символ С — кодом 1, а символ В — кодом 00. И так далее, если элементов для кодирования больше. В результате, если считать, что каждый символ в нашем примере кодируется 1 битом, то для передачи строки потребуется 208 битов, а в сжатом виде объем информации составит только 31 бит.

Ø алгоритм LZW.

Алгоритм, названный в честь своих создателей Лемпеля, Зива и Велча (Lempel, Ziv и Welch), не требует вычисления вероятностей встречаемости символов или кодов. Основная идея состоит в замене совокупности байтов в исходном файле ссылкой на предыдущее появление той же совокупности.

Процесс сжатия выглядит следующим образом. Последовательно считываются символы входного потока и происходит проверка, существует ли в созданной таблице строк такая строка. Если такая строка существует, считывается следующий символ, а если строка не существует, в поток заносится код для предыдущей найденной строки, строка заносится в таблицу, а поиск начинается снова.

Например, если сжимают байтовые данные (текст), то строк в таблице окажется 256 (от "0" до "255"). Для кода очистки и кода конца информации используются коды 256 и 257. Если используется 10-битный код, то под коды для строк остаются значения в диапазоне от 258 до 1023. Новые строки формируют таблицу последовательно, т. е. можно считать индекс строки ее кодом. Этот метод гораздо совершеннее RLE для областей с переходами цветов, однако кодировка в него требует больше системных ресурсов.

Метод LZW включается в некоторые графические форматы, например: TIFF; GIF.

Пример:

http://algolist.manual.ru/compress/standard/lzw.php (для искушённых)

Сжатие графики:

PNG

PNG (portable network graphics) — растровый формат хранения графической информации, использующий сжатие без потерь по алгоритму Deflate ( комбинация алгоритма LZ77 и алгоритма Хаффмана). Формат позволяет хранить три типа изображений: greyscale (для описания изображения используется один канал — белый), indexed-colour (используется палитра цветов, как в GIF) и truecolor (используется три канала — RGB). Самое главное преимущество формата PNG — это новые алгоритмы сжатия (в отличии от GIF, который сжимает только горизонтальные одноцветные области).

Вторым важным преимуществом является фильтрация строк (scanline filtering, или delta filters), благодаря которой PNG-упаковщик может получить гораздо более удобные данные для сжатия. Рассмотрим на примере, как они работают. Возьмем изображение 5×5 пикселей с горизонтальным градиентом и схематично отобразим, как оно может быть сохранено в файле (каждое число — уникальный цвет).

Преобразование PNG:

Перед каждой строкой появилась цифра 2. Это — фильтр, который был применен к строке. В данном случае это фильтр Up, который говорит декодеру: «Для текущего пикселя возьми значение пикселя выше и прибавь к нему текущее значение». В нашем случае это 0, потому что цвета текущего и верхнего пикселей не отличаются. А эти данные можно эффективней упаковать, если у нас достаточно большое изображение.

Почему может? Потому что в нашем идеализированном случае более эффективной была бы такая схема:

Тут применен фильтр 1 под названием Sub, который говорит декодеру: «Возьми значение пикселя левее текущего и прибавь ему текущее значение». В данном случае 1.

После фильтрации все строки (вместе со значениями фильтров) объединяются в одну последовательность, которая затем сжимается deflate-алгоритмами.

Всего существует 5 фильтров:

None (никакой фильтрации),
Sub (от текущего значения отнять значение левого пикселя),
Up (отнять верхний пиксель),
Average (отнять среднее значение левого и верхнего пикселей) ,
Paeth (подставить значение верхнего, левого или верхнего левого пикселя).

Внимание! Каждая строка может иметь свой фильтр. Получается, что способов фильтрации одного изображения может быть 5^{высота
картинки}. В общем-то, задача хорошего кодировщика как раз заключается в том, чтобы подобрать такие значения фильтров, при которых объем файла будет минимальным.

<<< < Предыдущая 1 23 / 223 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.04.20257.52 Mб0Шпоргалка .docx
#
01.05.2025365.57 Кб0Шпоргалки по Управлению персоналом.doc
#
14.04.2015387.07 Кб30шпоры БД.doc
#
28.08.2019471.04 Кб25шпоры для ГОСов ч.1.doc
#
28.08.2019626.18 Кб38шпоры для ГОСов ч.2.doc
#
01.05.2025686.98 Кб2шпоры кгг.docx
#
22.04.2019330.75 Кб38шпоры по физике.doc
#
21.03.2016516.56 Кб44Шрифты.pdf
#
20.03.2016775.17 Кб71Щукин_А_Н_Расчетная_работа_Ушаков_2.doc
#
20.03.2016348.16 Кб161Э.Цветков_Тайные пружины человеческой психики.doc
#
14.04.2015115.57 Кб44Эволюция звезд.docx