Классифкация алгоритмов компрессии данных.

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Московский государственный технологический университет "Станкин"

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

EVM_ekzamen.docx

Скачиваний:

Добавлен:

01.07.2025

Размер:

242.56 Кб

Скачать

☆

1 / 91 2 3 4 5 6 7 8 9 > Следующая >>>

Классифкация алгоритмов компрессии данных.

Неискажающие (loseless) методы сжатия гарантируют, что декодированные данные будут в точности совпадать с исходными;

Искажающие (lossy) методы сжатия (называемые также методами сжатия с потерями) могут искажать исходные данные, например за счет удаления несущественной части данных, после чего полное восстановление невозможно.

Первый тип сжатия применяют, когда данные важно восстановить после сжатия в неискаженном виде, это важно для текстов, числовых данных и т. п. Полностью обратимое сжатие, по определению, ничего не удаляет из исходных данных. Сжатие достигается только за счет иного, более экономичного, представления данных.

Второй тип сжатия применяют, в основном, для видео изображений и звука. За счет потерь может быть достигнута более высокая степень сжатия. В этом случае потери при сжатии означают несущественное искажение изображения (звука) которые не препятствуют нормальному восприятию, но при сличении оригинала и восстановленной после сжатия копии могут быть замечены.

Компрессия данных. Метод Running и его модификации.

Это самый простой из методов упаковки информации. В исходной строке (сообщении) отыскиваются достаточно длинные серии следующих подряд друг за другом одинаковых символов, которые затем заменяются на более короткую комбинацию:

Алфавит = {A…Z} (26 символов)

Message = ”ABBBCCCCCCCDEFG” (15 символов)

Code_message = ”ABBB Х₁ Х₂Х₃ DEFG”

Х₁ – специальный символ-метка, например, отсутствующий в исходной строке (M), по которому декодировщик узнает, что в этом месте нужно сделать обратную замену.

Х₂– сам тиражируемый символ (C).

Х₃ – счетчик повторов (должен быть задан символами того же алфавита, в данном примере длина серии ССССССС равна 7, используем 7-й символ алфавита abcdefG) Получается, что при наилучшем раскладе удастся сжать 26 символов до 3.

Code_message = ”ABBB M C G DEFG”

Осталось только передать, какой символ выступает в роли метки. Проще всего добавить его на первое место в сообщении:

Code_message = ”MABBB M C G DEFG” (12 символов)

Ratio = 12/15 *100% = 80% (всегда считаем выгоду)

Компрессия данных. Метод lzw.

История этого алгоритма начинается с опубликования в мае 1977 г. Дж. Зивом (Jacob Ziv) и А. Лемпелем (Abraham Lempel) статьи в журнале "Информационные теории" под названием "IEEE Trans". В последствии этот алгоритм был доработан Терри А. Велчем (Terry Archer Welch) и в окончательном варианте отражен в статье "IEEE Compute" в июне 1984 . В этой статье описывались подробности алгоритма и некоторые общие проблемы с которыми можно столкнуться при его реализации. Позже этот алгоритм получил название - LZW (Lempel - Ziv - Welch).

Алгоритм LZW представляет собой алгоритм кодирования последовательностей неодинаковых символов.

M = "Класс TSuperCollection был порожден от TCollection" (50 символов)

Алфавит явно расширен = {а…яА…Яa…zA…Z…}

В сообщении обнаружен повтор. Закодируем его по схожему принципу:

C = "Класс TSuperCollection был порожден от T Х₁ Х₂Х₃" (50 символов)

Х₂– в этот раз данное поле содержит указатель на начало оригинальной серии

(13-я позиция = символ л)

C = "MКласс TSuperCollection был порожден от T M ли" (44 символа)

Ratio = 44/50 *100% = 88%

Очевидным преимуществом алгоритма является то, что нет необходимости включать таблицу кодировки в сжатый файл (самообучающийся алгоритм). Другой важной особенностью является то, что сжатие по алгоритму LZW является однопроходной операцией.

При компьютерной реализации обычно генерируется таблица замен для всех комбинаций из 3,4,5 и т.д. найденных последовательностей.

1 / 91 2 3 4 5 6 7 8 9 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.07.20252.37 Mб0Data Structures and Algorithms in C++ 2e (На ру...docx
#
01.07.202532.03 Кб1diagnosticheskaya_rabota_po_geografii_9_klass.docx
#
01.07.2025115.27 Кб0Dif_zachyotOGSE_05_isprav_-_kopia.docx
#
01.07.2025142.34 Кб0DZ_TERMODINAMIKA.doc
#
01.05.2025211.46 Кб0Ekonomika_predpriatia госы.doc
#
01.07.2025242.56 Кб0EVM_ekzamen.docx
#
01.07.2025113.66 Кб0Exercises_3-21_modification (2).doc
#
01.03.2025173.2 Кб0fil.docx
#
01.07.20251.15 Mб0fizika.docx
#
01.07.2025711.68 Кб0Histo.docx
#
01.07.202564.05 Кб0hist_1-13.docx

Классифкация алгоритмов компрессии данных.

Компрессия данных. Метод Running и его модификации.

Компрессия данных. Метод lzw.