- •5.1. Организация данных и управление ими.
- •5.1.1 Данные и их обработка
- •5.1.2. Простые (неструктурированные) типы данных
- •5.1.3. Структурированные типы данных
- •5.1.3.1. Массивы
- •5.1.3.2. Записи
- •5.1.3.3. Множества
- •5.1.3.4. Очередь
- •5.1.3.5. Стек
- •5.1.3.6. Иерархическая организация данных
- •5.2. Понятие «файл» и «файловая система».
- •5.2.1. Определения
- •5.2.2. Структура файла
- •5.3. Структура файловой системы. Файловое дерево.
- •5.3.1. Состав файловой системы
- •5.3.2. Задачи файловой системы
- •5.3.3. Классификация файловых систем
- •5.3.4. Файловое дерево.
- •5.3.5. Файловая система fat
- •5.3.6. Файловая система ntfs
- •5.3.7. Сравнение fat и ntfs
- •5.4. Создание файлов, типизация файлов. Управление версиями файлов. Защита файлов.
- •5.4.1. Атрибуты файлов
- •5.4.2. Операции над файлами
- •5.4.3. Защита файлов
- •5.4.4. Типы файлов – имена и расширения
- •5.5. Сжатие информации.
- •5.5.1 Определения
- •5.5.2. Объекты сжатия
- •5.5.3. Обратимость сжатия
- •5.5.4. Алгоритмы сжатия данных без потери информации
- •5.5.4.1. Алгоритм rle
- •5.5.4.2. Алгоритм kwe
- •5.5.4.3. Алгоритм Хаффмана
- •5.5.4.4. Алгоритм Лемпеля-Зива (lz77, lzw, lzh)
- •5.5.4.5. Алгори́тм Ле́мпеля — Зи́ва — Ве́лча (lzw)
- •5.5.4.6. Свойства алгоритмов сжатия
- •5.5.4.7. Синтетические алгоритмы
- •5.5.5. Алгоритмы сжатия данных с потерей информации
- •5.5.5.1. Сжатие изображений
- •5.5.5.2. Формат gif
- •5.5.5.3. Формат jpeg
- •5.5.5.4. Другие методы сжатия
- •5.5.5.5. Сжатие звука
5.5.4.6. Свойства алгоритмов сжатия
Таблица 6. Свойства алгоритмов сжатия
Алгоритм |
Выходная структура |
Сфера применения |
Примечание |
RLE (Run-Length Encoding) |
Список (вектор данных) |
Графические данные |
Эффективность алгоритма не зависит от объема данных |
KWE (Keyword Encoding) |
Таблица данных (словарь) |
Текстовые данные |
Эффективен для массивов большого объема |
Алгоритм Хафмана |
Иерархическая структура (дерево кодировки) |
Любые данные |
Эффективен для массивов большого объема |
Алгоритм Лемпеля-Зива |
Таблица данных (словарь) |
Любые данные |
Эффективен для массивов большого объема |
[65 слайд]
5.5.4.7. Синтетические алгоритмы
Рассмотренные выше алгоритмы в «чистом виде» на практике не применяют из-за того, что эффективность каждого из них сильно зависит от начальных условий. В связи с этим, современные средства архивации данных используют более сложные алгоритмы, основанные на комбинации нескольких теоретических методов. Общим принципом в работе таких «синтетических» алгоритмов является предварительный просмотр и анализ исходных данных для индивидуальной настройки алгоритма на особенности обрабатываемого материала.
Все перечисленные алгоритмы способны только устранять автокорреляции, уже существующие во входном сигнале. Очевидно, что если автокорреляций не было, то упаковки не произойдёт, поэтому гарантировать уровень сжатия эти алгоритмы не могут.
[66 слайд]
5.5.5. Алгоритмы сжатия данных с потерей информации
Для упаковки данных, полученных оцифровкой реальных сигналов, прежде всего изображений и звука, точные алгоритмы не подходят совершенно. Дело в том, что реальный сигнал всегда сопровождается тепловым, так называемым белым (равномерно содержащим все частоты) шумом. Этот шум искажает наличествующие в сигнале автокорреляции, сам же автокорреляций не имеет, поэтому обратимые алгоритмы с зашумленным сигналом справиться не могут.
Алгоритмы .JFIF (лежащий в основе распространенного формата хранения растровых изображений JPG), МРЕG, МРЗ начинаются с выполнения над входным потоком преобразования Фурье. JFIF удаляет из полученного спектра фиксированное количество частот - обычно самые слабые. Количество частот, которые надо выкинуть, определяется параметром настройки упаковщика. У JFIF этот параметр так и называется - коэффициентом упаковки, у МРЗ - битрейтом.
[67 слайд]
Профильтрованный таким образом сигнал заведомо содержит автокорреляции - даже если исходный, зашумленный, сигнал их и не содержал, такая фильтрация их создаст - и потому легко поддается упаковке. Благодаря этому, все перечисленные алгоритмы обеспечивают гарантированный уровень упаковки. Понятно, что точно восстановить по подвергнутому такому преобразованию потоку исходный сигнал невозможно, но такой цели и не ставится, поэтому все перечисленные методы относятся к разряду необратимых.
При разумно выбранном уровне упаковки результат - фотореалистичное изображение или музыкальное произведение - на взгляд (или, соответственно, на слух) практически неотличим от оригинала.
[68 слайд]