- •Архиваторы и архивация данных. Методические указания к выполнению лабораторной работы
- •1. Что такое архиватор?
- •1.2. Виды сжатия.
- •1.3. Параметры сжатия (основные характеристики архиваторов).
- •1.4. Алгоритмы сжатия
- •2. Виды архивов.
- •3. Форматы архивов.
- •4.Сжатие текстовых, графических и мультимедийных данных.
- •5. Порядок выполнения работы.
- •6. Контрольные вопросы.
- •Что такое архиватор?
ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ
ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ
ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
ДОНСКОЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ
Кафедра «Автоматизация производственных процессов»
Архиваторы и архивация данных. Методические указания к выполнению лабораторной работы
по дисциплине
«Вычислительные машины, системы и сети»
Ростов-на-Дону
2010
Составители: асп. С.В. Носачёв
Н.Е. Чистяков
Методические указания к лабораторной работе Архиваторы и архивация данных: по курсу «Вычислительные машины, системы и сети». - Ростов н/Д: Издательский центр ДГТУ 2010. 8с.
Печатается по решению методической комиссии факультета «Автоматизация, мехатроника и управление»
Рецензент: проф. И.А. Семко
© Издательский
центр ДГТУ, 2010
Цель работы: ознакомление с программами архивации файлов, типами архивов, а также изучение влияния различных типов файлов на степень их сжатия.
На сегодняшний день уже сложно представить проблему переноса и хранения файлов. Работа с большим количеством файлов, объем которых в свою очередь является немалым, невозможна без программ архиваторов, позволяющих правильно организовать передачу данных.
1. Что такое архиватор?
Определение архиватора напрашивается само собой: архиватор - это программный продукт, позволяющий объединить несколько файлов в один архив, а также позволяющий изменять путем сжатия размер архивируемых данных.
Принцип работы архиватора, достаточно прост. Если детально рассмотреть любой файл, то можно обнаружить, что он состоит из некоторого набора нолей и единиц. Их количество и взаимное расположение зависит от того, что это за файл, однако битовая последовательность может быть рассмотрена и с точки зрения комбинаторики. Предположим, есть некоторый фрагмент данных:
110110110110
Независимо от того, кто и для чего его применяет, во фрагменте наблюдается определенная закономерность. Последовательность "110" повторяется четыре раза подряд. Таким образом, появляется возможность заменить вышеуказанный фрагмент следующей последовательностью:
КЛЮЧ \ повтор \ повтор \ повтор \
Где под ключом обозначается участок 110, а символ повтора означает, что на его месте должен находиться тот ключ, что и в предыдущем. Если условно сказать, что повтор обозначается как 1, то исходный фрагмент преобразуется в:
110111
В результате из последовательности длиной двенадцать бит получается последовательность в шесть бит. То есть применение алгоритма кодирования позволило сжать исходный файл в два раза. Иными словами идея работы архиватора состоит в отслеживании и замене повторяющихся участков кода какого-либо файла определенным ключом, за счет чего и происходит сжатие файла.
В архив можно поместить как один файл, так и несколько, причём можно заархивировать целую папку, вместе с содержащимися в ней файлами и другими папками, если они там присутствуют. Ну и, конечно, кто-то должен уметь выполнять обратную операцию: извлечение файлов из архива.
Эту процедуру выполняет распаковщик, который в подавляющем большинстве случаев объёдинён в одно целое с программой-архиватором.
Архив почти всегда содержит метаданные - данные, характеризующие или поясняющие другие данные или какую-либо информацию, например:
-
Имена файлов
-
Права на доступ к файлам
-
Размеры файлов
-
Даты изменения и создания файлов
-
Контрольные суммы файлов, для проверки их целостности после распаковки
-
Размер и контрольную сумму самого архива
-
Данные для восстановления (если они добавлялись)
-
Цифровая подпись создателя архива (если добавлялась)
Для сжатия файлов требуется некоторое время, причём длительность архивации зависит от количества файлов и их типа, используемого алгоритма сжатия, а также от технических характеристик компьютера, на котором выполняется эта процедура, в частности, от частоты процессора, объёма оперативной памяти.
Создание архивов предназначается для длительного хранения файлов, которые используются редко, но занимают достаточно много полезного места, однако представляют ценность для пользователя и просто удалить их, чтобы высвободить пространство, нельзя. Но архивация файлов, с которыми работают каждый день, просто не имеет смысла.