Скачиваний:
75
Добавлен:
10.12.2013
Размер:
115.2 Кб
Скачать

6.2.Архивация файлов

Несмотря на то, что объем внешней памяти ПК все время увеличивается, необходимость в архивации файлов не уменьшается. Причины этого следующие :

  1. Современные документы включают в себя рисунки, диаграммы, форматированный текст и не помещаются на 1-2 дискеты.

  2. При передаче информации файлы также необходимо сжимать, т. к. передача по модемным линиям связи дорогая.

  3. Необходимо делать резервные копии информации. При этом возникает проблема, что нужно хранить в резервных копиях. Проще всего сохранять все, но при этом быстро исчерпывается свободное место.

6.2.1. Алгоритмы сжатия

Несмотря на изобилие алгоритмов сжатия данных, теоретически есть только три способа уменьшения их избыточности. Это либо изменение содержания данных, либо изменение их структуры, либо и то и другое вместе.

Если при сжатии данных происходит изменение их содержания, метод сжатия необра­тим и при восстановлении данных из сжатого файла не происходит полного вос­становления исходной последовательности.

Сжатие с потерей информации означает, что после распаковки архива будет получен документ, который отличается от исходного. Чем больше степень сжатия, тем больше величина потери и наоборот.

Такие методы применимы только для тех типов данных, для которых формальная утрата части содержания не при­водит к значительному снижению потребительских свойств. В первую очередь, это относится к мультимедийным данным: видеорядам, музыкальным записям, звуко­записям и рисункам. Методы сжатия с потерей информации обычно обеспечивают гораздо более высокую степень сжатия, чем обратимые методы, но их нельзя при­менять к текстовым документам, базам данных и, тем более, к программному коду. Характерными форматами сжатия с потерей информации являются:

  • JPG для графических данных;

  • MPG для видеоданных;

  • М РЗ для звуковых данных.

Потеря информации при сжатии таких файлов воспринимается как некоторый шум (в мультимедийных файлах). Выигрыш получается значительный: в музыке в 10-15 раз, в фото и видеоматериалах – в 20-30 раз.

Если при сжатии данных происходит только изменение их структуры, то метод сжатия обратим. Из результирующего кода можно восстановить исходный массив I путем применения обратного метода. Обратимые методы применяют для сжатия любых типов данных. Характерными форматами сжатия без потери информации являются:

  • .GIF, .TIF, .PCX и многие другие для графических данных;

  • .AVI для видеоданных;

  • .ZIP, .ARJ, .RAR, .LZH, .LH, .CAB и многие другие для любых типов данных.

Сжатие без потери информации применяют при передаче текстовых документов и программ. Эти методы основаны на устранении избыточности информации. Существует достаточно много обратимых методов сжатия данных, однако в их основе лежит сравнительно небольшое количество теоретических алгоритмов.

1. Примером избыточности является наличие повторяющихся фрагментов. В текстах это встречается достаточно редко, но в таблицах и графике – это обычное дело. Если, например, число 0 повторяется 20 раз, то нет смысла тратить на это число 20 байтов. Вместо этого можно записать 20,0. Алгоритмы, основанные на выявлении повторов называют методами RLE(RunLengthEncoding).

Соседние файлы в папке Иформатика