Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ИТ в рекламе лекции.doc
Скачиваний:
112
Добавлен:
17.04.2014
Размер:
1.58 Mб
Скачать

3.3.4. Средства сжатия данных (архиваторы)

Предназначены для создания архивных файлов, в которых объем уменьшается за счет:

  • повышения плотности записи информации;

  • удаления информации, которую программа-архиватор расценивает как избыточную.

Степень сжатия данных может быть разная. Она зависит:

  • от типа данных,

  • от формата их записи,

  • от используемой программы-архиватора.

При хорошей архивации можно уменьшить объем файла от 2 до 100 раз. При малоэффективной архивации будет наблюдаться сжатие в 30, 10, а то и в 2%. Если сжатие отсутствует, то это значит, что файл при создании уже был автоматически заархивирован.

Для чего полезна архивация?

1. При передаче данных. Не архивированный файл может не поместиться на носитель, а архивированный поместится. Хотя, для современных флэш-накопителей эта проблема стала мало актуальной.

В ряде случаев с архивом работать удобнее, чем с отдельными файлами. Например, по электронной почте можно передать вложения в виде одного архива вместо того, чтобы вкладывать в письмо по отдельности каждый файл (которых может быть много, больше предельного лимита вложений).

2. При хранении. Большие группы файлов и каталогов сводятся в один архивный файл. Архиваторы часто используют для создания резервных копий ценных данных.

Распространенной операцией является сжатие данных на жестком диске, когда его емкость оказывается недостаточной. Сжатию подвергаются файлы, к которым пользователи давно не обращались.

В любых алгоритмах сжатия реализуется только три способа удаления избыточной информации:

  • изменение содержания данных;

  • изменение структуры данных;

  • изменение как содержания, так и структуры данных.

Обратимое сжатие.

При обратимом сжатии происходит только изменение структуры данных. Здесь проделав разархивацию в обратном порядке можно получить в точности исходный файл. Примеры форматов обратимого сжатия:

.gif, .tif– для графики;

.avi– для видео;

.zip, .rar, .cab– универсальные форматы, для любых типов данных.

Примеры изменения структуры данных при сжатии.

1. Алгоритм RLE, здесь происходит замена длинных одинаковых последовательностей на две цифры: код данных и коэффициент повтора. Таким образом, последовательность:

0; 0; 0; 32; 32; 255; 255; 255; 255 заменяется на:

0; 3; 32; 2; 255; 4. вместо 9 чисел получили 6.

Этот алгоритм применяется в графическом формате GIF, его использование существенно снижает размер изображений и делает удобным использование файловGIFв Интернете. Еще большую роль сжатие играет при созданииGIF-анимации.

2. Алгоритм KWE (KeywordEnkoding, кодирование ключевых слов), используется для архивации текста. Здесь слова могут быть заменены на последовательность из 2-х байт (а это одна-две буквы). Можно таким образом заменить 65,5 тысяч наиболее часто встречающихся слов.

Но в этом случае к файлу надо прикладывать словарь замен, за счет которого длина коротких документов может не уменьшится, в возрасти. Эффективность метода KWEсущественно зависит от длины документа. Хорошая степень архивации наблюдается для баз данных и англоязычных текстов. С русскоязычными документами, в которых имеется много приставок, суффиксов и окончаний алгоритм работает заметно хуже.

Это самые простые варианты, имеются и более сложные алгоритмы. При этом современные средства архивации используют синтетические алгоритмы, основанные на комбинации нескольких теоретических методов..

Необратимое сжатие.

В методах, где каким-либо образом изменяется содержания данных, после разархивирования не происходит полного восстановления исходного файла. Часть информации теряется безвозвратно, это сжатие с потерей информации. Методы архивации с потерей информации применяются главным образом к мультимедийным данным (графика, звук, видео). Самыми распространенными мультимедийными форматами такого рода являются:

  • .jpg – для графических данных;

  • .mp3 – для сжатия звука;

  • .mpg – для видеоданных.

Форматы необратимой архивации могут достигать высокой степени сжатия (в 25 – 100 раз). Это бывает важно для мультимедийных файлов, которые часто имеют большие размеры.

Как правило, человеческие зрение и слух не способны воспринять все богатство цвета, звука, мгновенных движений, закодированных в мультимедийных файлах. Поэтому часть видео и аудио оттенков, нюансов удаляют, оставляя лишь самые грубые градации. Ухудшение качества при просмотре, воспроизведении будет незаметно, особенно на аппаратуре невысокого класса.

Но при обработке в графических, аудио, видео редакторах происходит дальнейшее снижение качества, которое уже может стать хорошо заметным визуально, вплоть до полной потери смысла. Поэтому для профессиональной работы с визуальной и аудио информацией файлы с потерей качества непригодны.

К текстам, базам данных, тем более к программному коду методы с потерей информации неприменимы. Здесь любая потеря информации равнозначна потере ценности и смысла.

Архивированные форматы делятся на еще на две группы. В непосредственно используемых форматах файлы не надо предварительно распаковывать, они уже готовы к применению. Почти все из приведенных выше форматов относятся к этой группе.

Форматы, требующие разархивации перед использованием. Наибольшее распространение получили два формата универсальной архивации данных:zip и rar. Для них существуют специальные программные средства.

Программы сжатия данных.

Для Windowsосновными программами-архиваторми являютсяWinZip и WinRAR, они обладают большим объемом возможностей, поэтому носят названиядиспетчеры архивов.

Базовые функции диспетчеров архивов:

  • создание архивов;

  • извлечение файлов из архивов;

  • добавление файлов в архив;

  • создание самораспаковывающихся архивов;

  • создание распределенных архивов;

  • восстановление поврежденных архивов (полное и частичное);

  • защита архивов.

Самораспаковывающиеся архивыспособны проводить разархивацию даже если на компьютере не установлена программа-архиватор. К архиву присоединяется небольшой программный модуль, который производит автоматическую распаковку файлов при вызове архива на компьютере. Если вы не уверены, есть ли архиватор на компьютере, куда вы передаете архив, то лучше его сделать самораспаковывающимся.

Распределенный архив разбит на фрагменты (тома), которые можно записать на несколько носителей. Такие архивы были полезны для дискет, емкость которых составляет всего 1,44 Мб.

Защиту архивов осуществляют при помощи пароля, без которого просмотреть и распаковать архив не удастся. Для надежности лучше, чтобы пароль был достаточно длинным (не менее 7 символов), содержал текст и знаки препинания.

К дополнительным функциям архиваторов относится:

  • просмотр файлов без извлечения из архива;

  • поиск файлов и данных в архиве;

  • установка программ из архивов без предварительной распаковки;

  • проверка на вирусы до распаковки архива;

  • криптографическая защита архивной информации;

  • создание самораспаковывающихся многотомных архивов;

  • настройка коэффициента сжатия информации.