Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
OTVYeT.doc
Скачиваний:
27
Добавлен:
20.04.2019
Размер:
1.17 Mб
Скачать

14. Теоретические основы сжатия данных

Как хранение, так и передача информации обходятся участникам информацион­ного процесса недешево. Зная стоимость носителя и его емкость (Мбайт, Гбайт), нетрудно подсчитать, во что обходится хранение единицы информации, а зная про­пускную способность канала связи (Мбит/с) и стоимость его аренды, можно опре­делить затраты на передачу единицы информации. Полученные результаты обычно составляют вполне значимые величины как для корпоративных пользователей, так и для индивидуальных. В связи с этим, регулярно возникает необходимость сжи­мать данные перед тем, как размещать их в архивах или передавать по каналам связи. Соответственно, существует и обратная необходимость восстановления дан­ных из предварительно уплотненных архивов.

Характерной особенностью большинства «классических» типов данных, с кото­рыми традиционно работают люди, является определенная избыточность. Степень избыточности зависит от типа данных. Например, у видеоданных степень избы­точности обычно в несколько раз больше, чем у графических данных, а степень избыточности графических данных в несколько раз больше, чем текстовых. Кроме того, степень избыточности данных зависит от принятой системы кодирования. Так, например, можно сказать, что кодирование текстовой информации средствами русского языка (с использованием русской азбуки) дает в среднем избыточность на 20-30% больше, чем кодирование адекватной информации средствами англий­ского языка.

Для человека избыточность информации нередко связана с представлением о ее качестве, поскольку избыточность, как правило, улучшает восприятие, особенно в неблагоприятных условиях (просмотр телепередач при наличии помех, восстанов­ление поврежденного графического материала, чтение текстов в условиях недо­статочной освещенности и т. п.).

При обработке информации избыточность также играет важную роль. Так, напри­мер, при преобразовании или селекции информации избыточность используют для повышения ее качества (репрезентативности, актуальности, адекватности и т. п.). Однако, когда речь заходит не об обработке, а о хранении готовых документов или их передаче, то избыточность можно уменьшить, что дает эффект сжатия данных.

В современной информационной науке важность выполнения резервного копирования информации, находящейся на дисках, неоспорима. Известно, что диски могут быть физически повреждены, компьютер может оказаться зараженным вирусами, наконец, файл с важной информацией может быть случайно уничтожен. Во многих случаях восста­новить информацию можно только с помощью заранее подготовленных резервных копий.

Резервной копией называется копия файла или диска, с помощью которой можно вос­становить оригинал при его случайном искажении или уничтожении.

Резервное копирование файлов, хранящихся на гибких дискетах, не представляет никаких трудностей. Это копирование можно осуществить рассмотренными выше средствами операционной системы. Для выполнения резервного копирования отдельных файлов, расположенных на жестких дисках, эти средства в принципе также могут быть использованы. Однако копирование всех файлов жесткого диска потребует очень много времени и гибких дисков. Если, например, требуется вы­полнить резервное копирование файлов с диска объемом 500 Мбайт, то для этого понадобится как минимум 350 трехдюймовых дискет (предполагается, что диск полностью заполнен файлами). Кроме того, на резервных дискетах может потребоваться создание полного аналога структуры каталога копируемого жесткого дис­ка. И наконец, на жестком диске могут встретиться файлы, длина которых превосходит объем гибкой дискеты.

Таким образом, возникает задача разработки специальных способов записи файлов, при которых файлы бы занимали бы на диске как можно меньше места, - задача сжатия файлов.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]