Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Sistemy_szhatia_dannykh.doc
Скачиваний:
0
Добавлен:
01.03.2025
Размер:
93.7 Кб
Скачать

Системы сжатия данных.

Программное Обеспечение:

  1. Утилиты резервного копирования.

  2. Архиваторы.

  3. Программы динамического сжатия.

Необходимость архивации файлов:

  1. физическая порча магнитных носителей (например, МД)

  2. неправильная корректировка (или случайное уничтожение файлов)

  3. разрушение файла вирусом.

Для резервного копирования файлов можно использовать команды CОРY или XCOPY, BACKUP и RESTORE операционной системы MS DOS.

Это простое копирование без уменьшения объема исходных файлов.

Специальные программы  архиваторы  позволяют сэкономить место и объединять группы совместно используемых файлов в один архивный файл.

СЖАТИЕ = МОДЕЛИОВАНИЕ + КОДИРОВАНИЕ

Сжатие информации представляет собой процесс обработки символов некоторого сообщения и перевода этих символов в некоторые коды.

При просмотре обрабатываемого сообщения алгоритм сжатия реализует два почти независимых друг от друга процесса:

  • поддерживает модель обрабатываемого сообщения;

  • на основании модели кодирует очередной фрагмент сообщения;

Термины:

  1. Сжатие информации – процесс сокращения количества битов, необходимых для хранения некоторого объема информации;

  2. Сжатие без потерь – информация, восстановленная из сжатого состояния, в точности соответствует исходной (до начала сжатия).

  3. Сжатие с потерями – информация, восстановленная после сжатия , только частично соответствует исходной (применяется при обработке изображений и звука).

Обычно весь процесс сжатия ошибочно отождествляется только с процессом кодирования, в то время как кодирование представляет собой только часть процесса сжатия, взаимодействующую с моделью данных.

Используя один и тот же метод кодирования, можно совершенно по-разному строить модель сжимаемых данных. При этом результат сжатия будет отличаться для различных методов моделирования.

Wисх. > Wрез.

Первые работы по сжатию информации ( ~ в конце 40-х гг. 20 века) велись до появления ЭВМ.

Сейчас теория информации развивается параллельно с программированием.

Рассмотрим один из первых алгоритмов эффективного кодирования информации, предложенного Д.А. Хаффманом в 1952 г.

Идея алгоритма: зная вероятности вхождения символов в сообщение, можно описать процедуру построения кодов переменной длины, состоящих из целого количества битов. Символам с большей вероятностью появления присваиваются более короткие коды. Коды Хаффмана имеют уникальный префикс, что и позволяет однозначно их декодировать, несмотря на их переменную длину.

Классический алгоритм Хаффмана на входе получает таблицу частот встречаемости символов в сообщении. Далее на основании этой таблицы строится дерево кодирования Хаффмана (Н дерево).

Термины:

  1. Граф-совокупность множества узлов и множества дуг, направленных от одного узла к другому.

  2. Дерево-граф, обладающий следующими свойствами:

а) ни в один из узлов не входит более одной дуги (то есть отсутствуют циклы)

б) только в один узел не входит ни одной дуги, он называется корнем дерева;

в) перемещаясь по дугам от корня, можно попасть в любой узел.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]