Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЛР1-1.doc
Скачиваний:
1
Добавлен:
01.07.2025
Размер:
660.48 Кб
Скачать

Лабораторная работа №1

Сжатие информации в ПК

1.1. Цель работы

Изучение методов сжатия данных. Изучение программы-архиватора WinRAR и работа с ней. Наработка практических навыков по созданию архивов и их модификаций.

1.2. Порядок выполнения работы

  1. Изучение методических указаний к работе (дома), литература [1,2,7].

  2. Подготовка отчета (дома).

  3. Индивидуальный входной контроль:

  • общие сведения:

  • о сжатии информации;

  • о методах сжатия, их достоинствах и недостатках;

  • об архиваторах, их особенностях и возможностях;

  • основные понятия: файлы исходные, архивные, самораспаковывающиеся и др.;

  • работа с программой WinRAR (создание архивов, просмотр, удаление, извлечение файлов и др.).

  1. Работа с программой-архиватором WinRAR.

  2. Выполнение индивидуальных практических заданий: часть 1, табл 1.3 (дома) и часть 2 (см. разд. 1.6) – в лаборатории ПК.

  3. Отчет о проделанной работе:

  • индивидуальное выполнение на ПК заданных преподавателем операций: архивации файлов, их извлечения из архивов и др;

  • оформление отчета (добавляется по результатам работы на ПК);

  • защита отчета.

1.3. Содержание отчета

Теоретическая часть:

  • краткое описание основных методов сжатия и их особенностей, основных архиваторов, достоинств и возможностей архиватора WinRAR.

Практическая часть:

  • результат выполнения практического задания, часть 1(разд. 1.6);

  • протокол выполнения заданий, часть 2 (разд. 1.6);

  • содержимое и размер двух архивов (см. зад.6, часть 2) в виде табл. 1.1.

Таблица 1.1

Пример содержимого архива

1.4. Теоретическая часть

1.4.1. Основные понятия и методы сжатия данных

Почти сразу после появления ПК возникла проблема нехватки памяти для хранения различных файлов в компьютере. Появление винчестеров несколько сняло остроту проблемы. Однако программисты стали создавать еще более сложные программы, и какую бы память не имел ПК, ее объем не всегда может удовлетворять пожеланиям всех пользователей. Но наряду с увеличением объема памяти актуальными являются способы эффективного хранения данных в ПК.

Во многих случаях информация, содержащаяся в файлах, избыточна. Для устранения избыточности используются специальные методы сжатия данных, основанные на поиске в файле избыточной информации и последующем ее кодировании с целью получения минимального объема.

Сжатие информации – это процесс сокращения количества битов, необходимых для хранения и передачи некоторого объема информации. Может быть сжатие без потерь, когда информация, восстановленная из сжатого сообщения, в точности соответствует исходной, и сжатие с потерями (необратимое, ущербное), когда восстановленная информация только частично соответствует исходной. Первое применяется при обработке текстов, записанных на естественном или искусственном языках, второе – при обработке изображений и звука, для цифровой записи аналоговых сигналов.

Различают два основных способа сжатия:

  • статистический,

  • словарный.

При первом каждому символу присваивается код, основанный на вероятности его появления в тексте. Высоко вероятные символы получают короткие коды и наоборот. Одним из самых ранних и широко известных статистических методов является алгоритм Хаффмана, предложенный в 1952 году, при котором символы заменяются кодом, состоящим из целого количества битов. В конце 70-х годов он был вытеснен арифметическим кодированием, имеющим схожую с кодом Хаффмана функцию и основанным на идее кодирования символов дробным числом битов. Арифметическое сжатие может быть использовано в тех случаях, когда степень сжатия важнее, чем временные затраты на сжатие информации.

При словарном способе группы последовательных символов или "фраз" заменяются кодом. Замененная фраза может быть найдена в некотором словаре. В 1977 году Лемпель и Зив предложили свою модификацию словарного метода, отличающуюся от Хаффмановского и арифметического методов, в которой сжатие основано на свойстве "потока символов" иметь повторяющиеся участки. Поток символов – это исходные данные для сжатия, например текстовый файл, массив. Основная идея алгоритма Лемпеля и Зива состоит в том, что второе и последующие вхождения некоторой строки символов в сообщении заменяются ссылкой на ее первое появление в сообщении.

В последнее время было показано, что любая практическая схема словарного сжатия может быть сведена к соответствующей статистической схеме сжатия, и найден общий алгоритм преобразования словарного метода в статистический. Поэтому при поиске лучшего сжатия статистическое кодирование обещает быть наиболее плодотворным, хотя словарные методы и привлекательны своей быстротой.

Одним из наиболее простых и наглядных является метод сжатия последовательностей одинаковых символов, не относящийся, однако, к названным основным методам.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]