- •Лабораторная работа №1
- •1.1. Цель работы
- •1.2. Порядок выполнения работы
- •1.3. Содержание отчета
- •1.4. Теоретическая часть
- •1.4.1. Основные понятия и методы сжатия данных
- •1.4.2. Метод сжатия последовательностей
- •1.4.3. Программы-архиваторы
- •1.5. Программа-архиватор WinRar
- •1.5.1. Достоинства и основные возможности WinRar
- •1.5.2. Работа с программой-архиватором WinRar
- •1.5.2.1. Запуск WinRar
- •1.5.2.2. Архивация файлов
- •1.5.2.3. Просмотр файлов
- •1.5.2.4. Удаление файлов
- •1.5.2.5. Извлечение файлов
- •1.5.2.6. Другие возможности
- •1.5.2.7. Справка
- •1.6. Практическая работа
- •Часть 1 Задание
- •Часть 2 Задания
- •1.7. Контрольные вопросы
Лабораторная работа №1
Сжатие информации в ПК
1.1. Цель работы
Изучение методов сжатия данных. Изучение программы-архиватора WinRAR и работа с ней. Наработка практических навыков по созданию архивов и их модификаций.
1.2. Порядок выполнения работы
Изучение методических указаний к работе (дома), литература [1,2,7].
Подготовка отчета (дома).
Индивидуальный входной контроль:
общие сведения:
о сжатии информации;
о методах сжатия, их достоинствах и недостатках;
об архиваторах, их особенностях и возможностях;
основные понятия: файлы исходные, архивные, самораспаковывающиеся и др.;
работа с программой WinRAR (создание архивов, просмотр, удаление, извлечение файлов и др.).
Работа с программой-архиватором WinRAR.
Выполнение индивидуальных практических заданий: часть 1, табл 1.3 (дома) и часть 2 (см. разд. 1.6) – в лаборатории ПК.
Отчет о проделанной работе:
индивидуальное выполнение на ПК заданных преподавателем операций: архивации файлов, их извлечения из архивов и др;
оформление отчета (добавляется по результатам работы на ПК);
защита отчета.
1.3. Содержание отчета
Теоретическая часть:
краткое описание основных методов сжатия и их особенностей, основных архиваторов, достоинств и возможностей архиватора WinRAR.
Практическая часть:
результат выполнения практического задания, часть 1(разд. 1.6);
протокол выполнения заданий, часть 2 (разд. 1.6);
содержимое и размер двух архивов (см. зад.6, часть 2) в виде табл. 1.1.
Таблица 1.1
Пример содержимого архива
1.4. Теоретическая часть
1.4.1. Основные понятия и методы сжатия данных
Почти сразу после появления ПК возникла проблема нехватки памяти для хранения различных файлов в компьютере. Появление винчестеров несколько сняло остроту проблемы. Однако программисты стали создавать еще более сложные программы, и какую бы память не имел ПК, ее объем не всегда может удовлетворять пожеланиям всех пользователей. Но наряду с увеличением объема памяти актуальными являются способы эффективного хранения данных в ПК.
Во многих случаях информация, содержащаяся в файлах, избыточна. Для устранения избыточности используются специальные методы сжатия данных, основанные на поиске в файле избыточной информации и последующем ее кодировании с целью получения минимального объема.
Сжатие информации – это процесс сокращения количества битов, необходимых для хранения и передачи некоторого объема информации. Может быть сжатие без потерь, когда информация, восстановленная из сжатого сообщения, в точности соответствует исходной, и сжатие с потерями (необратимое, ущербное), когда восстановленная информация только частично соответствует исходной. Первое применяется при обработке текстов, записанных на естественном или искусственном языках, второе – при обработке изображений и звука, для цифровой записи аналоговых сигналов.
Различают два основных способа сжатия:
статистический,
словарный.
При первом каждому символу присваивается код, основанный на вероятности его появления в тексте. Высоко вероятные символы получают короткие коды и наоборот. Одним из самых ранних и широко известных статистических методов является алгоритм Хаффмана, предложенный в 1952 году, при котором символы заменяются кодом, состоящим из целого количества битов. В конце 70-х годов он был вытеснен арифметическим кодированием, имеющим схожую с кодом Хаффмана функцию и основанным на идее кодирования символов дробным числом битов. Арифметическое сжатие может быть использовано в тех случаях, когда степень сжатия важнее, чем временные затраты на сжатие информации.
При словарном способе группы последовательных символов или "фраз" заменяются кодом. Замененная фраза может быть найдена в некотором словаре. В 1977 году Лемпель и Зив предложили свою модификацию словарного метода, отличающуюся от Хаффмановского и арифметического методов, в которой сжатие основано на свойстве "потока символов" иметь повторяющиеся участки. Поток символов – это исходные данные для сжатия, например текстовый файл, массив. Основная идея алгоритма Лемпеля и Зива состоит в том, что второе и последующие вхождения некоторой строки символов в сообщении заменяются ссылкой на ее первое появление в сообщении.
В последнее время было показано, что любая практическая схема словарного сжатия может быть сведена к соответствующей статистической схеме сжатия, и найден общий алгоритм преобразования словарного метода в статистический. Поэтому при поиске лучшего сжатия статистическое кодирование обещает быть наиболее плодотворным, хотя словарные методы и привлекательны своей быстротой.
Одним из наиболее простых и наглядных является метод сжатия последовательностей одинаковых символов, не относящийся, однако, к названным основным методам.
