Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Lab4_1TPK_13.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
101.38 Кб
Скачать

4. Файловая система

1.3. Написать типы файлов и нарисовать соответствующие им значки (3 – 4 значка) по каждой группе (раздел 3).

1.5. Записать последовательность работы с архиватором rar, zip. Составить и заполнить таблицу степени сжатия файлов различных типов (расширений).

Названия фай­лов, тип

Исходный объем памяти файла

Объем памяти после сжатия ар. RAR

Объем памяти после сжат. ар. ZIP

Текстов…

Графич…

Видео …

Звуков…

Рассчитать и записать среднюю степень сжатия в % и выводы (какой лучше) по каж­дому архиватору,

Общие сведения

ФАЙЛОВАЯ СИСТЕМА - это совокупность однотипных данных и программ на внешних но­сителях имеющих собственные имена. Назначение файловой системы– компактное и структурированное хранение данных.

Файл - это поименованная совокупность элементов информации хранящаяся на магнит­ных носителях – дисках. Имена файлов записываются следующим образом: ИМЯ  ● ТИП, где ИМЯ набор символов (не более 8) латинского алфавита, цифр и специальных симво­лов ~ ' & @ ( ) % { } _ # ‘ $, а ТИП (РАСШИРЕНИЕ) файла должен иметь не более 3 символов. В отличии от имени тип может отсутствовать в файле.

Тип файла используется для классификации, определения принадлежности к какой-то группе с общими свойствами. Например, тип DOC, TXT – текстовые файлы, EXE, COM - файлы содержащие программы готовые к выполнению, PAS, BAS, ASM - программы на­писанные на алгоритмических языках Паскаль, Бейсик и Ассемблер. В некоторых слу­чаях при задании всех имен или типов файлов можно использовать символы * и ?.

Путь (адрес) к файлу составляет цепочка символов, начинающаяся с имени дисковода, корневого каталога и последующих подкаталогов вплоть до каталога, содержащего необходимый файл. Имя дисковода – это буквы латинского алфавита. Персональный компьютер имеет несколько накопителей на магнитных носителях, которые при­нято обозначать A: и B: – гибкие диски, C: D: и т.д. – жесткие, виртуальные диски. Внешние устройства имеют свои имена: клавиатура – COM, принтер – LP, монитор – TT.

Файловая система построена по иерархической (административной) модели.

Типы расширений файлов

1.Системные и пусковые файлы: sys, sav, exe, сом, ват (пакетный), dll, idf (компо­ненты приложений).

2. Текстовые: tхt, doc,log, bak (копия),xl (Excel), ttf (шрифтовой), p65(Page Maker), pdf (Adobe Acrobat).

3. Векторная графика: cdr, cdt, clk, csl, pat (CorelDraw), al(Illustrator), pct(Machintosh).

Растровая графика: cpt (Corel Photo), psd(Photo Shop) bmp(Paint), ppf (Picture Publisher).

  1. Звуковые: mp3, cd, wav, ogg, wma, dis, aiff, au, voc.

  2. Видео: avi, dvd, mov, mpg.

  3. Архивные, сжатые:zip, rar, arj, lzh.

Задание. В поиске указать типы и найти их , написать типы файлов и нарисовать соответствующие им значки (3 – 4 значка) по каждой группе.

Сжатие и архивация информации

Первые теоретические разработки в области сжатия информации относятся к концу 40-х годов.

Существует несколько способов сжатия (компрессии) данных. Все их можно разделить на две группы: сжатие без потерь и с потерями. В основе процесса сжатия данных используется свойство избыточности поступающей информации. Степень избыточности зависит от метода кодирования. Алфавит любого языка – это система кодирования. Русский язык на 20-30% избыточней английского.

Методы сжатия.

  1. Методы сжатия без потерь уменьшают размер файлов не очень сильно. Обычно коэффициент сжатия не превосходит 0,2…0,3.

О дним из первых появился метод сжатия текстовой информации, предложенный в 1952 году Хафманом. В этом методе наиболее часто используемому символу присваивается наиболее короткий код, а наиболее редкому - более длинный. Таблицы кодирования создаются заранее(при первом чтении ) и имеют законченный размер для кодируемого документа. Этот алгоритм обеспечивает наибольшее быстродействие и наименьшие задержки. Для получения высоких коэффициентов сжатия этот метод требует больших объемов памяти.

Пример1 .Метод без потерь. Имеем исходное выражение: A H F B H C E H E H C E A H D C E E H H H C H H H D E G H G G E H C H H. Из анализа частоты появления каждого символа составляем словарь кодов символов:

A=0010 (2 раза)

C=000(5 раз)

E=011(7 раз)

G=0101(3 раза)

B=01001(1 раз )

D=0011(2 раза)

F=01000(1 раз)

H=1. (15 раз)

С учетом словаря кодируем исходное выражение: 0010 1 01000 01001 1 000 011 1 011 1 000 011 0010 1 0011 000 011 011 1 1 1 000 1 1 1 0011 011 0101 1 0101 0101 011 1 000 1 1.

Получаем: длинна исходного - 36*3=108 бит, закодированного - 89 бит.

Алгоритм Хаффмана в неявном (упрощенном) виде использован в программах zip, gzip, pkzip, bzip2 и др.

Пример 2. Алгоритм RLE (Run Length Encod­ing) - управления размером кодирования. Для текста (без потери информации), вместо последовательности из одинаковых элементов идущих подряд, сохранять первый элемент каждой последовательности и число его повторений. AAAABBBCDDDDDDD=A4 B3 C1 D7.

Гораздо лучших результатов сжатия можно добиться, используя этот алгоритм с потерей информации. Такой подход используется для графических и мультимедийных файлов. В этом случае на основе специальных исследований определяется, какой информацией можно пожертвовать.

Пример3.(с потерей) Для одинаковых по цветности пикселей присваивается код и порядковый номер в строке. Запись может иметь вид: 5-белых(1), 8- черных(2), 3- белых(3), 2-черных(4) и т.д. Этот метод хорошо работает, когда информация содержит большие участки с однотипной информацией. Для полутонов информация теряется. Он применяется для файлов формата BMP и используется в программах-компрессорах ARJ, RAR.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]