
- •Лабораторная работа № 4 Работа с операционный и файловой системами
- •1.Задание по работе
- •2. Операционные системы
- •Linux (ланукс)
- •Служебные команды Windows
- •4. Файловая система
- •1.3. Написать типы файлов и нарисовать соответствующие им значки (3 – 4 значка) по каждой группе (раздел 3).
- •1.5. Записать последовательность работы с архиватором rar, zip. Составить и заполнить таблицу степени сжатия файлов различных типов (расширений).
- •Типы расширений файлов
- •Сжатие и архивация информации
- •Вопросы к защите работы
4. Файловая система
1.3. Написать типы файлов и нарисовать соответствующие им значки (3 – 4 значка) по каждой группе (раздел 3).
1.5. Записать последовательность работы с архиватором rar, zip. Составить и заполнить таблицу степени сжатия файлов различных типов (расширений).
Названия файлов, тип |
Исходный объем памяти файла |
Объем памяти после сжатия ар. RAR |
Объем памяти после сжат. ар. ZIP |
Текстов… |
|
|
|
Графич… |
|
|
|
Видео … |
|
|
|
Звуков… |
|
|
|
Рассчитать и записать среднюю степень сжатия в % и выводы (какой лучше) по каждому архиватору,
Общие сведения
ФАЙЛОВАЯ СИСТЕМА - это совокупность однотипных данных и программ на внешних носителях имеющих собственные имена. Назначение файловой системы– компактное и структурированное хранение данных.
Файл - это поименованная совокупность элементов информации хранящаяся на магнитных носителях – дисках. Имена файлов записываются следующим образом: ИМЯ ● ТИП, где ИМЯ набор символов (не более 8) латинского алфавита, цифр и специальных символов ~ ' & @ ( ) % { } _ # ‘ $, а ТИП (РАСШИРЕНИЕ) файла должен иметь не более 3 символов. В отличии от имени тип может отсутствовать в файле.
Тип файла используется для классификации, определения принадлежности к какой-то группе с общими свойствами. Например, тип DOC, TXT – текстовые файлы, EXE, COM - файлы содержащие программы готовые к выполнению, PAS, BAS, ASM - программы написанные на алгоритмических языках Паскаль, Бейсик и Ассемблер. В некоторых случаях при задании всех имен или типов файлов можно использовать символы * и ?.
Путь (адрес) к файлу составляет цепочка символов, начинающаяся с имени дисковода, корневого каталога и последующих подкаталогов вплоть до каталога, содержащего необходимый файл. Имя дисковода – это буквы латинского алфавита. Персональный компьютер имеет несколько накопителей на магнитных носителях, которые принято обозначать A: и B: – гибкие диски, C: D: и т.д. – жесткие, виртуальные диски. Внешние устройства имеют свои имена: клавиатура – COM, принтер – LP, монитор – TT.
Файловая система построена по иерархической (административной) модели.
Типы расширений файлов
1.Системные и пусковые файлы: sys, sav, exe, сом, ват (пакетный), dll, idf (компоненты приложений).
2. Текстовые: tхt, doc,log, bak (копия),xl (Excel), ttf (шрифтовой), p65(Page Maker), pdf (Adobe Acrobat).
3. Векторная графика: cdr, cdt, clk, csl, pat (CorelDraw), al(Illustrator), pct(Machintosh).
Растровая графика: cpt (Corel Photo), psd(Photo Shop) bmp(Paint), ppf (Picture Publisher).
Звуковые: mp3, cd, wav, ogg, wma, dis, aiff, au, voc.
Видео: avi, dvd, mov, mpg.
Архивные, сжатые:zip, rar, arj, lzh.
Задание. В поиске указать типы и найти их , написать типы файлов и нарисовать соответствующие им значки (3 – 4 значка) по каждой группе.
Сжатие и архивация информации
Первые теоретические разработки в области сжатия информации относятся к концу 40-х годов.
Существует несколько способов сжатия (компрессии) данных. Все их можно разделить на две группы: сжатие без потерь и с потерями. В основе процесса сжатия данных используется свойство избыточности поступающей информации. Степень избыточности зависит от метода кодирования. Алфавит любого языка – это система кодирования. Русский язык на 20-30% избыточней английского.
Методы сжатия.
Методы сжатия без потерь уменьшают размер файлов не очень сильно. Обычно коэффициент сжатия не превосходит 0,2…0,3.
О
дним
из первых появился метод сжатия текстовой
информации, предложенный в 1952 году
Хафманом. В этом методе наиболее часто
используемому символу присваивается
наиболее короткий
код, а наиболее редкому - более длинный.
Таблицы кодирования создаются заранее(при
первом чтении ) и имеют законченный
размер для кодируемого документа. Этот
алгоритм обеспечивает наибольшее
быстродействие и наименьшие задержки.
Для получения высоких коэффициентов
сжатия этот метод требует больших
объемов памяти.
Пример1 .Метод без потерь. Имеем исходное выражение: A H F B H C E H E H C E A H D C E E H H H C H H H D E G H G G E H C H H. Из анализа частоты появления каждого символа составляем словарь кодов символов:
A=0010 (2 раза) |
C=000(5 раз) |
E=011(7 раз) |
G=0101(3 раза) |
B=01001(1 раз ) |
D=0011(2 раза) |
F=01000(1 раз) |
H=1. (15 раз) |
С учетом словаря кодируем исходное выражение: 0010 1 01000 01001 1 000 011 1 011 1 000 011 0010 1 0011 000 011 011 1 1 1 000 1 1 1 0011 011 0101 1 0101 0101 011 1 000 1 1.
Получаем: длинна исходного - 36*3=108 бит, закодированного - 89 бит.
Алгоритм Хаффмана в неявном (упрощенном) виде использован в программах zip, gzip, pkzip, bzip2 и др.
Пример 2. Алгоритм RLE (Run Length Encoding) - управления размером кодирования. Для текста (без потери информации), вместо последовательности из одинаковых элементов идущих подряд, сохранять первый элемент каждой последовательности и число его повторений. AAAABBBCDDDDDDD=A4 B3 C1 D7.
Гораздо лучших результатов сжатия можно добиться, используя этот алгоритм с потерей информации. Такой подход используется для графических и мультимедийных файлов. В этом случае на основе специальных исследований определяется, какой информацией можно пожертвовать.
Пример3.(с потерей) Для одинаковых по цветности пикселей присваивается код и порядковый номер в строке. Запись может иметь вид: 5-белых(1), 8- черных(2), 3- белых(3), 2-черных(4) и т.д. Этот метод хорошо работает, когда информация содержит большие участки с однотипной информацией. Для полутонов информация теряется. Он применяется для файлов формата BMP и используется в программах-компрессорах ARJ, RAR.