2. Файловая система
Файловая система – часть операционной системы, поддерживающая работу с файлами (создание, хранение и поиск). Представляет собой банк данных информации, организованной в файлы, и систему управления базами данных (СУБД), организованную по иерархической топологии. Отсюда название – иерархическая файловая система или иерархическое файловое дерево.
Файл (file) – поименованное место в памяти машины, предназначенное для хранения законченной, неделимой информационной конструкции (документа текстового, графического, табличного, звукового, программ или составляющих частей программных комплексов); информация в виде отдельного блока с присвоением индивидуального полного имени. Файл в операционной системе, DOS или Windows, является логической единицей хранения данных.
Наименования файлов состоят из двух частей (основного имени файла и его расширения), которые разделяются точкой, например: letter1.doc
Расширение файла – код от двух до четырёх буквенных или буквенно-цифровых символов, которые характеризуют формат данных, т.е. их вид. Примеры расширений: doc, jpg, pdf.
Формат файла – запись (в виде m.n), количество символов в имени и расширении файла. Например, в файловой системе компакт-дисков ISO 9660 используется формат 8.3.
Кластер – минимальный блок (кратен 512 байтам) физического пространства на диске для адресации к данным, являющимся минимальной единицей для хранения данных. Файл записывается в один, если его достаточно, или несколько смежных (желательно) или несмежных кластеров. Разметка носителя памяти на кластеры и проверка исправности кластеров производятся в ходе процедуры форматирования. Размер кластера зависит от используемого физического формата диска.
Фрагментированный файл – файл, записанный в несмежных кластерах (блоках).
Форматирование диска – процесс разметки устройств хранения или носителей информации: жёстких дисков, дискет, устройств хранения на основе флеш-памяти, оптических носителей и др. Само форматирование заключается в создании структур файловой системы. При этом вся находящаяся на носителе информация теряется или уничтожается. В процессе форматирования также может проверяться целостность носителя. Форматирование реализуется на тех уровнях:
1) Форматирование диска на низком уровне (низкоуровневое форматирование). При этом процессе на жестком диске создаются физические структуры: треки (дорожки), сектора, управляющая информация. Этот процесс выполняется заводом-изготовителем на пластинах, которые не содержат ещё никакой информации.
2) Разбиение на разделы. Этот процесс разбивает объём винчестера на логические диски (C, D, и т. д.).
3) Высокоуровневое форматирование. Этот процесс также контролируется операционной системой и зависит как от типа операционной системы, так и от утилиты, используемой для форматирования
Дефрагментация диска – процедура системного программного обеспечения для размещения файлов в соответствующие локальные (смежные) кластеры, что способствует увеличению быстродействия при обработке информации за счёт исключения механических процедур перехода головок (операций) считывания от конца предыдущего кластера к началу несмежного следующего.
Каталог (или директорий) или папка – включает вложенные в неё другие подкаталоги, папки, один или несколько файлов.
Подкаталог (подпапка, поддиректорий) – каталог, вложенный в каталог более верхнего уровня иерархической файловой системы (иерархического файлового дерева).
Надкаталог (родительский каталог) – каталог, порождающий (содержащий) текущий каталог.
Корневой каталог – каталог самого верхнего уровня файловой системы устройства хранения информации, который не вложен ни в какие другие каталоги, а сам порождает (содержит) другие каталоги.
Шаблон имён файлов - форма условной записи файлов. Шаблон включает:
* – символ, обозначающий произвольное сочетание разрешённого количества символов в имени или расширении файла. Примеры:
*.* – файлы с любым именем и любым расширением, т.е. все файлы;
А*.* – все файлы, имя которых начинается с буквы А;
*.BAS – все файлы с расширением .BAS;
NC?.* – файлы, имена которых из 3-х символов, первые из которых NC и с любым расширением;
NC.??? – файлы с именем NC и любым расширением не более трёх символов, эквивалентно NC.*.
Путь – последовательность из имён каталогов до файла, например ….\PETROV\ОТЧЕТ1.doc. Здесь первый символ: \ (обратная слэш) – символ корневого каталога; остальные символы \ – разделители подкаталогов.
FAT [File Ablocation Table] –таблица размещения файлов – указывает точки входа в файлы, номера первого и последующих кластеров файла. FAT также определяет физический формат диска. Здесь из-за отсутствия копии таблицы размещения файлов при повреждении FAT-зоны повреждается весь диск.
Существует три версии FAT — FAT12, FAT16 и FAT32. Они отличаются разрядностью записей в дисковой структуре, т.е. количеством бит, отведённых для хранения номера кластера. FAT12 применяется в основном для дискет, FAT16 — для дисков малого объёма.
Все 3,5-дюймовые дискеты емкостью 1,44 Мбайт форматируются для FAT16, а все 5,25-дюймовые - для FAT12.
В файловой системе FAT смежные секторы диска объединяются в единицы, называемые кластерами. Количество секторов в кластере может быть равно 1 или степени двойки (см. далее). Для хранения данных файла отводится целое число кластеров (минимум один). Максимально возможный размер файла для тома FAT32 — 4 ГБ, а в целях защиты тома на нем хранятся две копии FAT.
FAT12 – файловая система, в которой для адресации блока (кластера) используется 12 бит. Максимально адресуемое пространство памяти определяется из формулы:
,
где n- количество разрядов для адресации кластера,
m - количество байтов в кластере.
При n=12
и m=512
байт
адресуемый
объём памяти N=2Мб,
в связи с чем FAT-12
используется для гибких
дисков.
FAT16 – файловая система, в которой для адресации блока (кластера) используется 16 бит. Макимальное количество адресуемых кластеров N=216 Максимальный размер диска 2 Гб, размер кластера - в диапазоне от 512 байт до 32 Кб.
FAT32 – файловая система, в которой для адресации блока (кластера) используется 28 бит. Маскимальное количество адресуемых кластеров N=228 =268435456. Максимальный размер диска 2Tб, размер кластера – в диапазоне от 512 байт до 32 Кб.
Размер кластера по умолчанию определяется операционной системой текущим размером тома (диска). В табл. 2.1 приведено сравнение размеров кластеров для FAT16 и FAT32 в зависимости от размера диска.
Таблица2.1. Размеры кластеров по умолчанию для FAT 16 и FAT32
Размер диска |
Размер кластера FAT16 |
Размер кластера FAT32 |
До 32 Мбайт |
512 байт |
Не поддерживается |
32-63 Мбайт |
1 Кбайт |
Не поддерживается |
64-127 Мбайт |
2 Кбайт |
Не поддерживается |
128-255 Мбайт |
4 Кбайт |
Не поддерживается |
256-511 Мбайт |
8 Кбайт |
Не поддерживается |
512-1023 Мбайт |
16 Кбайт |
4 Кбайт |
1024-2047 Мбайт (2 Гбайт) |
32 Кбайт |
4 Кбайт |
2048-8191 Мбайт (8 Гбайт) |
Не поддерживается |
4 Кбайт |
8192-16383 Мбайт (16 Гбайт) |
Не поддерживается |
8 Кбайт |
16384-32767 Мбайт (32 Гбайт) |
Не поддерживается |
16 Кбайт |
От 32 Гбайт |
Не поддерживается |
32 Кбайт |
На основании таблица следует, что с увеличением размера диска размер кластера FAT16 увеличивается, хранение файлов на таких дисках становится неэффективным. Например, если файл размером 10 Кбайт хранится в кластере размером 32 Кбайт, то 22 Кбайт дискового пространства не используются
Разметка памяти на диске в системе FAT32 в отличие от FAT12 и FAT16 предусматривает наличие резервной FAT-зоны :
Разметка диска для FAT32
Файловая таблица (FAT-зона) |
Место под файлы |
Файловая таблица ( копия FAT-зоны) |
FAT реализует механизм доступа к файлам следующим образом. В результате форматирования все кластеры нумеруются. Дефектные и свободные кластеры помечаются соответствующими кодами FF7 и 000, а последний кластер файла – кодом FFF. Если файл удаляется, то занимаемые ими кластеры становятся «свободными», в связи с чем в таблице FAT им присваиваются коды 000.
Например, фрагментированный файл размещён на магнитной ленте в кластерах 9,10, 12 и 45:
... |
Кластер 8 |
Кластер 9 |
Кластер 10 |
Кластер 11 |
Кластер 12 |
Кластер 13 |
... |
точка
входа в файл
... |
Кластер 44 |
Кластер 45 |
Кластер 46 |
Кластер 47 |
... |
Таблица FAT для данного файла имеет вид:
Номер текущего кластера |
Номер следующего кластера файла или его код |
… |
… |
9 |
10 |
10 |
12 |
11 |
FF7 |
12 |
45 |
13 |
000 |
…. |
… |
44 |
000 |
45 |
FFF |
46 |
… |
…. |
… |
В каталоге, содержащем сведения о файлах, для каждого файла указывается номер первого из кластеров файла. Этот номер – точка входа в файл.
НPFS [High Performance File Sistem] – файловая система для дисков с объёмом памяти 200…400 Мб. Здесь поддерживается структура каталогов FAT, при этом дополнительно вносятся сведения о создании и внесении изменений, а также о времени и дате доступа. НPFS старается располагать данные файла в смежных секторах, что уменьшает фрагментацию диска. Недостаток – полное отсутствие средств автоматического восстановления в случае повреждения.
NTFS [New Technology File System] – новая технологическая файловая система для дисков с объёмом памяти более 400 Мб, имеет копии ряда зон и включает: MFT-зону [Master File Table] – общую таблицу файлов (централизованный каталог), места под файлы и копию MFT-зоны. Достоинство – самовосстанавливаемость в случае повреждения таблицы файлов. Недостаток – требует значительного объёма памяти, в связи с чем Windows форматирует малые дискеты в системе FAT. Разметка памяти в NTFS:
MFT – зона
|
Место под файлы (данные) |
Копия MFT-зоны |
Место под файлы (данные) |
