Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Экзамен ОС 2018

.pdf
Скачиваний:
118
Добавлен:
29.01.2018
Размер:
4.67 Mб
Скачать

Оглавление

Таким образом, таблица FAT выполняет три важные функции:

-хранение информации о размещении файлов на диске; -хранение информации о свободном месте на диске; -хранение информации о сбойных кластерах на диске.

5.5 Хранение длинных имен

Для каждого имени файла FAT-система, поддерживающая длинные имена (LFN), создает псевдоним, соответствующий нотации "8.3". Например, у файла "Мы сдадим ОС" будет псевдоним "мысдад~1 .doc".

Длинные имена (LFN) хранятся в специально отформатированных 32-байтовых записях, байт атрибутов у которых равен 0x0F. Для конкретного файла или подкаталога непосредственно перед его единственной записью каталога с его именем в формате 8.3 находится группа из одной или нескольких записей, представляющих длинное имя. Каждая такая запись содержит часть длинного имени файла не более 13 символов, и операционная система составляет полное длинное имя из всех записей.

Символы, составляющие длинное имя файла, представлены в кодах Unicode, т. е. на каждый из них требуется по 2 байта.

Пример хранения файла с длинным именем

Оглавление

Оглавление

5.6 Повышение производительности файловых систем

Самое принципиальное отличие FAT32 от FAT16 заключается в том, что FAT32 намного эффективнее расходует дисковое пространство.

FAT32 использует дисковые кластеры меньшего размера по сравнению с предыдущими версиями, которые ограничивались 65 535 кластерами на том (соответственно с увеличением размера диска приходилось увеличивать и размер кластеров).

Следовательно, даже для дисков размером до 8 Гбайт FAT32 может использовать 4-килобайтные кластеры. В результате по сравнению с дисками FAT16 экономится в среднем 10-15% дискового пространства.

Зеркализация таблиц FAT32

Исторически сложилось так, что на всех FAT-дисках существуют 2 экземпляра таблицы FAT. Ecли при чтении исходного экземпляра возникает ошибка, файловая система пытается считать его резервную копию. На дисках с 12-и 16-разрядной FAT первая таблица FAT всегда является основной, и все изменения автоматически записываются в ее копию. Создание резервной копии второй таблицы FAT называется зеркализацией (mirroring).

В FAT32 зеркализацию второй таблицы FAT можно отключить. Тогда операции чтения/записи ускоряются, а если первая FAT оказывается поврежденной, используется ее второй экземпляр (он становится основным).

На FAT32-дисках таблица FAT может достигать огромных размеров, и

отключение зеркализации способно заметно ускорить доступ к файлам.

Оглавление

Оглавление

6. Файловая система NTFS. Тома NTFS. Физическая структура MFT и метафайлы. Атрибуты в NTFS. Хранение файлов и каталогов. Сжатие файлов в NTFS. Защита целостности данных. Дополнительные возможности NTFS.

6.1 Файловая система NTFS.

NTFS (new technology file system — «файловая система новой технологии») — стандартная файловая система для семейства операционных систем Windows NT фирмы

Microsoft.

С целью улучшения производительности, надёжности и эффективности использования дискового пространства для хранения информации о файлах в NTFS используются специализированные структуры данных. Информация о файлах хранится в главной файловой таблице — Master File Table (MFT). (Разработана для быстрого выполнения стандартных файловых операций типа чтения, записи и поиска.)

NTFS поддерживает разграничение доступа к данным для различных пользователей и групп пользователей (списки контроля доступа — access control lists, ACL), а также позволяет назначать дисковые квоты (ограничения на максимальный объём дискового пространства, занимаемый файлами тех или иных пользователей). (Включает возможности безопасности, требуемые для файловых серверов и высококачественных персональных компьютеров в корпоративной среде.)

Для повышения надёжности файловой системы в NTFS используется система журналирования USN. (Поддерживает улучшенные операции восстановления файловой системы на очень больших жестких дисках.)

Физическая организация NTFS.

NTFS использует физическую организацию близкую перечню номеров блоков (кластеров).

Для увеличения эффективности кластеры выделяются файлам по возможности в виде совокупности последовательных кластеров (так называемых серий, экстентов, пробегов).

Каждая последовательность кластеров описывается отдельной записью – (стартовый кластер, число кластеров).

Подобный подход позволяет частично решить проблему фрагментации файлов, т.к. свободное место выделяется не отдельными кластерами, а группами смежных кластеров.

6.2 Тома NTFS

Том (англ. volume или англ. partition) — часть долговременной памяти компьютера, рассматриваемая как единое целое для удобства работы.

Оглавление

Оглавление

Том, логический диск, логический раздел - термины, описывающие примерно одно

ито же. Допустим, есть физический диск (жесткий диск, который можно потрогать руками)

имы его делим для себя на 2 части (2 логических диска/тома/логических раздела). Каждый из логических дисков будет независим, может иметь свою файловую систему и т.д. Мы как будто из одного существующего диска сделали два, с которыми можно раздельно работать.

NTFS обрабатывает каждый том независимо от других.

NTFS поддерживает тома, состоящие из нескольких разделов. То есть, можно несколько логических разделов объединить в одной большой том, тогда он будет составным.

NTFS поддерживает размеры кластеров – от 512 байт до 64 Кбайт.

Типы томов в NTFS:

Простой том (simple) - том, соответствующий одному логическому разделу.

Составной том (spanned) - том, использующий более одного раздела для формирования одного протяженного. Можно использовать разделы с разных дисков для создания набора томов, большего по объему, чем любой имеющийся на компьютере физический диск.

RAID массивы

(Примечание к дальнейшей теории:

RAID (англ. Redundant Array of Independent Disks избыточный массив независимых дисков) — технология виртуализации данных, которая объединяет несколько дисков в логический элемент для избыточности и повышения производительности

RAID (Redundant Array of Independent Disks) система – набор физических дисковых устройств, рассматриваемых ОС, как единое логическое дисковое устройство.

RAID-системы служат для повышения надёжности хранения данных и/или для повышения скорости чтения/записи информации)

RAID 0 - чередующийся набор томов (stripped) – том, состоящий из нескольких разделов, по которым равномерными блоками распределены данные. Размер блока данных – 64 Кбайт.

Блок 0 записывается на первый диск, блок 1 на второй диск, блок 2 - на третий и так далее. Так как в примере используется всего 4 диска, то блок под номером 5 запишется снова на первый диск. Отсюда и название - “чередующийся набор томов”.

Преимущества:

Оглавление

Оглавление

наивысшая производительность для приложений требующих интенсивной обработки запросов ввода/вывода и данных большого объема;

простота реализации; низкая стоимость на единицу объема.

Недостатки:

не отказоустойчивое решение; отказ одного диска влечет за собой потерю всех данных массива.

RAID 1 - зеркальный том (mirrored) содержит копии своих данных на двух разделах. В случае зеркала запись данных производится на оба раздела, а считывание происходит только с одного. Зеркальный том устойчив к сбою одного диска, в этом случае работает оставшаяся половина.

Преимущества:

простота реализации; простота восстановления массива в случае отказа (копирование);

достаточно высокое быстродействие для приложений с большой интенсивностью запросов.

Недостатки:

высокая стоимость на единицу объема – 100% избыточность; невысокая скорость передачи данных.

RAID 1 советуют использовать для диска, на котором содержится ОС, а так же для журнала транзакций.

RAID 2 - отказоустойчивый массив с использованием кода Хэмминга, исправляет одинарные ошибки «на лету» и выявляет двойные ошибки.

Оглавление

Оглавление

RAID 2 основан на разбиении входных данных на уровне битов и вычислении кода Хэмминга для контроля возможных ошибок (Hamming ECC – Error Correction Code).

Исходные биты данных распределяются между дисками массива, а параллельно с ними на специальные выделенные диски (ECC диски) записываются вычисленные коды.

Минимальное число p требуемых контрольных битов для d битов исходных данных определяется неравенством d+p+1<=2p. Несложно убедиться, что для d=4 (битов данных) требуется p=3 (контрольных битов), для d от 5 до 11 уже p=4.

Преимущество:

повышение скорости дисковых операций по сравнению с производительностью одного диска.

Недостаток:

минимальное количество дисков, при котором имеет смысл его использовать равно 7, только начиная с этого количества для него требуется меньше дисков, чем для RAID 1 (4 диска с данными, 3 диска с кодами коррекции ошибок).

RAID 3 (отказоустойчивый массив с параллельной передачей данных и четностью)

В массиве RAID 3 из n дисков данные разбиваются на куски размером меньше сектора (разбиваются на байты или блоки) и распределяются по n-1 дискам. Ещё один диск используется для хранения блоков чётности.

Отличия RAID 3 от RAID 2: невозможность коррекции ошибок на лету.

Преимущества:

высокая скорость чтения и записи данных; минимальное количество дисков для создания массива равно трём.

Недостатки:

массив этого типа хорош только для однозадачной работы с большими файлами, так как время доступа к отдельному сектору, разбитому по дискам, равно максимальному из интервалов доступа к секторам каждого из дисков. Для блоков малого размера время доступа намного больше времени чтения.

большая нагрузка на контрольный диск, и, как следствие, его надёжность сильно падает по сравнению с дисками, хранящими данные.

Оглавление

Оглавление

RAID 4 (отказоустойчивый массив независимых дисков с разделяемым диском четности)

RAID 4 похож на RAID 3, но отличается от него тем, что данные разбиваются на блоки, а не на байты. Таким образом, удалось отчасти «победить» проблему низкой скорости передачи данных небольшого объёма. Запись же производится медленно из-за того, что чётность для блока генерируется при записи и записывается на единственный диск.

Преимущества:

очень высокая скорость чтения данных больших объемов; высокая производительность при большой интенсивности запросов чтения

данных; малые накладные расходы для реализации избыточности.

Недостатки:

достаточно сложная реализация; очень низкая производительность при записи данных; сложное восстановление данных;

низкая скорость чтения данных малого объема при единичных запросах; асимметричность быстродействия относительно чтения и записи.

RAID 5 - отказоустойчивый массив независимых дисков с распределенной четностью.

Оглавление

Оглавление

Основным недостатком уровней RAID от 2-го до 4-го является невозможность производить параллельные операции записи, так как для хранения информации о чётности используется отдельный контрольный диск. RAID 5 не имеет этого недостатка. Блоки данных и контрольные суммы циклически записываются на все диски массива, нет асимметричности конфигурации дисков. Под контрольными суммами подразумевается результат операции XOR (исключающее или).

Преимущества:

высокая производительность при большой интенсивности запросов чтения/записи данных;

малые накладные расходы для реализации избыточности (объём дискового массива RAID 5 рассчитывается по формуле (n-1)*hddsize, где n — число дисков в массиве, а hddsize — размер диска (наименьшего, если диски имеют разный размер). Например, для массива из четырёх дисков по 80 гигабайт общий объём будет (4 − 1) * 80 = 240 гигабайт, то есть «потеряется» всего 25 %)

Недостатки:

скорость записи данных ниже, чем в RAID 1, т.к. в RAID 5 каждая операция записи требует 2-х чтений старых значений, выполнения 2-х операций XOR и 2-х новых записей;

скорость чтения данных ниже, чем в RAID 4; достаточно сложная реализация (обычно аппаратная);

при выходе из строя одного диска производительность системы резко падает;

сложное восстановление данных.

Минимальное количество используемых дисков равно трём.

RAID 6 (отказоустойчивый массив независимых дисков с двумя независимыми распределенными схемами четности)

Оглавление

Оглавление

RAID 6 — похож на RAID 5, но имеет более высокую степень надёжности — три диска данных и два диска контроля чётности. Основан на кодах Рида — Соломона и обеспечивает работоспособность после одновременного выхода из строя любых двух дисков. Обычно использование RAID-6 вызывает примерно 10-15 % падение производительности дисковой группы, относительно RAID 5, что вызвано бо́льшим объёмом работы для контроллера (более сложный алгоритм расчёта контрольных сумм), а также необходимостью читать и перезаписывать больше дисковых блоков при записи каждого блока.

RAID-системы можно комбинировать.

Самую высокую отказоустойчивость и производительность показывает RAID10,

он же RAID 1+0.

Он представляет собой зеркалированный массив, данные в котором записываются последовательно на несколько дисков, как в RAID 0.

RAID могут быть реализовано программно и аппаратно.

Сравнение RAID-систем.

Оглавление

Оглавление

Размер кластера тома в NTFS

6.3 Физическая структура MFT и метафайлы.

Том NTFS условно делится на две части. Первые 12,5% тома отводятся под так называемую MFT (Master File Table) зону. Запись данных в эту область невозможна. Остальные 87,5% тома представляют собой пространство для хранения файлов.

Оглавление