Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ОТКАЗОУСТОЙЧИВОСТЬ КЛАСТЕР RAID.doc
Скачиваний:
14
Добавлен:
17.06.2016
Размер:
294.4 Кб
Скачать

1.2. Raid – избыточный массив независимых дисков (стандарт 1992 г.)

Самый простой способ объединения множества дисков в один логический диск – RAID 0 (Striped Disk Array Without Fault Tolerance – «чередование дискового массива без дополнительной отказоустойчивости») позволяет повысить производительность для прикладных программ при вводе-выводе данных большого объема. Данные, относящиеся к одному приложению, при хранении разбиваются на множество секторов (512 байт), и каждый сектор размещается на отдельном диске. ЭВМ воспринимает массив дисков как одно устройство хранения информации большой емкости.

Производительность повышается за счет того, что можно одновременно читать (или записывать) с (на) разных дисков.

При отказе одного диска, данные не восстанавливаются, и система перестает работать, но при такой организации данных достигается наивысшая производительность. Схема организации дисков, обозначаемых Di,и секторов Siна дисках представлена на рис. 1.

Рис. 1. Схема RAID0

Для повышения надежности (отказоустойчивости) дискового массива используется дублирование дисков (уровень RAID 1). Для каждого диска используется резервный. Схема организации дисков представлена на рис. 2.

Рис. 2. Схема RAID 1

Достоинства способа:

  1. Скорость записи на зеркальные диски равна скорости записи на один диск.

  2. Скорость чтения в 2 раза выше.

  3. Высокая скорость восстановления данных.

Недостатки:

  1. Низкий коэффициент использования дискового пространства.

  2. Неэкономичная схема хранения.

Уровень 0 и 1 целесообразно использовать для больших массивов данных, критичных к скорости чтения (записи) данных.

Уровень RAID 2 обеспечивает исправление одиночных и обнаружение двойных ошибок в каждом кодовом слове. Для этой цели используются избыточные контрольные разряды. Осуществляется поразрядное расслоение данных и запись их на соответствующее количество дисков. Для выявления ошибок в разрядах добавляется нужное количество контрольных дисков. Существует массив из 38 дисков, из которых 32 диска хранят данные, и 6 дисков используются для контроля (см. код Хемминга).

n = 38

k = 32

r = 6

Поток данных разбивается на слова, и каждое слово разбивается на биты, которые помещаются на диски. Пусть слово данных состоит из 4 бит. Тогда нужно 7 дисков (см. ранее кодирование Хемминга). Схема RAID 2 представлены ниже.

D1

D2

D3

D4

D5

D6

D7

данные 0-го бита первого слова

D1.0

D1.1

D1.2

D1.3

ECC1.0

ECC1.1

ECC1.2

данные 0-го бита второго слова

D2.0

D2.1

D2.2

D2.3

ECC2.0

ECC2.1

ECC2.2

. . .

. . .

. . .

. . .

. . .

. . .

. . .

данные 0-го бита N-го слова

DN.0

DN.1

DN.2

DN.3

ECCN.0

ECCN.1

ECCN.2

ECC – Error Checking Correcting

Достоинства RAID 2:

  1. Оперативное исправление ошибок.

  2. Высокая скорость передачи данных, увеличивающаяся с ростом числа дисков в массиве.

  3. Возрастание коэффициента использования дискового пространства по мере увеличения числа дисков.

  4. Относительно простое конструктивное исполнение.

RAID 3 (Parallel Transfer Disks With Parity (отказоустойчивый массив с параллельной передачей данных и четностью).

В RAID 2 большинство дисков используются для определения положения неисправных разрядов, но контроллер может определить положение ошибочного разряда, то есть с помощью специальных сигналов, поддерживаемых интерфейсом, определяется отказ диска, хранящего какой-либо разряд данных. Тогда достаточно иметь бит четности для исправления ошибки, не используя кодов Хемминга.

Данные разбиваются побайтно. Обычно массив состоит из 4 информационных дисков и одного контрольного диска (фирма Micropolis). Схема RAID 3 изображена ниже.

D1

D2

D3

D4

D5

S1

1, 5, . ., 509

2, 6, . ., 510

3, 7, . ., 511

4, 8, . ., 512

parity

S2

1, 5, . ., 509

2, 6, . ., 510

3, 7, . ., 511

4, 8, . ., 512

parity

. . .

. . .

. . .

. . .

. . .

parity

SN

1, 5, . ., 509

2, 6, . ., 510

3, 7, . ., 511

4, 8, . ., 512

parity

Байты сектора Siразмещаются на нескольких дисках и выделен диск для размещения паритета.

По сравнению с RAID 2 уменьшается избыточность. Логический диск (из 4) обеспечивает учетверенную пропускную способность. Отказ любого диска не приводит к потере данных.

Недостаток: в операциях чтения и записи сектора участвуют все диски массива, поэтому невозможно параллельное выполнение чтения и записи или чтения (записи) нескольких секторов.

Обновление байта данных требует изменения паритета. При обновлении выполняются 5 обращений (чтение – Чт или запись – Зп) к дискам по схеме, представленной ниже.

RAID 4 – внутригрупповой параллелизм. Данные разбиваются на секторы. Секторы размещаются поочередно на дисках.

D1

D2

D3

D4

D5

S1

S2

S3

S4

parity

S5

S6

S7

S8

parity

. . .

. . .

. . .

. . .

. . .

SN–3

SN–2

SN–1

SN

parity

В отличии от RAID 3 возможно параллельное чтение секторов, но расположенных на разных дисках. При записи данных на диск, обновляется контрольная информация, которая хранится на одном диске, поэтому невозможно параллельное чтение и обновление контрольной информации.

RAID 5 – перемещаемая четность для распараллеливания записей.

Секторы данных и контрольная информация поочередно размещаются на дисках (parity на разных дисках).

D1

D2

D3

D4

D5

S1

S2

S3

S4

parity

S5

S6

S7

parity

S8

. . .

. . .

. . .

. . .

. . .

parity

SN–3

SN–2

SN–1

SN

Такое размещение данных и контрольной информации обеспечивает высокую скорость передачи большого количества информационных файлов малого объема. Однако, если произойдет сбой в работе любого диска, то существенно снизится быстродействие, так как для восстановления правильных данных системе потребуется считать информацию с других дисков.

Возможно параллельное чтение и запись секторов, расположенных на разных дисках. Например, запись S3 и чтение S6.

Обновление данных в RAID 5 выполняется проще, чем в RAID 3 и осуществляется по следующей схеме.

Отметим, что в рассмотренных способах организации дисков используется матрица, у которой первой координатой служат номера дисков, а второй координатой являются номера секторов. Но диски можно объединить в двумерный массив, а секторы будут третьей координатой. При этом можно осуществлять контроль четности (нечетности) по строкам дисков и столбцам дисков. Такой контроль выполняется в RAID 6.

RAID 6 – отказоустойчивый массив независимых дисков с двумя независимыми распределенными схемами четности.

Данные разбиваются на секторы аналогично RAID 5, но объединяемое множество дисков представляется в виде матрицы и еще добавляется паритет по столбцам. При такой организации дисков обеспечивается устойчивость к двойным ошибкам, но при выполнении записи требуется шесть обращений к диску, то есть время обработки запроса данных значительно увеличивается. Обращение за старыми данными, за четностью по строкам и столбцам, а так же запись новых данных и новых значений четности по строкам и столбцам.

!: самая высокая отказоустойчивость, но и сложное восстановление.

Для повышения скорости обмена данными при организации логического диска используются комбинации RAID 0 с любым другим, например, с RAID 3. Комбинированный логический диск обозначается RAID 30. Для повышения скорости передачи данных создан также уровень RAID 7 (отказоустойчивый массив независимых дисков, оптимизированный для повышения производительности). Все операции чтения записей в RAID 7 выполняются асинхронно под контролем ОС (операционной системы). Данные записываются в КЭШ-память во время любой операции чтения, записи. Для передачи данных используется высокоскоростная шина.

Достоинства:

    1. Общая производительность 1,5–6 раз выше, чем у RAID-массивов других уровней.

    2. Использование нескольких внешних интерфейсов для обмена данных.

    3. Высокая скорость доступа к данным в много пользовательской среде.

Недостатки:

  1. Отказоустойчивость ниже, чем у RAID 1.

  2. Очень высокая стоимость.

Подводя итоги краткого анализа способов организации отказоустойчивой внешней памяти, следует отметить, что производительность в RAID-накопителях увеличивается по экспоненциальному закону, при добавлении дисков в массив. Например, производительность системы из 4 дисков в 1,5 раза выше, чем у системы из 2 дисков.

RAID-контроллер обеспечивает высокую производительность обмена данными для систем с шинами PCI (скорость передачи данных по 32 битной шине PCI – 133 Мбайта в секунду и до 40 Мбайта в секунду на SCSI). Существует набор драйверов, позволяющих осуществлять удаленный мониторинг, конфигурирование и управление RAID-системами.

Конструктивно RAID-системы представлены либо в виде внешней стойки, либо в виде блоков, встраиваемых в ЭВМ.

Некоторые сравнительные характеристики RAID представлены в следующей таблице 2.

Таблица 2. Сравнительные характеристики RAID

Тип

Минимум дисков

Потребность дисков

Отказо-устойчивость

Скорость передачи данных

Область применения

RAID 0

2

N

< 1 диска

< RAID 3

графика, видео

RAID 1

2

2N

< RAID 6

При чт > 1 диска

При зп = 1 диску

малые файл-серверы

RAID 2

7

2N<X<N+1

< RAID 1

= RAID 3

мейнфрейм

RAID 3

3

N+1

< RAID 1

< RAID 7

графика, видео

RAID 4

3

N+1

< RAID 1

При чт < RAID 3

При зп < RAID 5

файл-серверы

RAID 5

3

N+1

< RAID 1

При чт < RAID 4

При зп < RAID 3

серверы баз данных

RAID 6

4

N+2

самая высокая

низкая

редко используется

RAID 7

12

N+1

< RAID 1

самая высокая

разные

< – обозначает слово менее.