Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Desktop / For_exams / Smirnov / 1 - копия (6)

.txt
Скачиваний:
35
Добавлен:
27.03.2015
Размер:
4.23 Кб
Скачать
7. Повышение надёжности
Надежность- это свойство компьютера сохранять работоспособность в течении заданного промежутка времени. Отказы оборудования являются случайными событиями. Интенсивность отказов равна количеству отказов в единицу времени. Если отказы различных элементов независимы, то интенсивность отказов l для всех элементов, составляющих устройство, определится как сумма по всем типам элементов:
l = S li * Ci,
где Сi- количество элементов i-го типа, входящих в устройство, li - интенсивность отказов элементов i - го типа.
Вероятность исправной работы устройства в течении времени t определится по формуле
P(t) = e-l t
Любая вычислительная система характеризуется временем наработки на отказ (средним временем безотказной работы системы) или MTBF (Mean Time before Failure). Система средней надежности имеет значение MTBF порядка 300000 часов, высоконадежные системы (High-end) до 800000часов.
В зависимости от количества операционных ресурсов задействованных в вычислительной системе изменяется время наработки на отказ, естественно, что чем больше занято ресурсов, тем меньше MTBF.
Среднее время наработки на отказ можно определить как
Tср. = 1 /l
Время восстановления работоспособности устройства складывается из времени поиска неисправности и времени замены вышедшего из строя элемента.
Tвосст = Tпоиска + Tзамены
Время восстановления (Tвосст) случайная величина со средним значением для устройств определенного типа и одного поколения.
Среднее время восстановления зависит от количества оборудования и от техники поиска и устранения неисправностей.
Вероятность восстановления работоспособности устройства Р(t) за время t определится
Р(t) = 1- ЕХР (- t / T восст.)
Отношение общего времени исправной работы к сумме общего времени исправной работы и восстановления, взятых за весь период эксплуатации называется коэффициентом готовности - К гот.
К гот.= Т / (Т + Твосст.),
где Т- общее время исправной работы устройства. Коэффициент готовности определяет вероятность безотказной работы устройства в текущий момент времени.
Использование резервирования позволяет строить системы с высоким показателем надежности, но при этом возрастает стоимость системы и величина эксплуатационных расходов. Широкое распространение получили RAID - системы (Redundant Arrays of Inexpensive Disks - матрицы недорогих дисковых накопителей с избыточностью). Основным в этой технологии является использование группы недорогих дисков для создания большого дискового пространства. RAID - системы повышают надежность хранения данных за счет резервного копирования или распределения данных на несколько дисков что позволяет восстановить испорченные данные по биту четности и произвести горячую (без выключения системы) замену испорченного диска.
Для повышения надежности современные вычислительные системы снабжают системой самодиагностики- POST (Power-ON Self Testing, самодиагностика при включении) и системой самодиагностики, анализа и оповещения - SMART (Self-Monitoring Analysing and Reporting Technology) позволяющей любому компоненту сообщить о своем состоянии надежности.

Система SMART для жестких дисков
Системой SMART прежде всего стали снабжаться жесткие диски т.к. 27% сбоев в вычислительных системах происходит из за сбоя жесткого диска. Система SMART включает специальное программное обеспечение, предупреждающее сбои на ранних стадиях их проявления (до70%). Это позволяет заменить накопитель раньше, чем произойдет сбой.
Для жестких дисков SMART осуществляет:
• контроль системы магнитных головок (Определяет физическое состояние головок: царапины, трещины, загрязнение поверхности определяет нарушения соединений с электрическим блоком.);
• контроль состояния двигателя (сбой привода двигателя, износ несущих частей, загрязнение);
• контроль состояния магнитной поверхности диска, производит проверку системы коррекции ошибок, производит контроль системы учета повреждений и запрета их использования;
• контроль исправности электронных компонент: микросхем, цепей соединения, исправности соединения с шиной, исправности системы управления.
Соседние файлы в папке Smirnov