- •А.М. Бакшаев
- •Основные эксплуатационные характеристики эвм
- •Надежность вычислительных систем
- •Показатели надежности
- •Термины и определения
- •Надежность программного обеспечения
- •Способы обеспечения и повышения надежности программ
- •Способы повышения эксплуатационной надежности эвм
- •Классификация методов и средств контроляфункционирования эвм
- •Система автоматического контроля эвм
- •Контроль передачи информации
- •Контроль комбинационных схем
- •Самопроверяемые схемы контроля
- •Диагностические средства проверки работоспособности схем контроля
- •Прерывания от схем контроля
- •Принципы построения системы контроля процессора
- •Контроль счетчиков
- •Контроль алу на основе метода самопроверяемого дублирования
- •Контроль по модулю
- •Числовой и цифровой контроль
- •Частные случаи контроля по модулю
- •Способы построения схем сверток
- •Методы оценки эффективности системы аппаратного контроля
- •Резервирование в эвм и вс
- •Основные способы резервирования
- •Механизм обнаружения отказа и замещения резервным блокомможет быть:
- •Автоматическое восстановление вычислительного процесса после машинных ошибок Типы машинных ошибок
- •Автоматическое восстановление вычислительного процесса после сбоев
- •Автоматическое восстановление вычислительного процесса после отказов
- •Схемотехнические аспекты эксплуатационного обслуживания эвм Иерархия процессов обслуживания
- •Формы эксплуатационного обслуживания эвм
Показатели надежности
Поскольку время до отказа, время между двумя отказами, а также время восстановления — случайные величины, показатели надежности являются вероятностными показателями. Приведем важнейшие из них.
Надежность элементов определяют критериями безотказности работы, количественными характеристиками которых являются:
Критерии безотказной работы;
Критерии восстанавливаемости;
Эксплуатационные критерии.
К критериям безотказности работы относятся:
Вероятность безотказной работы P(t) выражает вероятность того, что объект не откажет к моменту времени наработкиt:
P(t) = Nu / No = Nu / (Nu + Nот),
где Nu- число исправных элементов;
No- число элементов взятых на испытание;
Nот - число отказавших элементов.
Вероятность безотказной работы P(t) можно выразить через интенсивность отказов:
P(t) = e –λ t,
где λ – суммарная интенсивность отказов схемы;
t – интервал времени, для которого производится измерение.
Дополнение вероятности безотказной работы до единицы Q(t)=1—P(t)называетсявероятностью отказа. Вероятность отказаQ(t)— вероятность того, что случайное время до отказа меньше заданного времени t.
В качестве показателя надежности неудобно использовать функциональную зависимость, например функцию P(t).Поэтому в технических условиях (ТУ) обычно оговаривают отдельные ординаты (одну или две) функцииP(t)при значениях t,выбираемых из нормированного рядаt=100, 500; 1000; 2000; 5000; 10000ч.
Частота отказов измеряется отношением числа отказавших в единицу времени элементов к первоначальному числу элементов, поставленных на испытание:
F(t) = Nот/ ti No [1/час],
где ti - время между i-ми отказами.
Среднее время наработки до отказа (безотказной работы) tоопределяется как математическое ожидание времени до отказа или:
to = Tp / m = ti / m, где ti - время между i-ми отказами, m - число отказов,
Тр - время наблюдения.
Интенсивность отказов (t)выражает интенсивность процессов возникновения отказов.
Статистически интенсивность отказов оценивается по отношению числа отказов Nот в достаточно малом интервале времениt, отнесенное к числу оставшихся к моменту времени tобразцов Noи интервалу времениt:
(t) = Nот / (No * t).
Основным критерием восстанавливаемости является:
- среднее время восстановления Тв показывает сколько в среднем затрачивается времени на обнаружение и устранение неисправности:
m
Тв = Σ ti / m,
i=1
где ti – время восстановления системы после i-го отказа, т – число отказов.
К эксплуатационным критериям надежности относятся:
- коэффициент использования;
- коэффициент готовности;
- эффективность эксплуатации.
Коэффициент готовности Kr(t)используется в качестве показателя надежности, если кроме факта отказа необходимо учитывать время восстановления, поскольку она не пренебрежимо мала. Коэффициент готовности определяется как вероятность того, что в произвольный заданный момент времениtобъект находится в состоянии работоспособности (кроме планируемых периодов, в течение которых применение объекта по назначению не предусматривается). Статистическая оценка коэффициента готовности:
Кг = Nb(t) /No,
где Nb(t) - число объектов, находящихся в рабочем состоянии в момент времениt, а разностьNo-Nb выражает количество объектов, находящихся в ремонте в момент времениt.
Стационарный коэффициент готовности Кг.ст. определяется как отношение суммарного времени работы объектаtpк суммарному времени работы и восстановления (ремонта)tp+tв, т.е. учитывает потери времени на ремонт, а не количество ремонтов:
Кг.ст. = tp/ (tp+tв).
Таким образом коэффициент оперативной готовности R(t) — вероятность того, что объект окажется в работоспособном состоянии в произвольный момент времени, кроме планируемых периодов, в течение которых применение объекта по назначению не предусматривается и, начиная с этого момента, будет работать безотказно заданный интервал времени, т.е. в отличии от стационарного коэффициента готовности учитывает время, затрачиваемое на проведение плановых профилактических работ.
Комплексным показателем эффективности использования ЭВМ, а, следовательно, и показателей надежности ее работы является коэффициент использования:
t i всr k пфs
К ик = ----- ,
t i (вoj oжj)
где n, m, k- соответственно число отказов, сбоев и профилактических обслуживаний за большой период наблюдения за эксплуатацией;
t i- интервал времени исправной работы между двумя соседними отказами;
вoj и oжj - время восстановления и время ожидания начала ремонта послеj-го отказа;
всr- время восстановления вычислительного процесса послеm-го сбоя (повторение части программы, команды и т.п.);
k- суммарное машинное время, затраченное на контроль правильности функционирования ЭВМ (тестирование ЭВМ, двойной просчет, расчет контрольных вариантов и т.д.);
пфs- время, затраченное наS-е профилактическое обслуживание.
Таким образом выражение Ки определяет отношение полезного времени работы машины к общему времени наблюдения за эксплуатацией ЭВМ.
Отсюда, для повышения коэффициента использования следует, с одной стороны, добиваться увеличения среднего времени наработки на отказ, а с другой стороны, - повышать ремонтопригодность ЭВМ (то есть уменьшать среднюю продолжительность восстановления после отказа) и снижать время простоя в ожидании ремонта.
Важным средством повышения ремонтопригодности является оснащение ЭВМ средствами автоматического диагностирования, так как поиск и локализация места неисправности занимают до 60% от общего времени восстановления.
Так как любой сбой или отказ в машине приводит к искажению информации (данных и программ), то такое искажение приводит к распространению ошибки и в итоге к искажению программ и данных. Отсюда, для повышения достоверности информации ЭВМ должна быть снабжена системой автоматического контроля (САК), воспринимающей ошибку в момент ее возникновения, что препятствует дальнейшему ее распространению.