- •А.М. Бакшаев
- •Основные эксплуатационные характеристики эвм
- •Надежность вычислительных систем
- •Показатели надежности
- •Термины и определения
- •Надежность программного обеспечения
- •Способы обеспечения и повышения надежности программ
- •Способы повышения эксплуатационной надежности эвм
- •Классификация методов и средств контроляфункционирования эвм
- •Система автоматического контроля эвм
- •Контроль передачи информации
- •Контроль комбинационных схем
- •Самопроверяемые схемы контроля
- •Диагностические средства проверки работоспособности схем контроля
- •Прерывания от схем контроля
- •Принципы построения системы контроля процессора
- •Контроль счетчиков
- •Контроль алу на основе метода самопроверяемого дублирования
- •Контроль по модулю
- •Числовой и цифровой контроль
- •Частные случаи контроля по модулю
- •Способы построения схем сверток
- •Методы оценки эффективности системы аппаратного контроля
- •Резервирование в эвм и вс
- •Основные способы резервирования
- •Механизм обнаружения отказа и замещения резервным блокомможет быть:
- •Автоматическое восстановление вычислительного процесса после машинных ошибок Типы машинных ошибок
- •Автоматическое восстановление вычислительного процесса после сбоев
- •Автоматическое восстановление вычислительного процесса после отказов
- •Схемотехнические аспекты эксплуатационного обслуживания эвм Иерархия процессов обслуживания
- •Формы эксплуатационного обслуживания эвм
Надежность вычислительных систем
Надежность ВСопределяется, с одной стороны, отсутствием отказов, сбоев и ошибок в ее работе, с другой - возможностью быстрого восстановления аппаратуры и вычислительного процесса.
Надежность—свойство объекта сохранять во времени в установленных пределах значения всех параметров, характеризующих способность выполнять требуемые функции в заданных режимах и условиях применения, технического обслуживания, ремонтов, хранения и транспортирования.
Здесь и далее под «объектом» понимается либо ВС, либо ее подсистема (ЭВМ, устройство, элемент и т. д.) 1
Надежность—сложное свойство, которое в зависимости от назначения объекта и условий его применения состоит из сочетаний свойств:
безотказности;
достоверности функционирования;
долговечности;
ремонтопригодности;
сохраняемости (ГОСТ 27.002—83).
Безотказность—свойство объекта непрерывно сохранять работоспособное состояние в течение некоторого времени или некоторой наработки.Наработка —объем работы объекта.
Чаще всего наработка выражается через время работы объекта, но наработка может быть выражена в другой форме (количество циклов работы, количество решенных задач и др.).
Достоверность функционирования - это свойство машины, определяющее безошибочность производимых ЭВМ преобразований информации и характеризуемое закономерностями появления ошибок из-за случайных сбоев. Сбой сопровождается искажением информации при операциях передачи, хранения и обработки. Достоверность функционирования ЭВМ можно оценить средним временем наработки на один сбой Тс или средним временем восстановления достоверности информации после сбоя Тв.с..
Отказ — событие, заключающееся в нарушении работоспособности объекта. Как правило, отказ вызван физическим разрушением элемента ЭВМ (внезапный отказ) или постепенным ухудшением ее характеристик (постепенный отказ).
Сбой — кратковременное нарушение правильной работы вычислительного устройства или ее элемента, после которого его работоспособность самовосстанавливается или восстанавливается оператором без проведения ремонта (ГОСТ 19542—83).Считается, что сбои вызваны внутренними или внешними помехами электромагнитного характера.
Ремонтопригодность ЭВМ- это степень приспособленности ЭВМ к предупреждению, обнаружению и устранению отказов и характеризуется потерей времени на устранение неисправностей, т.е. средним временем восстановления работоспособности после отказа:Tb.o.(t) =ti/m, гдеti- время восстановления (ремонта) послеi-го отказа,m- число отказов за времяt.
Долговечность ЭВМ - свойство машины при установленном для нее обслуживании сохранять указанные в технической документации характеристики в течение определенного времени хранения и эксплуатации.
Сохранность машины - свойство ЭВМ сохранять исправное состояние при хранении в условиях, оговоренных технической документацией.
Эксплуатационные ресурсы - это ресурсы, необходимые для нормальной эксплуатации машины: площадь помещений, штат обслуживающего персонала, особые требования к параметрам окружающей среды в помещениях (температура, вентиляция, пылезащищенность и др.)
Существует развернутая система государственных стандартов «Надежность в технике» (ССНТ), описываемая ГОСТ 27.001—81. Стандарты ССНТ разделены по группам, обозначаемым цифрой после точки в номере стандарта: 0 — общие вопросы надежности; 1 — нормирование надежности; 2—методы расчета надежности: 3—методы обеспечения надежности; 4—испытания и контроль надежности; 5—сбор и обработка информации о надежности. В таблице 1.1 приведены важнейшие с точки зрения обеспечения надежности ВМ и ВС стандарты ССНТ.
Таблица 1.1
ГОСТ |
Наименование |
27.002—83 27.003—83 27.103—83 27.104—84 27.201—81
27.301—83 27.410—83
27.502—83
|
Термины и определения Выбор и нормирование показателей надежности. Основные положения Критерии отказов и предельных состояний. Основные положения Признаки классификации отказов и предельных состояний. Общие положения Оценка показателей надежности при малом числе наблюдений с использованием дополнительной информации. Общие положения Прогнозирование надежности изделий при проектировании. Общие требования Методы и планы статистического контроля показателей надежности по альтернативному признаку Надежность в технике. Система сбора и обработки информации. Планирование наблюдений |
Кроме стандартов ССНТ интерес представляют стандарты, приведенные в таблице 1.2.
Таблица 1.2
ГОСТ |
Наименование |
23564—79 19542—83 16325—76 |
Техническая диагностика. Показатели диагностирования Совместимость вычислительных машин электромагнитная. Термины и определения Машины вычислительные электронные цифровые общего назначения. Общие технические требования |
В названных стандартах определено более ста терминов из области надежности и смежных вопросов вместе с соответствующими английскими и французскими терминами, приведены некоторые основные теоретические зависимости, рекомендуемые расчетные формулы, методы расчета, оценки и испытания на надежность. Стандарты служат основой при планировании и обеспечении надежности средств вычислительной техники.
Основные качества ЭВМ, связанные с ее надежностью, определяются распределением отказов во времени, процессами восстановления и организацией обслуживания. Улучшение надежности требует, как правило, дополнительных затрат при разработке, изготовлении и эксплуатации системы по критерию минимума суммарных расходов. Среди расходов необходимо учитывать расходы, связанные:
- с разработкой и изготовлением ЭВМ или ВС;
- на персонал, занятый ремонтом и техническим обслуживанием ЭВМ или ВС;
- определяемые последствиями отказов и простоев, снижением эффективности или производительности системы, а также связанные с увеличением массы или габаритов системы и др.
В случае, когда отказ ЭВМ или ВС может повлечь за собой опасность для жизни людей, крупную аварию, уровень надежности выбирается из требования, чтобы вероятность отказа соответствовала практически невозможному событию.
Надежность ВС и ее подсистем планируется на этапе разработки технического задания (ТЗ), закладывается на ранних этапах разработки—при эскизном проектировании, обеспечивается на следующих этапах разработки—техническом и рабочем проектировании, реализуется в процессе производства и поддерживается в процессе эксплуатации.
Для сравнительной оценки отдельных путей обеспечения и повышения надежности применяются расчетные и экспериментальные методы.
Рассмотрим основные методы обеспечения надежности на этапах жизненного цикла ВС, которые могут быть включены в программыпообеспечению надежности.
Этап составления технического задания.На этом этапе наиболее важнособирать все имеющиеся данные об аналогичных или близких реализованных системах,а также данные об условиях применения ЭВМ или ВС и предъявляемых требованиях к функциям, выполняемым рассматриваемой системой. По совокупности этих данных разрабатываются обоснованные требования к надежности данной системы.
Этап эскизного проектирования.На данном этапевыбирается элементная база, и определяются особенности структуры, архитектуры и организации разрабатываемой системы.По этим данным проводится предварительный расчет надежности, выявляются наименее надежные подсистемы и принимаются на этой основе решения о резервировании системы или ее подсистем, а также решения о способах и организации технического обслуживания - профилактических и ремонтных работ. Исследуется и решается вопрос о целесообразности и способах реализации методов автоматического восстановления и отказоустойчивости в системе.
Этапы технического и рабочего проектирования.На этих этапахпроверяются и уточняются ранее принятые технические решения.Основой для этого служат уточненные данные о надежности, полученные на основании расчетов с учетом режимов работы и точной номенклатуры элементов системы, а также результаты экспериментов над моделями, макетами, опытными и промышленными образцами.
Разрабатывается программное обеспечение системы и проводится ее всесторонняя проверка по тестам и путем имитационного моделирования на моделиразрабатываемой ЭВМ.
Практически очень важным для обеспечения надежности является обнаружение и исправление всех ошибок в разрабатываемой технической документации.
Этап производства.На данном этапе основным являетсятехнический контроль, охватывающий все стадии производственного процесса, начиная от входного контроля качества поступающих материалов и комплектующих изделий, включая контроль качества и соответствия технической документации, изготавливаемых печатных плат, блоков, устройств, схемных соединений, конструкции и заканчивая испытаниями готовой продукции. Выявляются также отдельные недостатки в разработке, влияющие на надежность системы, и принимаются меры к их устранению.
Этап эксплуатации.Здесь важнейшими являютсяконтроль и обеспечение условий окружающей среды, предусмотренных проектом, достаточная квалификация и состав обслуживающего персонала, организация и проведение технического обслуживания и ремонтов в предусмотренном порядке.На этапе эксплуатации продолжается сбор сведений об отказах аппаратуры и программного обеспечения, которые передаются разработчикам с целью устранения причин отказов и уточнения исходных данных для расчета надежности.