- •А.М. Бакшаев
- •Основные эксплуатационные характеристики эвм
- •Надежность вычислительных систем
- •Показатели надежности
- •Термины и определения
- •Надежность программного обеспечения
- •Способы обеспечения и повышения надежности программ
- •Способы повышения эксплуатационной надежности эвм
- •Классификация методов и средств контроляфункционирования эвм
- •Система автоматического контроля эвм
- •Контроль передачи информации
- •Контроль комбинационных схем
- •Самопроверяемые схемы контроля
- •Диагностические средства проверки работоспособности схем контроля
- •Прерывания от схем контроля
- •Принципы построения системы контроля процессора
- •Контроль счетчиков
- •Контроль алу на основе метода самопроверяемого дублирования
- •Контроль по модулю
- •Числовой и цифровой контроль
- •Частные случаи контроля по модулю
- •Способы построения схем сверток
- •Методы оценки эффективности системы аппаратного контроля
- •Резервирование в эвм и вс
- •Основные способы резервирования
- •Механизм обнаружения отказа и замещения резервным блокомможет быть:
- •Автоматическое восстановление вычислительного процесса после машинных ошибок Типы машинных ошибок
- •Автоматическое восстановление вычислительного процесса после сбоев
- •Автоматическое восстановление вычислительного процесса после отказов
- •Схемотехнические аспекты эксплуатационного обслуживания эвм Иерархия процессов обслуживания
- •Формы эксплуатационного обслуживания эвм
Диагностические средства проверки работоспособности схем контроля
Диагностические средства проверки работоспособности схем контроля предназначены для периодической проверки работоспособности схем контроля с помощью специальных диагностических тестов. Диагностирование проводится с маскированием прерываний от схем контроля следующими методами:
введением ошибок различной кратности в информационные тракты ЭВМ (интерфейсные ошибки);
имитации ошибок в схемах контроля четности (КК);
имитации ошибок в схемы контроля методом дублирования;
имитации одиночных и двойных ошибок в ОП;
имитации ошибок в общем регистре ошибок.
Диагностирование заключается в проверке реакции системы контроля на ошибки, имитируемые как в контролируемом устройстве, так и в схемах контроля.
Прерывания от схем контроля
Для фиксации ошибок, обнаруживаемых схемами контроля в ЭВМ предусмотрен набор регистров ошибок для различных групп устройств: процессора и периферийных устройств. Появление сигнала ошибки производит установку соответствующего бита регистра ошибок RgOш и вызывает выработку сигнала прерывания от схем контроля. При этом осуществляется передача управления подпрограмме обработки прерывания (ППОП) для анализа типа ошибки (сбой или отказ), т.е. подключаются средства восстановления вычислительного процесса после сбоя.
Если ошибка классифицируется как сбой, то прерывание называется подавляемым и выполнение команды не прекращается. То есть для определения типа ошибки необходимо восстановить вычислительный процесс путем повторения участка микропрограммы, команды или программы, на котором был выработан сигнал прерывания.
Если одно и тоже прерывание было выработано несколько раз (от 2 до 16), то оно называется неотложным и классифицирует ошибку как отказ. Выполнение команды прекращается с выдачей сообщения о неисправности.
Информация о типе ошибки, месте неисправности и степени повреждения записывается в ППОП в специальную область памяти, а в дальнейшем переписывается на магнитный диск для ведения журнала ошибок. Далее производится запуск программы обработки ошибок для восстановления вычислительного процесса или тестирования.
Принципы построения системы контроля процессора
На рисунке 3 представлен фрагмент самопроверяемых схем контроля работы процессора: передачи информации по нечетности и комбинационной схемы на примере дешифратора.
В структуру системы контроля входит регистр ошибок и схемы формирования одноразрядного сигнала ошибок для выходов функции f1f2, реализованные на элементах «Исключающее ИЛИ» методом дублирования. Для обнаружения неисправностей в RgОш в структуру входит дополнительный триггер общей ошибки Тош. Тогда по состоянию выходов групп схем «Исключающее ИЛИ» и выходов регистра ошибок и триггера общей ошибки можно определить наличие неисправностей, как в схемах контроля, так и в блоке регистра ошибок, т.е. в схеме дополнительно формируется три самопроверяемых функции f31, f32, f41, f42, f51, f52.
Контроль счетчиков
На рисунке приведена схема контроля 4-разрядного счетчика. Контроль основан на том, что четность суммы единиц кода, записанного в счетчике, должна совпадать с четностью предсказанного значения этой величины. Предсказывая при помощи вспомогательного триггера T5четность содержимого счетчика и сравнивая ее с фактической четностью содержимого счетчика, можно обнаруживать ошибки в его работе. Изменения четностиусодержимого счетчика определяется по формуле:
Y=^X1+X2^X3+X2X4^X5+X2X4X6^X7+...,
где X1,Х2,...— логические переменные, соответствующие состояниям отдельных разрядов счетчика. В случае 4-разрядного счетчика формула приобретает видY=^x1 V x2^x3,что и реализуется логической схемой «И—ИЛИ» на схеме рисунка. Схема «И» предназначена для передачи сигналов на счетный вход триггера Т5 каждый раз, когда поступает входной сигнал.