- •А.М. Бакшаев
- •Основные эксплуатационные характеристики эвм
- •Надежность вычислительных систем
- •Показатели надежности
- •Термины и определения
- •Надежность программного обеспечения
- •Способы обеспечения и повышения надежности программ
- •Способы повышения эксплуатационной надежности эвм
- •Классификация методов и средств контроляфункционирования эвм
- •Система автоматического контроля эвм
- •Контроль передачи информации
- •Контроль комбинационных схем
- •Самопроверяемые схемы контроля
- •Диагностические средства проверки работоспособности схем контроля
- •Прерывания от схем контроля
- •Принципы построения системы контроля процессора
- •Контроль счетчиков
- •Контроль алу на основе метода самопроверяемого дублирования
- •Контроль по модулю
- •Числовой и цифровой контроль
- •Частные случаи контроля по модулю
- •Способы построения схем сверток
- •Методы оценки эффективности системы аппаратного контроля
- •Резервирование в эвм и вс
- •Основные способы резервирования
- •Механизм обнаружения отказа и замещения резервным блокомможет быть:
- •Автоматическое восстановление вычислительного процесса после машинных ошибок Типы машинных ошибок
- •Автоматическое восстановление вычислительного процесса после сбоев
- •Автоматическое восстановление вычислительного процесса после отказов
- •Схемотехнические аспекты эксплуатационного обслуживания эвм Иерархия процессов обслуживания
- •Формы эксплуатационного обслуживания эвм
Резервирование в эвм и вс
Резервирование—способ повышения надежности аппаратуры, предусматривающий замену отказавших частей аппаратуры резервными при условии, что резервная аппаратура входит конструктивно и функционально в состав рассматриваемой аппаратуры.Включение резерва может быть произведено вручную или автоматически, в некоторых случаях резерв может быть функционально связан с основной аппаратурой так, что специального включения ее не требуется.
Если же для восстановления работоспособности аппаратуры требуется удалить отказавшую часть аппаратуры и вместо нее вставлять или вмонтировать аналогичную исправную, то речь идет не о резервировании, а о ремонте.
Программное обеспечение может быть также резервировано. В этом случае под резервом понимается наличие запасных вариантов (версии) всей программы или ее отдельных модулей, которые входят в состав данной программной системы и будут задействованы при помощи команд условного перехода, при условии отказа основной программы.
В аппаратуре универсальных ЭВМ в настоящее время резервирование встречается на различных уровнях.
Резервирование на уровне ЭВМ.На уровне ЭВМ резервирование заключается в наличии большего числа однотипных ЭВМ, чем необходимо для решения поставленных задач.
Если отдельные процессоры ЭВМ, объединенные через интерфейсы связи и адаптеры работают с общими периферийными устройствами, общим полем памяти, то они образуют многомашинную (многопроцессорную) ВС.
Резервирование на уровне устройств.На более низких уровнях иерархии структуры ЭВМ резервирование широко встречается на уровне периферийных устройств (ПУ). В современных ВС имеется, как правило, несколько устройств памяти на магнитных лентах и магнитных дисках, несколько печатающих устройств и т.д. Так как эти устройства могут быть полностью использованы для ввода, вывода или запоминания большого количества информации, а при небольшом количестве информации можно пользоваться одним устройством, то достаточность ПУ с учетом возможных отказов целесообразно оценить через эффективную производительность.
Резервирование на уровне кодов.Кроме названных методов резервирования, в ЭВМ нашли широкое применениекоды с обнаружением и исправлением ошибок(см. раздел 5 1 часть лекций по МПС)для повышения надежности ОЗУ и ВЗУ. Применение этих кодов дает возможность исправлять определенное число ошибок в каналах передачи данных или восстановить информацию в случае отказа некоторых ячеек в ОЗУ и ПЗУ или дорожек (т. е. усилителей записи— считывания) в накопителях на магнитных лентах или магнитных дисках. Надежность таких устройств оценивается как надежность резервированных систем со скользящим резервом.
Резервирование в специализированных и управляющих ЭВМ. Вспециализированных и особенно управляющих ЭВМ резервирование применяется значительно шире в связи с высокими требованиями, предъявляемыми к надежности таких систем.
Основные способы резервирования
Введение резервирования как средства контроля за достоверностью информации особенно актуально с появлением дешевых микропроцессоров и БИС. На рисунке приведена классификация методов резервирования.
По способу организации резерва различают:
Постоянное (статическое) резервирование;
Резервирование с замещение (динамическое);
Гибридное.
Постоянным или статическимназывается резервирование, при котором резервные блоки включены постоянно и находятся в одинаковом с основным режиме работы.
Резервированием с замещением или динамическим называется резервирование, при котором резервные блоки включаются и замещают основные блоки только при отказе последних.
Гибридное резервирование сочетает свойства статического и динамического резервирования.
В системах со статическим резервированием восстановление работоспособности после отказа происходит мгновенно, а в системах с динамическим резервированием время восстановления вычислительного процесса в зависимости от степени автоматизации процедур восстановления измеряется в широких пределах.
На рисунках приведен пример статического и динамического резервирования. В первом случае входные данные подаются параллельно на основное и резервное устройство, в которых выполняются преобразования по одной программе. Результаты вычислений сравниваются аппаратно на схеме сравнения и при совпадении результатов основное устройство выдает результат на выход. При обнаружении несовпадения результатов производится попытка восстановления вычислительного процесса с целью выявления типа ошибки (сбой или отказ) путем возврата к контрольной точке для повторения команды или участка программы, на которой обнаружено несовпадение. При сбое вычислительный процесс продолжают оба устройства, а при отказе выполняется диагностирование обоих устройств с целью выявления неисправного и оно исключается из работы.
При динамическом резервировании оба процессора работают на общее ВЗУ. Предварительно программа и исходные данные загружаются в оба процессора, но выполнение программы осуществляет только основной процессор. Систематически по прерываниям основной процессор посылает в резервный информацию с контрольных точек (содержимое IP, PSW, промежуточные данные) с тем, чтобы последний мог продолжить работу при отказе основного процессора. Отказ основного процессора обнаруживается резервным при отсутствии сигнала ответа «Я жив» от САК основного процессора и резервный процессор берет на себя продолжение выполнения программы с последней контрольной точки, так как имеет загруженную копию и промежуточные значения состояния основного процессора.
При статическом резервирование наличие САК необязательно, так как эти функции выполняет резервное устройство.
По режиму работы резерва различают:
Нагруженный резерв, когда резервный блок находится в том же рабочем режиме, что и основной;
Ненагруженный резерв, когда резервный блок практически не несет нагрузок;
Облегченный резерв, когда резервный блок находится в менее нагруженном режиме, чем основной.
При динамическом и гибридном резервировании различают два способа включения резервных блоков:
По питанию (только для ненагруженного резерва);
Логическое – предполагает, что на резервный блок постоянно подано напряжение питания.