- •Основные эксплуатационные характеристики эвм
- •Надежность вычислительных систем
- •Показатели надежности
- •Термины и определения
- •Надежность программного обеспечения
- •Способы обеспечения и повышения надежности программ
- •Способы повышения эксплуатационной надежности эвм
- •Классификация методов и средств контроля функционирования эвм
- •Система автоматического контроля эвм
- •Контроль передачи информации
- •Контроль комбинационных схем
- •Самопроверяемые схемы контроля
- •Диагностические средства проверки работоспособности схем контроля
- •Прерывания от схем контроля
- •Принципы построения системы контроля процессора
- •Контроль счетчиков
- •Контроль алу на основе метода самопроверяемого дублирования
- •Контроль по модулю
- •Числовой и цифровой контроль
- •Частные случаи контроля по модулю
- •Способы построения схем сверток
- •Методы оценки эффективности системы аппаратного контроля
- •Резервирование в эвм и вс
- •Основные способы резервирования
- •Механизм обнаружения отказа и замещения резервным блоком может быть:
- •Автоматическое восстановление вычислительного процесса после машинных ошибок Типы машинных ошибок
- •Автоматическое восстановление вычислительного процесса после сбоев
- •Автоматическое восстановление вычислительного процесса после отказов
- •Схемотехнические аспекты эксплуатационного обслуживания эвм Иерархия процессов обслуживания
- •Подготовительный этап:
- •Эксплуатация эвм:
- •Формы эксплуатационного обслуживания эвм
Резервирование в эвм и вс
Резервирование—способ повышения надежности аппаратуры, предусматривающий замену отказавших частей аппаратуры резервными при условии, что резервная аппаратура входит конструктивно и функционально в состав рассматриваемой аппаратуры. Включение резерва может быть произведено вручную или автоматически, в некоторых случаях резерв может быть функционально связан с основной аппаратурой так, что специального включения ее не требуется.
Если же для восстановления работоспособности аппаратуры требуется удалить отказавшую часть аппаратуры и вместо нее вставлять или вмонтировать аналогичную исправную, то речь идет не о резервировании, а о ремонте.
Программное обеспечение может быть также резервировано. В этом случае под резервом понимается наличие запасных вариантов (версии) всей программы или ее отдельных модулей, которые входят в состав данной программной системы и будут задействованы при помощи команд условного перехода, при условии отказа основной программы.
В аппаратуре универсальных ЭВМ в настоящее время резервирование встречается на различных уровнях.
Резервирование на уровне ЭВМ. На уровне ЭВМ резервирование заключается в наличии большего числа однотипных ЭВМ, чем необходимо для решения поставленных задач.
Если отдельные процессоры ЭВМ, объединенные через интерфейсы связи и адаптеры работают с общими периферийными устройствами, общим полем памяти, то они образуют многомашинную (многопроцессорную) ВС.
Резервирование на уровне устройств. На более низких уровнях иерархии структуры ЭВМ резервирование широко встречается на уровне периферийных устройств (ПУ). В современных ВС имеется, как правило, несколько устройств памяти на магнитных лентах и магнитных дисках, несколько печатающих устройств и т.д. Так как эти устройства могут быть полностью использованы для ввода, вывода или запоминания большого количества информации, а при небольшом количестве информации можно пользоваться одним устройством, то достаточность ПУ с учетом возможных отказов целесообразно оценить через эффективную производительность.
Резервирование на уровне кодов. Кроме названных методов резервирования, в ЭВМ нашли широкое применение коды с обнаружением и исправлением ошибок (см. раздел 5 1 часть лекций по МПС) для повышения надежности ОЗУ и ВЗУ. Применение этих кодов дает возможность исправлять определенное число ошибок в каналах передачи данных или восстановить информацию в случае отказа некоторых ячеек в ОЗУ и ПЗУ или дорожек (т. е. усилителей записи— считывания) в накопителях на магнитных лентах или магнитных дисках. Надежность таких устройств оценивается как надежность резервированных систем со скользящим резервом.
Резервирование в специализированных и управляющих ЭВМ. В специализированных и особенно управляющих ЭВМ резервирование применяется значительно шире в связи с высокими требованиями, предъявляемыми к надежности таких систем.
Основные способы резервирования
Введение резервирования как средства контроля за достоверностью информации особенно актуально с появлением дешевых микропроцессоров и БИС. На рисунке приведена классификация методов резервирования.
По способу организации резерва различают:
Постоянное (статическое) резервирование;
Резервирование с замещение (динамическое);
Гибридное.
Постоянным или статическим называется резервирование, при котором резервные блоки включены постоянно и находятся в одинаковом с основным режиме работы.
Резервированием с замещением или динамическим называется резервирование, при котором резервные блоки включаются и замещают основные блоки только при отказе последних.
Гибридное резервирование сочетает свойства статического и динамического резервирования.
В системах со статическим резервированием восстановление работоспособности после отказа происходит мгновенно, а в системах с динамическим резервированием время восстановления вычислительного процесса в зависимости от степени автоматизации процедур восстановления измеряется в широких пределах.
На рисунках приведен пример статического и динамического резервирования. В первом случае входные данные подаются параллельно на основное и резервное устройство, в которых выполняются преобразования по одной программе. Результаты вычислений сравниваются аппаратно на схеме сравнения и при совпадении результатов основное устройство выдает результат на выход. При обнаружении несовпадения результатов производится попытка восстановления вычислительного процесса с целью выявления типа ошибки (сбой или отказ) путем возврата к контрольной точке для повторения команды или участка программы, на которой обнаружено несовпадение. При сбое вычислительный процесс продолжают оба устройства, а при отказе выполняется диагностирование обоих устройств с целью выявления неисправного и оно исключается из работы.
При динамическом резервировании оба процессора работают на общее ВЗУ. Предварительно программа и исходные данные загружаются в оба процессора, но выполнение программы осуществляет только основной процессор. Систематически по прерываниям основной процессор посылает в резервный информацию с контрольных точек (содержимое IP, PSW, промежуточные данные) с тем, чтобы последний мог продолжить работу при отказе основного процессора. Отказ основного процессора обнаруживается резервным при отсутствии сигнала ответа «Я жив» от САК основного процессора и резервный процессор берет на себя продолжение выполнения программы с последней контрольной точки, так как имеет загруженную копию и промежуточные значения состояния основного процессора.
При статическом резервирование наличие САК необязательно, так как эти функции выполняет резервное устройство.
По режиму работы резерва различают:
Нагруженный резерв, когда резервный блок находится в том же рабочем режиме, что и основной;
Ненагруженный резерв, когда резервный блок практически не несет нагрузок;
Облегченный резерв, когда резервный блок находится в менее нагруженном режиме, чем основной.
При динамическом и гибридном резервировании различают два способа включения резервных блоков:
По питанию (только для ненагруженного резерва);
Логическое – предполагает, что на резервный блок постоянно подано напряжение питания.
