- •А.М. Бакшаев
- •Основные эксплуатационные характеристики эвм
- •Надежность вычислительных систем
- •Показатели надежности
- •Термины и определения
- •Надежность программного обеспечения
- •Способы обеспечения и повышения надежности программ
- •Способы повышения эксплуатационной надежности эвм
- •Классификация методов и средств контроляфункционирования эвм
- •Система автоматического контроля эвм
- •Контроль передачи информации
- •Контроль комбинационных схем
- •Самопроверяемые схемы контроля
- •Диагностические средства проверки работоспособности схем контроля
- •Прерывания от схем контроля
- •Принципы построения системы контроля процессора
- •Контроль счетчиков
- •Контроль алу на основе метода самопроверяемого дублирования
- •Контроль по модулю
- •Числовой и цифровой контроль
- •Частные случаи контроля по модулю
- •Способы построения схем сверток
- •Методы оценки эффективности системы аппаратного контроля
- •Резервирование в эвм и вс
- •Основные способы резервирования
- •Механизм обнаружения отказа и замещения резервным блокомможет быть:
- •Автоматическое восстановление вычислительного процесса после машинных ошибок Типы машинных ошибок
- •Автоматическое восстановление вычислительного процесса после сбоев
- •Автоматическое восстановление вычислительного процесса после отказов
- •Схемотехнические аспекты эксплуатационного обслуживания эвм Иерархия процессов обслуживания
- •Формы эксплуатационного обслуживания эвм
Механизм обнаружения отказа и замещения резервным блокомможет быть:
Аппаратурным (с помощью САК на логическом уровне представления ЭВМ);
Программным (с помощью системы автоматического диагностирования);
Аппаратно-программным.
По способу структурной организации резерва различают:
Дублированные системы;
Мажоритарные;
Гибридные;
Системы с частичным резервированием;
Самопроверяемые избыточные системы.
Системы с частичным резервированиемпредставляют собой системы, состоящие из N основных однотипных блоков и S резервных нагруженных или ненагруженных, замещающих основные при отказе с помощью логических переключателей или вручную (при этом N > S). Отказавший блок выводится из строя. (См. пример метод замещения резервной БИС памяти лекции МПС часть 1).
Дублированные системы это системы состоящие из двух однотипных блоков: основного и резервного. Пример статической и динамической дублированной системы рассмотрен выше.
При статическом резервировании ЭВМ снабжается средствами самоконтроля (тесты) для определения неисправной ЭВМ либо охранными таймерами, которые периодически сбрасываются при исправной работе ЭВМ, а при переполнении таймера управление передается резервной ЭВМ.
При динамическом резервировании ЭВМ должна содержать САК или охранные таймеры с целью определения моментов времени для подключения и передачи управления резервной ЭВМ.
Мажоритарные системы.
Мажоритарными называются системы, в которых для определения правильных данных используется мажоритарный орган, данные на выходе которого определяются по большинству совпадающих данных, подаваемых на его входы.Такой метод резервирования называютметодом голосования или мажоритарным методом.
Cтруктура устройства преобразования информации с мажоритарным органом изображена на рисунке,где 1, 2,...,n — одинаковые устройства преобразования информации, работающие параллельно. Если из-за ошибок в работе устройств наблюдается расхождение между выходами устройств, то мажоритарный органМОвыдает тот вариант информации, который наблюдается на большинстве из выходов преобразователяX/Y.
Наиболее часто используют простейшую троированную мажоритарную систему (ТМС). Мажоритарный орган в этой системе представляет собой схему с тремя входами, значение сигнала на выходе которой совпадает со значением большинства входных сигналов (два из трех).
Голосование в ТМС может быть программным или аппаратным. При программном голосовании одна ЭВМ является ведущей, которая сравнивает результаты трех ЭВМ, а в качестве правильного использует два одинаковых результата. При локализации неисправной ЭВМ она выводится из работы и система продолжает работу как дублированная.
В N-ированной мажоритарной системе (NMC) число блоков должно быть нечетнымN= 2n+ 1 и система будет продолжать работу при отказеnблоков. Недостатком такой системы является то, что при отказе (n+ 1)-го блока система считается неисправной, хотя имеетсяnисправных блоков.
Вероятность безотказной работы системы определяется тогда по формулам:
Троированная n= 3: Рм(3) = Рмж (3Р2 2Р3) ;
Для n= 5: Рм(5) = Рмж (10Р3 15Р4 + 6Р5),
где Рмж—вероятность безотказной работы мажоритарного органа; Р— вероятность безотказной работы одного канала.
Однако приведенные схемы не позволяют достичь вероятности безотказной работы выше, чем вероятность безотказной работы мажоритарного органа Рмж. Этот недостаток устраняется в мультиплексированной мажоритарной схеме (см. рисунок), где МО также резервируются.
В последнее время встречаются системы с адаптивным голосованием и с реконфигурацией,где после отказа двух устройств изменяется порог и система переходит на работу сN= 2n- 2 + 1 устройством из оставшихся. Например, приN= 5 сначала идет голосование 3 из 5, а после отказа двух блоков 2 из 3. Вероятность безотказной работы такой системы выражается по следующей формуле:
Рмп(t) = Рмж(t)((3e - t - e -3 t) / 2) ,
где Рмж(t)—вероятность безотказной работы мажоритарного органа;—интенсивность отказов одного канала.
Эта формула справедлива при экспоненциальной модели надежности каналов и при пренебрежении ненадежностью аппаратуры для переключения.
Гибридные избыточные системы (ГИС). ГИС состоит из N основных постоянно включенных блоков по мажоритарной схеме и S резервных блоков, заменяющих основные при отказе последних. Гибридная избыточная схема отказывает только при отказе всех резервных блоков и одного из основных.
Существенную часть ГИС составляют переключательные схемы, обеспечивающие отключение отказавших и включение резервных блоков, которые требуют значительных аппаратурных затрат и ведут к снижению общей надежности системы.
Самопроверяемые избыточные схемы (СИС). СИС образуют особый класс систем, состоящих из блоков, имеющих схемы встроенного контроля с вероятностью обнаружения ошибок заданного класса, близкой к 1.
Из самопроверяемых блоков (см. рисунок) могут быть разработаны:
Дублированные;
Мажоритарные;
Гибридные избыточные системы.
Условно будем считать, что при обнаружении ошибки на выходе схемы контроля формируентся низкий уровень сигнала, а при исправном состоянии блока – высокий.
Рассмотрим пример дублированной самопроверяемой избыточной системы в двух вариантах:
Простая дублированая СИС;
Дублированная СИС с мажоритарным голосованием схем контроля.
Простая дублированая СИС включает два блока со своими схемами контроля СК1 и СК2 и мажоритарный орган, обеспечивающий выдачу правильного результата на выход, и схему на элементе D4 для формирования сигнала прерывания от схем контроля об отказе системы (схема на рисунке выделена пунктиром).
При возникновении в одном из блоков ошибки, обнаруженной его схемой контроля, сигнал ошибки поступает в мажоритарный орган (МО) и блокирует выход ошибочного блока. Достоинством СИС является самоотключение отказавшего блока при обнаружении ошибки. Алгоритм работы схемы описывается с помощью таблицы 1.
Однако, так как любая система контроля обнаруживает ошибки кратности больше, чем одиночные с определенной вероятностью, то возможен пропуск ошибок из-за низкой эффективности метода или сбоя (отказа) системы контроля.
Поэтому дублированная СИС с мажоритарным голосованием схем контроля СИС может быть дополнена схемой сравнения выходных сигналов блоков для проверки работоспособности схем контроля на сбой или пропуска ошибок m-ной кратности, не обнаруживаемых схемами контроля. Функционирование схемы поясняется с помощью таблицы 2.
Дополнительная комбинационная схема на элементах Q1 иQ2 обеспечивает принцип голосования для формирования результата (мажоритарная система на основе дублированной схемы) и формирует два сигнала: отказ системы и необходимости дополнительной проверки.
Таблица 1 - Таблица истинности работы дублированной СИС
СК1 |
СК2 |
П о я с н е н и я |
0 0 1 1 |
0 1 0 1 |
Отказ системы Система работоспособна. Результат равен Б2 Система работоспособна. Результат равен Б1 Система работоспособна. Результат равен Б1 или Б2 |
Таблица 2 - Таблица истинности работы дублированной СИС
с мажоритарным голосованием
СК1 |
СК2 |
СОМ |
П о я с н е н и я |
0 0 0 0 1 1 1 1 |
0 0 1 1 0 0 1 1 |
0 1 0 1 0 1 0 1 |
Отказ системы Отказ системы Отказ системы Система работоспособна. Результат равен Б2 Отказ системы Система работоспособна. Результат равен Б1 Необходима дополнительная проверка Система работоспособна. Результат равен Б1 или Б2 |
Из таблицы 2 видно, что необходимость дополнительной проверки СИС возникает, когда схема сравнения обнаруживает ошибку (несовпадение результатов), а ни одна из схем контроля блоков СК1 и СК2 из-за сбоя (отказа) не обнаружила ошибку, или схемы контроля не обнаружили многократную ошибку из-за низкой эффективности метода контроля, положенного в основу построения СК. В этом случае для локализации места неисправности в блоке или схеме контроля запускаются диагностические тесты.
Надежность сетей ЭВМ.Одними из важных объектов со сложной структурой надежности являютсясети. ЭВМ. В настоящее время сети ЭВМ объединяют тысячи ЭВМ (вычислительных центров), отдельные линии связи имеют межконтинентальную протяженность.
Под надежностью сети ЭВМчаще всего понимается сохранение ее связности, а подотказом сети ЭВМ —распадание ее на изолированные части. Надежность сети оценивается через вероятность сохранения связи между отдельной парой ЭВМ или между всеми ЭВМ сети. Для расчета надежности сети может быть применен метод минимальных путей и сечений, а также метод статистического моделирования.