
- •Содержание
- •Введение
- •1 Надёжность электронной аппаратуры
- •1.1 Основные определения стандартов надежности
- •1.2 Обеспечение надёжности электронной аппаратуры на этапах проектирования
- •1.2.1 Этап аванпроекта
- •1.2.2 Этап эскизного проектирования
- •1.2.3 Этап технического проектирования
- •1.2.4 Этап изготовления опытных комплектов
- •1.2.5 Этап эксплуатации
- •1.2.6 Контрольные вопросы и задания
- •2 Основные показатели надежности
- •2.1.1 Интенсивность отказов
- •2.1.2 Частота отказов
- •2.1.3 Среднее время наработки на отказ
- •2.1.4 Среднее время между отказами
- •2.1.5 Вероятностные показатели надежности
- •2.1.5.1 Вероятность безотказной работы
- •2.1.5.2 Экспоненциальная модель вероятности безотказной работы
- •2.1.5.3 Модель вбр Вейбулла-Гнеденко
- •2.1.5.4 Модель Пуассона
- •2.1.5.5 Вероятность отказа изделия в работе
- •2.1.6 Поток отказов
- •2.1.7 Коэффициент готовности
- •2.1.7.1 Стационарный коэффициент готовности
- •2.1.7.2 Коэффициент оперативной готовности
- •2.1.8 Погрешность оценки показателей надежности
- •2.1.8.1 Погрешность оценки показателей
- •2.2 Применение показателей надежности
- •2.3 Надёжность невосстанавливаемых систем
- •2.4 Надежность дискретных элементов
- •2.5 Пример расчёта надёжности нерезервированных схем
- •3 Надежность резервированных вычислительных систем
- •3.1 Резервирование изделий
- •3.1.1 Резервирование на уровне эвм
- •3.1.2 Резервирование на уровне устройств
- •3.1.3 Резервирование с использованием к-кодов
- •3.1.4 Резервирование в специализированных эвм
- •3.2 Представление резервированных объектов
- •3.3 Параметры НаДёжносТи при нагруженном резерве
- •3.3.1 Расчет показателя безотказной работы
- •3.3.2 Определение средней наработки на отказ
- •3.4 Параметры надёжносТи при ненагруженном резерве.
- •3.5 Надёжность при сложной структуРе резервирования.
- •3.5.1 Скользящий нагруженный резерв
- •3.6 Скользящий ненагруженный резерв
- •4 Метод минимальных путей и минимальных сечений
- •4.1 Примерный расчет надежности методом мп & мс
- •5 Применение сложных структур резерва
- •5.1 Методы избыточного кодирования
- •5.2 Логика с переплетением
- •5.3 Мажоритарное резервирование
- •6 Надежность компьютерных сетей
- •6.1. Расчёт надёжности компьютерных систем
- •7 Надежность систем массового обслуживания
- •8. Контроль и диагностика систем
- •8.1 Основные положения
- •8.2 Контроль по модулю
- •8.3 Построение контрольных тестов
- •8.4 Системы с программным контролем
- •8.5 Встроенный оперативный контроль
- •8.5.1 Встроенный контроль счетчика
- •8.5.2 Встроенный контроль дешифратора
- •8.5.3 Показатели встроенного контроля
- •8.6 Методы диагностирования
- •8.6.1 Основные положения
- •8.6.2 Методы построения диагностических тестов
- •8.6.2.1 Квазиоптимальные тесты шеннона-фано
- •8.6.3 Метод декомпозиции диагностируемой системы
- •8.7 Системы диагностики при эксплуатации
- •8.7.1 Обнаружение отказов при эксплуатации
- •8.7.2 Диагностика периферийных устройств
- •8.7.3 Диагностика многопроцессорных систем
- •9 Надежность программного обеспечения
- •9.1 Классификация ошибок программирования
- •9.2 Способы повышения надежности по
- •9.3 Основные модели надежности по
- •9.3.1 Модель Литтлвуда - Вералла
- •9.3.2 Модель джелинского - моранды
- •9.3.3 Модель шумана
- •9.3.4 Модель шика-вольвертона
- •9.4 Прогнозирование надежности по
- •9.5 Методы структурной избыточности по
- •9.6 Избыточность операционной системы
- •9.7 Метод контрольных функций
- •9.8 Методы тестирования программ
- •9.9 Функциональные методы тестирования
- •10 Отказоустойчивые компьютерные системы
- •11 Обслуживание систем в эксплуатации
- •11.1 Элементы теории восстановления систем
- •11.2 Оптимальные правила предупредительных замен
- •11.3 Оптимальные правила проверок
- •Список литературы
10 Отказоустойчивые компьютерные системы
Отказоустойчивость — это свойство архитектуры и биологии вычислительных систем, позволяющее продолжать безошибочную работу и тогда, когда в аппаратно-программных средствах возникли и имеются отказы [1,25].
Различают активную и пассивную отказоустойчивость по способу реализации
Активная отказоустойчивость базируется на следующей последовательности процессов:
— контроль и оперативное обнаружение отказа;
—диагностика подозреваемой области отказов и её локализация с заданной глубиной;
— принятие решения по шунтированию отказа;
— выполнение реконфигурации системы;
— контроль и анализ безошибочности работы системы;
— вывод системы на продолжение нормальной работы;
— вывод сообщения об отказе и его устранении.
Пассивная отказоустойчивость определяется свойством системы не проявлять отказ даже при наличии отказов отдельных её элементов. Отказ как бы маскируется безошибочной работой системы.
Примером пассивно отказоустойчивых систем являются системы с мажоритарным резервом, логические системы с переплетением.
Как активная, так и пассивная стратегия отказоустойчивости связаны с дополнительными затратами аппаратных средств и применяются в случае особенно ответственных систем, отказ которых связан с большим ущербом, когда не допустимы даже кратковременные перерывы в работе.
Применение активной отказоустойчивости характеризуется некоторыми потерями времени при восстановлении работоспособности системы, дополнительным программным обеспечением управления процессом восстановления.
В то же время пассивная отказоустойчивость гарантирует практически беспрерывную работу ВС и сохранение информации, однако требует значительного увеличения аппаратных средств на биологическом уровне схем отдельных подсистем.
В последние время часто принимаются решения по применению смешанной активно-пассивной отказоустойчивости.Причём пассивная отказоустойчивость применяется больше на нижнем биологическом уровне иерархии системы (ИС, БИС), а активные на высшем уровне иерархии многопроцессорных систем.
Отдельно от надёжности,степень отказоустойчивости характеризуетсякоэффициентом разряжения первичного потока отказов Кр, показывающим, какая доля из всех отказов элементов системы влечёт за собой отказ системы.
Кр=λc/ ∑λэ.
Где λc— интенсивность отказов системы;
∑λэ— суммарная интенсивность отказов всех элементов системы.
В качестве меры отказоустойчивости, при детерминированном подходе, служит d-устойчивость—максимальное число d элементов или других структурных единиц системы, отказ которых ещё не влечёт отказ системы.
Таким образом, отказоустойчивость обеспечивается за счёт параметрической, временной, алгоритмической и структурной избыточности. Последняя избыточность является наиболее эффективной. Она выражается в наличии дополнительных элементов, узлов, заменяющих или резервирующих отказавшие устройства.
Современный уровень отказоустойчивых ВС зарубежных специализированных ЭВМ характеризуется уровнем 0.99 за два года (Например, М-362).
В ВС, предназначенных для непилотируемых космических кораблей, наряду с автоматическим контролем включением резерва предусматривается наземный телеметрический контроль и реконфигурация системы через каналы телеуправления в случае обнаружения отказов или проведения диагностирования системы.