- •Содержание
- •Введение
- •1 Надёжность электронной аппаратуры
- •1.1 Основные определения стандартов надежности
- •1.2 Обеспечение надёжности электронной аппаратуры на этапах проектирования
- •1.2.1 Этап аванпроекта
- •1.2.2 Этап эскизного проектирования
- •1.2.3 Этап технического проектирования
- •1.2.4 Этап изготовления опытных комплектов
- •1.2.5 Этап эксплуатации
- •1.2.6 Контрольные вопросы и задания
- •2 Основные показатели надежности
- •2.1.1 Интенсивность отказов
- •2.1.2 Частота отказов
- •2.1.3 Среднее время наработки на отказ
- •2.1.4 Среднее время между отказами
- •2.1.5 Вероятностные показатели надежности
- •2.1.5.1 Вероятность безотказной работы
- •2.1.5.2 Экспоненциальная модель вероятности безотказной работы
- •2.1.5.3 Модель вбр Вейбулла-Гнеденко
- •2.1.5.4 Модель Пуассона
- •2.1.5.5 Вероятность отказа изделия в работе
- •2.1.6 Поток отказов
- •2.1.7 Коэффициент готовности
- •2.1.7.1 Стационарный коэффициент готовности
- •2.1.7.2 Коэффициент оперативной готовности
- •2.1.8 Погрешность оценки показателей надежности
- •2.1.8.1 Погрешность оценки показателей
- •2.2 Применение показателей надежности
- •2.3 Надёжность невосстанавливаемых систем
- •2.4 Надежность дискретных элементов
- •2.5 Пример расчёта надёжности нерезервированных схем
- •3 Надежность резервированных вычислительных систем
- •3.1 Резервирование изделий
- •3.1.1 Резервирование на уровне эвм
- •3.1.2 Резервирование на уровне устройств
- •3.1.3 Резервирование с использованием к-кодов
- •3.1.4 Резервирование в специализированных эвм
- •3.2 Представление резервированных объектов
- •3.3 Параметры НаДёжносТи при нагруженном резерве
- •3.3.1 Расчет показателя безотказной работы
- •3.3.2 Определение средней наработки на отказ
- •3.4 Параметры надёжносТи при ненагруженном резерве.
- •3.5 Надёжность при сложной структуРе резервирования.
- •3.5.1 Скользящий нагруженный резерв
- •3.6 Скользящий ненагруженный резерв
- •4 Метод минимальных путей и минимальных сечений
- •4.1 Примерный расчет надежности методом мп & мс
- •5 Применение сложных структур резерва
- •5.1 Методы избыточного кодирования
- •5.2 Логика с переплетением
- •5.3 Мажоритарное резервирование
- •6 Надежность компьютерных сетей
- •6.1. Расчёт надёжности компьютерных систем
- •7 Надежность систем массового обслуживания
- •8. Контроль и диагностика систем
- •8.1 Основные положения
- •8.2 Контроль по модулю
- •8.3 Построение контрольных тестов
- •8.4 Системы с программным контролем
- •8.5 Встроенный оперативный контроль
- •8.5.1 Встроенный контроль счетчика
- •8.5.2 Встроенный контроль дешифратора
- •8.5.3 Показатели встроенного контроля
- •8.6 Методы диагностирования
- •8.6.1 Основные положения
- •8.6.2 Методы построения диагностических тестов
- •8.6.2.1 Квазиоптимальные тесты шеннона-фано
- •8.6.3 Метод декомпозиции диагностируемой системы
- •8.7 Системы диагностики при эксплуатации
- •8.7.1 Обнаружение отказов при эксплуатации
- •8.7.2 Диагностика периферийных устройств
- •8.7.3 Диагностика многопроцессорных систем
- •9 Надежность программного обеспечения
- •9.1 Классификация ошибок программирования
- •9.2 Способы повышения надежности по
- •9.3 Основные модели надежности по
- •9.3.1 Модель Литтлвуда - Вералла
- •9.3.2 Модель джелинского - моранды
- •9.3.3 Модель шумана
- •9.3.4 Модель шика-вольвертона
- •9.4 Прогнозирование надежности по
- •9.5 Методы структурной избыточности по
- •9.6 Избыточность операционной системы
- •9.7 Метод контрольных функций
- •9.8 Методы тестирования программ
- •9.9 Функциональные методы тестирования
- •10 Отказоустойчивые компьютерные системы
- •11 Обслуживание систем в эксплуатации
- •11.1 Элементы теории восстановления систем
- •11.2 Оптимальные правила предупредительных замен
- •11.3 Оптимальные правила проверок
- •Список литературы
8.7 Системы диагностики при эксплуатации
Современная компьютерная аппаратура обладает развитыми встроенными средствами проведения самоконтроля и технической диагностики при локализации неисправности.
Основная цель назначения этих средств - быстрейшее восстановлениесистемы за счет быстрого обнаружения отказов при достаточной глубине диагноза и быстрой замены неисправного устройства. Другой, немаловажной целью является обеспечениевысокой достоверности работыкомпьютерных систем.
Кроме этого, диагностирование служит для прогнозирования отказов элементов, теряющих свои характеристики при эксплуатации. Это достигается испытанием устройств, при пониженных или повышенных напряжениях питания вторичных источников.
Наконец, процесс восстановления отказавших устройств, обычно, производится отдельно от эксплуатируемой системы, и требует дополнительной организации автономной её проверки с глубиной диагностирования до отказавшего дискретного элемента.
8.7.1 Обнаружение отказов при эксплуатации
Обнаружение отказовсредств КТ при ее эксплуатации опирается на средства встроенного самоконтроля, проверяющих работуосновных устройств системы.
Так, например, ОЗУ по четности или другими методами группового кодирования с обнаружением и исправлением ошибок; регистры промежуточного хранения информации подвергаются контролю по четности или промежуточному тестированию; счетные устройства - контролю по mod q; временные параметры, при помощи специальных счетчиков времени; арифметические устройства с помощью схем самоконтроля.
Сигналы об отказах или ошибках (сбоях), поступающих от схем оперативного контроля, записываются вспециальные регистры состояний устройстви, в зависимости от степени приоритетности отказа, осуществляется прерывание основной программы, с принятием мер по сохранению информации счета, или повторяется циклический опрос регистров состояния процессором.
При обнаружении ошибки, производится повторный счет операций, на которых обнаружен сбой. При устойчивом отказе, программа прерывается с выставлением вектора прерывания, определяющего причину остановки с выводом сообщения на дисплей или печать. Автоматически или по указанию оператора, запускаются диагностирующие программы, монополизирующие управление системой. При обнаружении неисправности происходит остановка испытаний с выводом результатов на экран монитора.
8.7.2 Диагностика периферийных устройств
Особенности контроля ПУ состоят в наличии механических, электромеханических и электронных устройств. Сопряжение с процессором осуществляется по интерфейсному каналу. Диагностирование ПУ осуществляется центральным процессором, имитатором канала, внешней контрольно-испытательной аппаратурой (КИП) или встроенным в ПУ аппаратным контролем. Диагностические тесты строят:
-методом расширяющихся областей. При каждом новом тесте проверяется схема с некоторым приращением;
-методом последовательных проверок отдельных подсистем;
-методом пересечения областей проверок. Если два теста с различным охватом области элементов дают отрицательный результат, то предполагается, что неисправность находится в зоне пересечения;
-методом дерева тестов. Начинают полный охват, разделяя его на подозреваемые неисправные области и исправные.
Контроль периферийных устройств при помощи имитатора каналов не отличается от контроля на КИП. Это сложное автономное устройство, предусматривающее возможность выполнения определенной программы испытаний с использованием вычислительных средств или без них.
Диагностирование ПУ с помощью тестеров узкоспециализированных проверок. Тестеры проще КИП, но их область применения ограничена. Например, тестер позиционирования головок накопителя, правильности записи нулей, чтения информации.
Диагностирование ПУ при помощи встроенного контроля особо не отличается от контроля подсистем. Производится как в автономном режиме, так и в режиме с разделенным временем.