- •Содержание
- •Введение
- •1 Надёжность электронной аппаратуры
- •1.1 Основные определения стандартов надежности
- •1.2 Обеспечение надёжности электронной аппаратуры на этапах проектирования
- •1.2.1 Этап аванпроекта
- •1.2.2 Этап эскизного проектирования
- •1.2.3 Этап технического проектирования
- •1.2.4 Этап изготовления опытных комплектов
- •1.2.5 Этап эксплуатации
- •1.2.6 Контрольные вопросы и задания
- •2 Основные показатели надежности
- •2.1.1 Интенсивность отказов
- •2.1.2 Частота отказов
- •2.1.3 Среднее время наработки на отказ
- •2.1.4 Среднее время между отказами
- •2.1.5 Вероятностные показатели надежности
- •2.1.5.1 Вероятность безотказной работы
- •2.1.5.2 Экспоненциальная модель вероятности безотказной работы
- •2.1.5.3 Модель вбр Вейбулла-Гнеденко
- •2.1.5.4 Модель Пуассона
- •2.1.5.5 Вероятность отказа изделия в работе
- •2.1.6 Поток отказов
- •2.1.7 Коэффициент готовности
- •2.1.7.1 Стационарный коэффициент готовности
- •2.1.7.2 Коэффициент оперативной готовности
- •2.1.8 Погрешность оценки показателей надежности
- •2.1.8.1 Погрешность оценки показателей
- •2.2 Применение показателей надежности
- •2.3 Надёжность невосстанавливаемых систем
- •2.4 Надежность дискретных элементов
- •2.5 Пример расчёта надёжности нерезервированных схем
- •3 Надежность резервированных вычислительных систем
- •3.1 Резервирование изделий
- •3.1.1 Резервирование на уровне эвм
- •3.1.2 Резервирование на уровне устройств
- •3.1.3 Резервирование с использованием к-кодов
- •3.1.4 Резервирование в специализированных эвм
- •3.2 Представление резервированных объектов
- •3.3 Параметры НаДёжносТи при нагруженном резерве
- •3.3.1 Расчет показателя безотказной работы
- •3.3.2 Определение средней наработки на отказ
- •3.4 Параметры надёжносТи при ненагруженном резерве.
- •3.5 Надёжность при сложной структуРе резервирования.
- •3.5.1 Скользящий нагруженный резерв
- •3.6 Скользящий ненагруженный резерв
- •4 Метод минимальных путей и минимальных сечений
- •4.1 Примерный расчет надежности методом мп & мс
- •5 Применение сложных структур резерва
- •5.1 Методы избыточного кодирования
- •5.2 Логика с переплетением
- •5.3 Мажоритарное резервирование
- •6 Надежность компьютерных сетей
- •6.1. Расчёт надёжности компьютерных систем
- •7 Надежность систем массового обслуживания
- •8. Контроль и диагностика систем
- •8.1 Основные положения
- •8.2 Контроль по модулю
- •8.3 Построение контрольных тестов
- •8.4 Системы с программным контролем
- •8.5 Встроенный оперативный контроль
- •8.5.1 Встроенный контроль счетчика
- •8.5.2 Встроенный контроль дешифратора
- •8.5.3 Показатели встроенного контроля
- •8.6 Методы диагностирования
- •8.6.1 Основные положения
- •8.6.2 Методы построения диагностических тестов
- •8.6.2.1 Квазиоптимальные тесты шеннона-фано
- •8.6.3 Метод декомпозиции диагностируемой системы
- •8.7 Системы диагностики при эксплуатации
- •8.7.1 Обнаружение отказов при эксплуатации
- •8.7.2 Диагностика периферийных устройств
- •8.7.3 Диагностика многопроцессорных систем
- •9 Надежность программного обеспечения
- •9.1 Классификация ошибок программирования
- •9.2 Способы повышения надежности по
- •9.3 Основные модели надежности по
- •9.3.1 Модель Литтлвуда - Вералла
- •9.3.2 Модель джелинского - моранды
- •9.3.3 Модель шумана
- •9.3.4 Модель шика-вольвертона
- •9.4 Прогнозирование надежности по
- •9.5 Методы структурной избыточности по
- •9.6 Избыточность операционной системы
- •9.7 Метод контрольных функций
- •9.8 Методы тестирования программ
- •9.9 Функциональные методы тестирования
- •10 Отказоустойчивые компьютерные системы
- •11 Обслуживание систем в эксплуатации
- •11.1 Элементы теории восстановления систем
- •11.2 Оптимальные правила предупредительных замен
- •11.3 Оптимальные правила проверок
- •Список литературы
8.4 Системы с программным контролем
Надежность систем с контролем зависит от степени охвата контролем элементов и от достоверности контроля, которая может быть оценена через вероятность ошибок контроля. Ошибки при контроле приводят систему к ошибке первого рода - риск поставщика при браковке заведомо исправной системы, т.е. отклонение правильной гипотезы и ошибке второго рода - риск заказчика при принятии неисправной системы т.е. принятии ложной гипотезы.
Пусть F - наличие неисправности в системе;
- отсутствие неисправности;
D - контролирующее устройство дает сигнал о неисправности системы;
- сигнал о неисправности отсутствует.
Тогда имеем четыре вероятностных состояния системы (8.9)
Первое и последнее - правильная работа контроля, второе -ошибка заказчика, третье - ошибка поставщика.
Граф состояния системы с непрерывным контролем и восстановлением показан на рисунке 8.10.
Рисунок 8.10- Граф системы с непрерывным
контролем и восстановлением
Система может находиться в состояниях 00, 01, 10, 11 с вероятностями, где первый индекс показываетсостояние контрольного устройства, а второй - объекта. "0"- рабочее, "1" - отказ.
Тогда матрица интенсивностей переходов имеет вид:
где -интенсивность отказов объекта контроля;
-интенсивность отказов контролирующего устройства;
-интенсивность восстановления контроля;
-интенсивность восстановления объекта контроля
-интенсивность при отказе контролирующего устройства при работоспособном контролирующем устройстве.
При стационарном режиме переходим к алгебраическим уравнениям Колмогорова
Решая систему уравнений, получим вероятность пребываний системы в одном из четырёх состояний.
8.5 Встроенный оперативный контроль
Встроенный оперативный контроль требует дополнительных схемных решений и затрат. Однако, эффективность такого контроля высокая, особенно при совмещении с программным опросом результатов.
8.5.1 Встроенный контроль счетчика
На рисунке 8.11 приведена схема контроля счетчика, основанная на совпадении четности суммы единиц кода, записанного в счетчике, с четностью предсказанного значения этой величины.
Рисунок 8.11- Схема встроенного контроля счетчика
Предсказывая с помощью вспомогательного триггера T5 четность содержимого счетчика, и сравнивая ее с фактической четностью содержимого счетчика, можно обнаружить ошибки в его работе.
8.5.2 Встроенный контроль дешифратора
На рисунке 8.12. показана схема контроля работы дешифратора, в которой выходы дешифратора разделяют на две группы.
Рисунок 8.12- Схема контроля дешифратора
При правильной работе дешифратора, сигнал должен появиться лишь на одном выходе дешифратора. В этом случае на одном из входов сумматора mod2 появляется нуль, а на другом единица. Если сигнал дешифратора отсутствует, то на верхнем и нижнем входе будет "лог. 0" и схема вырабатывает сигнал об ошибке.
Однако, этот контроль не полный. Не обнаруживается появление двух и более сигналов в одной группе, появление одного сигнала, но не в той группе или не на том выходе.
8.5.3 Показатели встроенного контроля
Кажется, что идеальным было бы контролировать все узлы подсистем. Однако, это требувесьма большого усложнения аппаратуры, т.к. средства контроля становятся соизмеримы с проверяемой аппаратурой. В этом случае можно просто поставить вопрос о дублировании. Поэтому в вопросе о распределении средстваппаратного контроля необходимо отыскивать компромиссные решения. Нельзя забывать, что и сама аппаратура контроля подвергается отказам и чем она сложнее, тем больше интенсивность отказов.
Обычно размещение точек контроля ведется так, чтобы в первую очередь, контролировать магистрали передачи информации, основные регистры, сумматоры, счетчики, дешифраторы.
Основными показателями эффективности аппаратного контроля ВС являются:
вероятность обнаружения ошибки р;
математическое ожидание среднего времени обнаружения ошибки t. Требование, чтобы вероятность обнаружения ошибки была как можно большей, а среднее время t обнаружения ошибки - как можно меньше, всегда выдвигается в качестве основного. Однако, простое увеличение средств аппаратного контроля не ведет к увеличению эффективности. Необходима оптимизация по компромиссным вариантам на основе сравнительных расчетов. Вероятность обнаружения отказа оценивается по формуле
(8.10)
где - интенсивность отказов i-го элемента контролируемой группы,
М - множество всех элементов системы,
Мо- множество элементов системы с обнаружением отказов.
В случае, когда средства контроля, действуя независимо, друг от друга контролируют одно и то же устройство, вероятность обнаружения отказа равна
, ( 8.11)
где m - общее число средств независимого контроля,
— вероятность обнаружения отказа к-ым средством контроля.
Математическое ожидание времени обнаружения отказа любым из средств контроля
(8.12)
где
В случае, когда каждое средство контроля обнаруживает отказы толькоопределенного подмножества элементов, не пересекающегося с подмножеством элементов, контролируемых другими средствами контроля, вероятность обнаружения отказа
При этом математическое ожидание времени обнаружения равно:
Среднее время восстановления контролируемой системы:
где, А - коэффициент, определяющий время восстановления информации,
В - среднее время восстановления аппаратуры,
D-среднее время восстановления информации, когда отказ не был обнаружен и обнаруживается только при анализе результатов,
N - среднее число сбоев на один отказ аппаратуры.
Таким образом, можно сформулировать основные требования по распределению (охвату) аппаратного контроля.
Лекция № 9