- •Содержание
- •Введение
- •1 Надёжность электронной аппаратуры
- •1.1 Основные определения стандартов надежности
- •1.2 Обеспечение надёжности электронной аппаратуры на этапах проектирования
- •1.2.1 Этап аванпроекта
- •1.2.2 Этап эскизного проектирования
- •1.2.3 Этап технического проектирования
- •1.2.4 Этап изготовления опытных комплектов
- •1.2.5 Этап эксплуатации
- •1.2.6 Контрольные вопросы и задания
- •2 Основные показатели надежности
- •2.1.1 Интенсивность отказов
- •2.1.2 Частота отказов
- •2.1.3 Среднее время наработки на отказ
- •2.1.4 Среднее время между отказами
- •2.1.5 Вероятностные показатели надежности
- •2.1.5.1 Вероятность безотказной работы
- •2.1.5.2 Экспоненциальная модель вероятности безотказной работы
- •2.1.5.3 Модель вбр Вейбулла-Гнеденко
- •2.1.5.4 Модель Пуассона
- •2.1.5.5 Вероятность отказа изделия в работе
- •2.1.6 Поток отказов
- •2.1.7 Коэффициент готовности
- •2.1.7.1 Стационарный коэффициент готовности
- •2.1.7.2 Коэффициент оперативной готовности
- •2.1.8 Погрешность оценки показателей надежности
- •2.1.8.1 Погрешность оценки показателей
- •2.2 Применение показателей надежности
- •2.3 Надёжность невосстанавливаемых систем
- •2.4 Надежность дискретных элементов
- •2.5 Пример расчёта надёжности нерезервированных схем
- •3 Надежность резервированных вычислительных систем
- •3.1 Резервирование изделий
- •3.1.1 Резервирование на уровне эвм
- •3.1.2 Резервирование на уровне устройств
- •3.1.3 Резервирование с использованием к-кодов
- •3.1.4 Резервирование в специализированных эвм
- •3.2 Представление резервированных объектов
- •3.3 Параметры НаДёжносТи при нагруженном резерве
- •3.3.1 Расчет показателя безотказной работы
- •3.3.2 Определение средней наработки на отказ
- •3.4 Параметры надёжносТи при ненагруженном резерве.
- •3.5 Надёжность при сложной структуРе резервирования.
- •3.5.1 Скользящий нагруженный резерв
- •3.6 Скользящий ненагруженный резерв
- •4 Метод минимальных путей и минимальных сечений
- •4.1 Примерный расчет надежности методом мп & мс
- •5 Применение сложных структур резерва
- •5.1 Методы избыточного кодирования
- •5.2 Логика с переплетением
- •5.3 Мажоритарное резервирование
- •6 Надежность компьютерных сетей
- •6.1. Расчёт надёжности компьютерных систем
- •7 Надежность систем массового обслуживания
- •8. Контроль и диагностика систем
- •8.1 Основные положения
- •8.2 Контроль по модулю
- •8.3 Построение контрольных тестов
- •8.4 Системы с программным контролем
- •8.5 Встроенный оперативный контроль
- •8.5.1 Встроенный контроль счетчика
- •8.5.2 Встроенный контроль дешифратора
- •8.5.3 Показатели встроенного контроля
- •8.6 Методы диагностирования
- •8.6.1 Основные положения
- •8.6.2 Методы построения диагностических тестов
- •8.6.2.1 Квазиоптимальные тесты шеннона-фано
- •8.6.3 Метод декомпозиции диагностируемой системы
- •8.7 Системы диагностики при эксплуатации
- •8.7.1 Обнаружение отказов при эксплуатации
- •8.7.2 Диагностика периферийных устройств
- •8.7.3 Диагностика многопроцессорных систем
- •9 Надежность программного обеспечения
- •9.1 Классификация ошибок программирования
- •9.2 Способы повышения надежности по
- •9.3 Основные модели надежности по
- •9.3.1 Модель Литтлвуда - Вералла
- •9.3.2 Модель джелинского - моранды
- •9.3.3 Модель шумана
- •9.3.4 Модель шика-вольвертона
- •9.4 Прогнозирование надежности по
- •9.5 Методы структурной избыточности по
- •9.6 Избыточность операционной системы
- •9.7 Метод контрольных функций
- •9.8 Методы тестирования программ
- •9.9 Функциональные методы тестирования
- •10 Отказоустойчивые компьютерные системы
- •11 Обслуживание систем в эксплуатации
- •11.1 Элементы теории восстановления систем
- •11.2 Оптимальные правила предупредительных замен
- •11.3 Оптимальные правила проверок
- •Список литературы
8.7.3 Диагностика многопроцессорных систем
В многопроцессорных системах диагностирование организовано с помощью централизованного ядра, которое может быть распределенным, плавающим, или жестким. Возможны комбинированные способы организации.
Под ядром понимается совокупность аппаратно-программных средств, являющихся исправными и обеспечивающих контроль и диагностику системы.
Плавающее ядро может иметь непостоянный состав.
Централизованное ядро организуется на одном проверенном компьютере.
В распределенное ядро может входить любая машина системы.
Жесткое централизованное ядро строится на базе специального обслуживающего процессора. Он предназначен только для обеспечения контроля и поддержания работоспособности основной системы, в особенности системы центрального процессора. Сервисный процессор может быть автономным, или представлять собой отдельную стойку, набранную модулями обеспечения контроля.
Один сервисный процессор обслуживает, обычно, несколько основных процессоров.
Сети с распределенным плавающим ядром используют многопроцессорные системы, где производится взаимное тестирование процессоров.
9 Надежность программного обеспечения
Надежность вычислительных систем следует рассматривать совместно с надежностью программного обеспечения как единую систему. Выполнение задач системы в одинаковой степени зависит от надежной работы аппаратных средств и надежной работы программных средств.
Надежность программного обеспечения определяется как свойство программы, которое обеспечивает выполнение заданных функций при заданных условиях ограничений и в заданной вычислительной среде.
Механизмы возникновения отказа в аппаратуре и в программном обеспечении различны.
Отказ аппаратуры обусловлен, как правило, разрушением каких-либо элементов. Отказ программного обеспечения (ПО) может наступить в следующих случаях:
-несанкционированные воздействия аппаратных средств вносят изменения в работу программы;
-неправильные действия оператора;
-некорректность программы.
При идеальных условиях нормальной работы аппаратуры, и правильных действиях оператора, первые два случая отказов можно исключить.
Отказ ПО, обусловленный несоответствием программного обеспечения, поставленным задачам, представляет наибольший интерес.
Несоответствие может возникнуть по двум причинам:
- разработчик программы нарушил спецификацию - технические требования ПО;
- составленная спецификация не отражает действительные требования задачи.
Несоответствие спецификации, допущенное разработчиком, обуславливается сложностью программных систем, где трудно выявить отдельные ошибки, они не обозримы, и могут оставаться длительное время нераскрытыми.
Несоответствие по второй причине возникает из-за многообразия факторов, влияющих на работу программы в ходе эксплуатации и определенных на момент разработки. Они выясняются постепенно в ходе управления процессом или натурным моделированием.
Кроме того, ни при проверке программы, ни в технических требованиях часто просто невозможно оговорить и проверить все ситуации, которыевозникают при работе программы. Например, если программа имеет всего 10 переменных, каждая из которых приобретает различных значений,общее число комбинаций входных воздействий будет равно 1030.
Если проверять с интенсивностью 1 мкс на проверку, то за год проверите лишь комбинаций. Поэтому, в разработанной программе могут встречаться непроверенные комбинации, и может появиться отказ даже в ходе эксплуатации.
Таким образом, программы по степени соответствия точности спецификации можно классифицировать:
-программы, функции которых полностью определяются спецификацией;
-программы, функции которых корректируются по результатам вычислений (моделирования, испытания);
-программы, действующие в постоянно изменяющейся вычислительной среде (операционные системы, управление ресурсами и др.).
Корректность программы - это соответствие ее техническим условиям (ТУ).
Поскольку спецификация технических требований не всегда соответствует фактически необходимым требованиям к программе, возможны непредсказуемые ситуации:
-отказ или уход программы с нормального цикла работы в область непредсказуемых действий;
-наоборот, некорректная программа по стечению обстоятельств работает надежно.
Характерная особенность отказов - скрытость ошибок, т.к. они проявляются только при отдельных, редких комбинациях и поэтому, обнаруживается не сразу.
Пример скрытой ошибки.Пусть вычисляется функция
у = (a*sinx) / x+b при | х | < . Пример содержит скрытую ошибку. При b=0 и х=0 -неопределенность.
Теория надежности аппаратуры частично применима к проблеме надежности программного обеспечения при учете различий:
-программное обеспечение не имеет стареющих элементов из-за износа или усталости;
-больше способов контроля и путей их организации;
-больше объектов для контроля;
-меньше стандартных элементов, чем в аппаратуре;
-количество программной документации по объему больше, чем в аппаратуре;
- внести изменение в программу относительно просто, но будет ли оно корректно - вопрос.