
- •1.Основные понятия и определения теории надежности
- •2. Классификация отказов.
- •3. Характеристики надежности при внезапных и постепенных отказах. Показатели безотказности.
- •4.Характеристики надежности при внезапных и постепенных отказах. Показатели ремонтопригодности.
- •5.Характеристики надежности при внезапных и постепенных отказах. Показатели долговечности и сохраняемости.
- •6.Факторы, влияющие на надёжность электронной аппаратуры,
- •7.Факторы, влияющие на надежность аппаратно-программного комплекса.
- •8. Профилактическое обслуживание.
- •9.Факторы, влияющие на надежность по.
- •10.Комплексные показатели надежности.
- •11. Показатели надежности сложных систем. Последовательное соединение элементов.
- •12.Показатели надежности сложных систем. Параллельное соединение элементов.
- •13. Области использования расчетов надежности.
- •14. Характеристики случайных величин и случайных событий.
- •Характеристики случайной величины
- •15. Характеристики случайных величин и случайных событий. Экспоненциальный з-н распределения.
- •16. Характеристики случайных величин и случайных событий. З-н распределения Пуассона и Вейбулла.
- •17. Определение вероятностей состояний системы с использованием диф.Ур.Колмогорова
- •18.Матричный метод определения вероятностей состояния системы.
- •19. Расчет надежности с использованием элементов мат.Логики
- •20.Классификация методов резервирования.
- •21. Расчет надежности системы с постоянным резервированием.
- •22.Расчет надежности системы с постоянным общим резервированием.
- •23.Расчет надежности системы с постоянным поэлементным резервированием.
- •24. Режим облегченного резерва.
- •25. Режим нагруженного резерва.
- •26.Режим ненагруженного резерва.
- •27. Основные количественные хар-ки надежности при поэлементном резервировании замещением.
- •28.Анализ надёжности систем при резервировании с дробной кратностью и постоянно включенным резервом.
- •29. Надежность по.
- •30. Критерии надёжности сложных комплексов программ.
- •31.Контроль и диагностика информационных систем. Общие положения.
- •33.Методы аппаратурного контроля (числовой контроль арифметических операций)
- •34. Программно-логические методы контроля (алгоритмический и логический контроль)
- •36. Тестовый контроль.
- •37.Основные задачи создания отказоустойчивых систем.
- •38. Способы и средства устранения последствий ошибок и отказов в ис
- •39. Способы восстановления отказоустойчивой ис
- •41. Надежность гис
38. Способы и средства устранения последствий ошибок и отказов в ис
два основных способа устранения последствий отказов и ошибок в
работе ИС:
-маскирование ошибочных действий;
- реконфигурация системы.
Суть первого способа состоит в том, что избыточная информация скрывает
действие ошибочной информации за счет особенностей схемных решений и организации процесса обработки данных. При этом используются средства устранения последствий ошибок – средства маскирования, которые делятся по принципу действия на следующие группы:
- корректирующие коды (коды Хэмминга, итеративные коды, AN-коды);
- логика с переплетениями;
- схемы с голосованием.
В последнем случае используется нечетное число блоков, выполняющих од-
ни и те же вычислительные операции, и большинством «голосов» определяется правильный набор выходных данных.
Реконфигурация системы заключается в изменении состава средств обработки информации или способа их взаимодействия. Реконфигурация производится после выявления отказа. Этот способ устранения последствий ошибок и отказов включает:- статическую реконфигурацию;- динамическую реконфигурацию.
Статическая реконфигурация системы осуществляется путем отключения отказавших компонентов. При этом система делится на две части: активную, участвующую в работе, и пассивную, охватывающую неработоспособные компоненты системы и отключенные в ходе реконфигурации.
Динамическая реконфигурация по принципу проведения делится на следующие виды:
- замещение (поддержка запасом);
- дублирование;
- постепенная деградация системы (снижение функциональных способностей).
39. Способы восстановления отказоустойчивой ис
Восстановление системы происходит на двух уровнях
пользуют два способа:
- автоматическое восстановление, реализуемое путем дополнительной реконфигурации системы. При этом предполагается, что в системе имеется ряд запасных блоков, благодаря которым она возвращается в работоспособное состояние. Производительность системы либо сохраняется, либо несколько снижается;
- ремонт (восстановление вручную). В этом случае отказавший блок выводится из системы, и она либо продолжает работать с меньшей производительностью, либо приостанавливается до возвращения отремонтированного блока в активную часть ИС.
Программный уровень. Здесь осуществляется восстановление информации о состоянии системы, необходимой для продолжения ее работы. В зависимости от нарушений в работе системы (от количества ошибочной информации) можно выделить следующие способы восстановления:
- повторение операции на различных уровнях (команд или микрокоманд).
Повторное выполнение некоторых операций может дать правильный результат, если связанная с ними ошибка является случайной или временной (ошибка исчезает в процессе восстановления);
- возвращение к контрольной точке. Контрольной точкой называется некоторый этап процесса обработки информации, для которого зафиксированы (в запоминающем устройстве) промежуточные результаты и информация о состоянии системы, позволяющая возобновить обработку данных. При обнаружении ошибки система возвращается к контрольной точке, предшествующей моменту возникновения отказа, и продолжает свою работу, используя данную точку в качестве исходной;
- повторное выполнение программы. При этом способе восстановления все незавершенные (до возникновения отказа) программы выполняются с самого начала. Это необходимо, когда в системе разрушено такое количество информации, что восстановление путем повторного выполнения отдельных операций или участков программ невозможно. Данный способ применяется в случаях:
а) если последствия отказа успели отразиться на большей части системы;
б) если возможно восстановление только части вычислительных процессов;
в) если продолжение работы системы при использовании других способов
восстановления сопряжено с трудностями и большими затратами времени.