
- •Причины отказов по.
- •Определение различных видов ошибок (манипулирование, повреждение данных итд)
- •Отказы, ошибки итд.
- •Резервирование – это внедрение доп. Элементов и связей. Общее, поэлементное резервирование,
- •Мажоритарное и скользящее резервирование.
- •Постоянное включение и включение с замещением.
- •Облегчённый резерв.
- •Когда поэлементное резервирование эффективнее общего? когда при отказе при поэлем. Резервировании не происходит отказ всей системы. Обеспечение надёжности аппаратных средств и по.
- •Факторы, определяющие надёжность по.
- •Что такое структурное программирование
- •Принцип модульности, детерминированный контроль.
- •Нисходящий и восходящий принципы тестирования..
- •Эффективность использования различных методов.
- •Когда резервирование эффективнее по отн. К tвосст.
- •К чему приводит уменьшение λ, tвосст., коэф. Вынужденного простоя, увеличение коэф. Готовности?
- •Теория восстановления.
- •Теория из лаб 1-3: планирование эксперимента, критерии согласия, пфэ, дфэ, Основной контраст и Генерирующее соотношение. Критерии Фишера, коэффициент Стьюдента.
- •Испытания информационных систем.
- •Риск заказчика, риск поставщика.
- •Диагностирование и цель диагностирования.
- •Человек-оператор.
- •Что характеризует систему «человек-машина»?
- •Типы операторов – наблюдатели, исследователи, технологи, диспетчеры. Знать их роли.
- •Преимущество человека перед автоматикой и автоматики перед человеком. Обратить внимание чтобы был полный ответ.
- •Роль интерфейса.
- •Надёжность человека-оператора.
Облегчённый резерв.
Облегченный резерв характеризуется тем, что условия работы резервных элементов облегчены до момента их включения, в силу чего их ресурс расходуется только частично. Уровень нагружен-ности резервных элементов определяется всякий раз из условий решения конкретной технической задачи
Когда поэлементное резервирование эффективнее общего? когда при отказе при поэлем. Резервировании не происходит отказ всей системы. Обеспечение надёжности аппаратных средств и по.
Общие принципы обеспечения надежности ИС при проектировании. К таким принципам следует отнести:
- выбор надежной элементной базы;
- технологичность изделия;
- уменьшение нагрузок и дестабилизирующих факторов при эксплуатации;
- выбор надежных схемно-конструктивных решений.
Выбор надежной элементной базы. Особо важное место в проблеме обеспечения надежности ИС занимают вопросы правильного выбора элементной базы, обоснования оптимальных требований к ее надежности.
Выбор надежных схемно-конструктивных решений. Постоянное увеличение сложности проектируемых ИС при сохранении и даже повышении предельно жестких требований к их надежности не позволяет обеспечить высокую надежность только за счет правильного выбора надежной элементной базы. Дальнейшее повышение надежности обеспечивается на этапе схемно-технического проектирования и конструирования. Основными факторами обеспечения надежности на этом этапе являются: выбор надежных схемно-конструктивных решений; введение различных видов избыточности; обеспечение определенных запасов работоспособности. Необходимость учета оставшихся направлений повышения надежности, а именно технологичность изделия и уменьшение нагрузок и дестабилизирующих факторов при эксплуатации, были рассмотрены ранее. Кроме этого, с более подробным изложением этих вопросов необходимо изучить по [1] (можно ознакомиться в [8]).
Особенности обеспечения надежности цифровой аппаратуры. При обеспечении надежности цифровой аппаратуры необходимо учитывать ряд особенностей этого класса ИС. К ним, прежде всего, относят: дискретный характер работы всех элементов; наличие двух видов неисправностей; использование программного управления. Дискретный характер работы цифровой аппаратуры определяется дискретностью входных, внутренних и выходных сигналов. Для цифровой аппаратуры и ЭВМ характерны два вида неисправностей – отказы и сбои. Последствием сбоя является искажение информации или нарушение вычислительного процесса, которое в конечном счете приводят к нарушению правильного функционирования цифрового устройства или вычислительной машины в целом, что эквивалентно отказу.
Принципы устранения и парирования сбоев.
К общим принципам устранения сбоев в цифровой аппаратуре можно отнести:
- конструктивные методы;
- методы парирования сбоев (маскирования сбоев и выявления и исключения последствий сбоев).
Для случая, когда рабочая точка устройства находится далеко от границы области работоспособности, поток сбоев близок к простейшему, а вероятность их появления описывается экспоненциальным законом [7]. В этом случае вероятность отсутствия сбоя в логическом элементе за время t определяется как
,
где λсб – интенсивность сбоя логического элемента.
Если устройство состоит из N логических элементов и возникновение сбоя в каждом логическом элементе является событием независимым, то вероятность бессбойной работы устройства за время t будет
,
где
– интенсивность сбоя устройства.
Если рабочая точка находится вблизи границ области работоспособности устройства, то поток сбоев такого устройства уже не является простейшим. Вероятность появления сбоя в этом случае может быть описана законом Паскаля:
где
– среднее значение интенсивности
сбоя устройства.
Надежность нерезервированной цифровой аппаратуры с учетом отказов и сбоев в предположении, что поток сбоев является простейшим, а само появление сбоя эквивалентно отказу аппаратуры, может быть определена как
(6)
где Λотк – среднее значение интенсивности отказов устройства.
Оценка надежности с учетом сбоев в соответствии с (6) является приближенной, так как не учитывает структуру цифровой аппаратуры и возможные входные наборы. Это объясняется тем, что воздействие сбоя продолжается очень короткий промежуток времени, который обычно сравним с длительностью такта машины, и может оказаться, что при данных входных наборах и конкретной структуре построения устройства сбои в отдельных элементах не окажут влияния на выходной результат. Поэтому для более точных оценок надежности необходимо учитывать фильтрующие в отношении сбоев свойства конкретной структуры цифрового устройства и системы или использовать оценку Λсб, полученную экспериментально для цифрового устройства в целом в процессе реальной эксплуатации.
Конструктивными методами решения проблемы устранения сбоев являются:
- применение серий логических элементов, обладающих повышенной помехоустойчивостью;
- применение тщательной экранировки устройств, чувствительных к помехам;
- специальная компоновка и соблюдение правил монтажа слаботочных и сильноточных цепей устройств;
- установка развязывающих и подавляющих фильтров по цепям питания;
- использование гальванических развязанных цепей с симметричными входами и выходами;
- использование линий связи, нечувствительных к внешним наводкам.
Наряду с техническими методами, направленными на снижение интенсивности сбоев в цифровой аппаратуре, важное значение имеют методы проектирования цифровой аппаратуры и систем, нечувствительных к сбоям, т. е. такой аппаратуры, которая способна автоматически парировать последствия возникающих в ней сбоев. К таким методам относят методы проектирования аппаратуры с введением специальных видов избыточности и контроля.
По характеру парирования сбоев все методы можно разделить на две группы [8]:
1) методы маскирования сбоев;
2) методы выявления и исключения последствий сбоев.
Методы маскирования сбоев обеспечивают автоматическое исключение последствий сбоев без прерывания процесса функционирования системы. Таким свойством обладают избыточные структуры, построенные по принципу мажоритарного резервирования или учетверенной логики.
Методы выявления и исключения последствий сбоев предполагают разработку структуры и алгоритмов функционирования избыточной системы таким образом, чтобы обеспечивались контроль работоспособности устройств системы, оперативное выявление факта сбоя и последующая нейтрализация его последствий с помощью дополнительных аппаратурных или программных средств.
По принципу используемых средств контроль бывает аппаратным и программным [8].
Аппаратный контроль осуществляют с помощью специальной контрольной аппаратуры, вводимой в структуру цифровой аппаратуры или ЭВМ. Аппаратный контроль позволяет в отличие от программных видов контроля определить место отказа или сбоя именно в момент его возникновения, что важно с точки зрения возможности оперативного устранения последствий отказа или сбоя.
Контроль по модулю применяется наиболее широко. Эффективность данного метода растет с увеличением количества модулей в аппаратуре, однако при этом возрастает количество дополнительного контрольного оборудования, что существенным образом сказывается на надежности аппаратуры контроля, а значит, и на надежности системы в целом. Так, для организации контроля трех модулей процессора требуется ~15 % дополнительного оборудования, пяти модулей – в 2 раза больше, семи модулей – в 3,5 раза больше. Контроль по модулю обнаруживает как сбои, так и отказы.
Кодовый контроль. Его эффективность определяется информационной избыточностью, т. е. дополнительными разрядами двоичной информации, которые вводятся в исходную информацию с целью обнаружения и/или исправления ошибок. Затраты дополнительного оборудования примерно соответствуют рассмотренному методу контроля по модулю.
Однако при использовании кодового контроля невозможно осуществить сквозной оперативный контроль всей ЭВМ из-за того, что информационная избыточность может быть использована не во всех устройствах ЭВМ.
Кроме того, с ростом глубины контроля усложняется схема контроля и увеличивается дополнительное оборудование. Наиболее распространенным методом использования указанного вида контроля являются цепи и устройства передачи информации.
Аппаратный контроль из двух или трех однотипных ЭВМ применяют как при решении вычислительных задач, так и при использовании ЭВМ в автоматизированных системах управления.
Сравнение информации в таких системах может осуществляться на различных уровнях: канал, блок, устройство и т. д. Выбранный уровень сравнения определяет глубину контроля и соответственно степень локализации места отказа или сбоя. Ограничением при выборе уровня сравнения является наличие регистров в данном устройстве. Основные недостатки аппаратного контроля данного вида: большое количество дополнительного оборудования (одна или две ЭВМ); ограниченная глубина контроля; недостаточно эффективное использование избыточного оборудования.
Программный контроль включает в себя программно-логический и тестовый контроль [8].
Программно-логический контроль базируется на использовании программной и временной избыточности, позволяющей путем повторения операций переработки или пересылки информации и последующего их сравнения обнаруживать наличие сбоя в контролируемом устройстве.
Тестовый контроль осуществляют с помощью специально подготовленных и заложенных в программное обеспечение тестовых программ. Для его использования также требуется временная избыточность. Введение контроля в цифровую аппаратуру сопровождается обязательной платой. Это может быть увеличение дополнительного оборудования и/или увеличение непроизводительных затрат машинного времени.