
- •Дисциплина «Надежность информационных систем»
- •Основные понятия и показатели теории надежности. Показатели надежности информационных систем. Составляющие надежности ис. Понятие и классификация систем. Понятие информационной системы.
- •10. Отказ - событие, заключающееся в том, что система полностью или частично теряет свойство работоспособности.
- •Комплексные показатели надежности. Коэффициент готовности, коэффициент простоя, коэффициент сохранения эффективности, коэффициент достоверности функционирования ис.
- •Целевое назначение и классификация методов расчета надежности систем. Расчет элементарной надежности. Расчет функциональной надежности.
- •Критерии и количественные характеристики надежности. Понятие критериев надежности, характеристик надежности. Критерии надежности невосстанавливаемых изделий.
- •Критерии и количественные характеристики надежности. Понятие критериев надежности, характеристик надежности. Критерии надежности восстанавливаемых изделий.
- •Методы расчета надежности сложных систем. Методы расчета надежности устройств с основным соединением элементов и устройств с параллельным соединением элементов.
- •Понятие сбоев и отказов программно - аппаратных средств. Классификация отказов по различным признакам: характер отказов, взаимосвязь отказов, происхождение отказов, устойчивость отказов.
- •Оптимальное резервирование элементов систем. Понятие и назначение резервирования. Виды резервирования элементов. Повышение отказоустойчивости за счет использования резервирования.
- •Расчет показателей надежности при различных видах резервирования. Виды резервирования: общее и раздельное резервирование, постоянное резервирование, резервирование с замещением.
- •Испытания надежности аппаратных средств. Виды испытаний. Методы понижения трудоемкости испытаний аппаратных средств.
- •Задачи, возникающие при испытаниях на надежность.
- •Показатели качества и надежности пс. Характеристики качества пс и их субхарактеристики. Понятие функциональной пригодности и корректной работы пс.
- •Факторы, влияющие на надежность пс. Объекты уязвимости пс. Внутренние и внешние дестабилизирующие факторы.
- •Методы обеспечения надежности пс. Средства повышения надежности пс. Средства автоматизированного проектирования и тестирования пс.
- •Повышение надежности пс за счет избыточности. Виды избыточности. Избыточность ресурсов для обеспечения надежности функционирования пс. Временная, информационная и программная избыточности.
- •Обеспечение качества и надежности пс. Использование современных средств автоматизированного проектирования систем. Case-технологии.
- •Способы восстановления отказоустойчивых ис. Восстановление на программном и аппаратном уровнях.
- •Сертификация пс. Цели и задачи сертификации пс. Сертификация соответствия. Обязательная и добровольная сертификация. Режимы испытаний на соответствие сертификации.
Оптимальное резервирование элементов систем. Понятие и назначение резервирования. Виды резервирования элементов. Повышение отказоустойчивости за счет использования резервирования.
ИСХОДНЫЕ ПОЛОЖЕНИЯ. При проектировании отказоустойчивых систем стремятся не только к достижению необходимой их надежности, но и к достижению этой надежности при минимальных затратах, т.е. к нахождению оптимального решения.
В отказоустойчивых ЭВМ и ВС существует ряд параметров { }n x x x x ,..., , 2 1 = , от которых зависит надежность системы. Сюда относятся количество резервных элементов, устройств или подсистем, параметры систем контроля и диагностики, характеристики программного обеспечения и др. Часть из этих параметров являются целочисленными (например, количество резервных элементов).
Рассмотрим задачи оптимизации, связанные с определением числа резервных элементов системы с учетом ограничивающих факторов (затрат). Под затратами будем понимать массу, габариты, стоимость, потребление энергии или другие характеристики системы. Подобные задачи могут быть двух видов.
Задачи
оптимального резервирования первого
вида состоят
в определении требуемого количества
резервных элементов, обеспечивающих
максимум значения показателя надежности
системы при величине затрат, не превышающей
заданную:
где
G
-
ограничения в виде множества допустимых
значений, налагаемые на параметры x.
Задачи
второго вида состоят
в определении требуемого количества
резервных элементов, обеспечивающих
заданное значение показателя надежности
системы при минимальных затратах:
где
H
-
ограничение, налагаемое на показатель
надежности П(x).
Задачи оптимального резервирования встречаются в системах с резервированием на уровне процессоров, устройств или других подсистем. Для их решения используют методы неопределенных множителей Лагранжа, градиентный, прямого перебора и динамического программирования.
Метод Лагранжа. Данный метод дает приближенное решение задачи, так как он оперирует действительными числами, в то время как количество резервных элементов (подсистем) выражается как целое число. Округление результатов до целых чисел вызывает сдвиг экстремума в пространстве параметров, вследствие чего возникает погрешность решения.
Метод динамического программировании. В этом методе для сокращения числа вариантов при переборе вводится понятие доминирующая последовательность - подмножество вариантов, перспективных с точки зрения поиска оптимального варианта.
Расчет показателей надежности при различных видах резервирования. Виды резервирования: общее и раздельное резервирование, постоянное резервирование, резервирование с замещением.
Резервирование - эффективный метод повышения надёжности технических устройств посредством введения дополнительного числа элементов и связей по сравнению с минимально необходимым для выполнения заданных функций в данных условиях работы.
Общее резервирование - метод резервирования повышения надежности, в котором резервируется изделие в целом.
Раздельное резервирование - метод повышения надежности, при котором резервируются отдельные элементы системы.
Кратность резервирования - это отношение числа резервных изднлий к числу резервируемых изделий (m=4/2). Кратность бывает целой и дробной. В зависимости от способа включения разделяют резервирование постоянное и с замещением.
При постоянном резервировании резервные изделия подключены к основному, и нах. в работоспособном состоянии в течение всего времени работы.
При резервировании с замещением резервное изделие замещают в основном только после их отказа.
Расчет надежности объектов информационных систем с использованием элементов математической логики. Определение вероятности работоспособности объекта с использованием логических схем дизъюнкции, конъюнкции и их комбинации.
РАСЧЕТ НАДЕЖНОСТИ С ИСПОЛЬЗОВАНИЕМ ЭЛЕМЕНТОВ МАТЕМАТИЧЕСКОЙ ЛОГИКИ. Расчет надежности сложного объекта, по существу, является определением истинности сложного высказывания. Использование аппарата математического логики позволяет формализовать условия работоспособности сложных структур и получать формулы для расчета надежности.
1.
Если о системе можно утверждать, что
она работоспособна, если работоспособны
ее элементы a
и
b,
то можно сделать вывод о том, что
работоспособность системы (событие с)
и работоспособности элементов a
и
b
(событие
a
и
событие b)
связаны между собой логическим уравнением
работоспособности:
Логическое уравнение работоспособности
для данного случая может быть представлено
схемой последовательного соединения
элементов a
и
:
2.
Если о системе можно утверждать, что
она работоспособна, если работоспособны
ее элемент a
или
элемент b,
можно сделать вывод о том, что
работоспособность системы (событие c)
и работоспособности элементов a
и
b
(событие
a
и
событие b)
связаны между собой логическим уравн
работос-ти:
Этому уравнению соответствует схема
параллельного соединения элементов a
и
b.
3. Если работоспособное состояние элемента обозначить через a , то неработоспособное состояние этого элемента будет a . Логич-ое отрицание может быть отражено в виде сх инвертора
4. Логические операции конъюнкции, дизъюнкции и отрицания - основные операции, используемые в теории надежности, так как к ним могут быть сведены все другие логические операции.
5. Сложную логическую функцию можно минимизировать, т.е. преобразовать таким образом, что она будет содержать минимальное число членов.
6. Логические функции можно преобразовать в алгебраические функции, если заменить все логические операции арифметическими по следующим правилам:
Логическая
функция работоспособности . F
,
у которой все логические операции
заменены арифметическими, называется
функцией работоспособности, представленной
в арифметическом виде
Последовательность расчета надежности с использованием логических схем. Чтобы получить формулу для вероятности работоспособного состояния сложного объекта (функцию надежности), необходимо:
сформулировать словесно условие работоспособности системы;
на основании словесной формулировки записать логич функцию работоспособности .
;
минимизировать (исключить повторяющиеся члены);
в логической функции работоспособности заменить логические операции арифметическими, т.е. получить функцию Fа ;
5. в арифметической функции работоспособности заменить простые события (простые высказывания) их вероятностями;
в полученную формулу, дающую связь между вероятностями состояний элементов системы и вероятностью состояния системы, подставить числовые значения вероятностей состояний элементов. Решением полученного уравнения является численное значение вероятности работоспособного состояния сложной системы.
Контроль и диагностика ИС. Виды контроля. Характеристики средств контроля. Классификация контроля по способам организации.
Под контролем ИС понимают процессы, обеспечивающие обнаружение ошибок в их функц-нии, вызванных отказами аппаратуры, ошибками в программах или другими причинами.
В сочетании с мерами по резервированию контроль является одним из самых эффективных средств повышения надежности и достоверности обработки информации. Ошибки, возникающие в процессе функционирования цифровых систем, можно рассматривать как композицию следующих потоков ошибок: проектирования, операторов ЭВМ, исходных данных, в линиях связи при передаче данных, при хранении информации на машинных носителях, сбоев в работе аппаратуры.
Для обнаружения ошибок в работе информационных систем широко используют различные методы контроля, позволяющие зафиксировать наиболее типичные ошибки. Поэтому необходимо знание причин и характеристик возникающих ошибок для правильного выбора метода контроля. Сбои, зафиксированные системой контроля, устраняют, и тем самым не допускается их распространение на выход системы. При обнаружении систематической ошибки требуется локализовать и устранить причину ошибки.
Средства контроля ИС подразделяются на аппаратные, программные и смешанные. Они характеризуются тремя основными параметрами: полнотой (глубиной) контроля, временем обнаружения ошибки и сложностью.
а)
Полнота контроля оценивается
как доля отказов, обнаруживаемых в
результате контроля, от общего их
количества:
/
где
K
M -
множество элементов, подлежащих контролю;
M
-
множество всех элементов системы; i
n -
число элементов i-го
типа;
i
.
- интенсивность отказов элементов i-го
типа.
б) Время обнаружения ошибки (время контроля) определяется как интервал времени от момента возникновения ошибки до момента ее обнаружения.
в) Сложность средств контроля характеризуется массой, размерами, стоимостью, потребляемой энергией, памятью и другими параметрами аппаратных средств.
По характеру контроль в ИС подразделяется на оперативный и тестовый.
Оперативный контроль осуществляется в ходе решения задач и позволяет в процессе их решения немедленно обнаруживать ошибку. Однако оперативный контроль в принципе является неполным, поскольку выполняется на случ-ых, не приспособленных для целей контроля задачах.
Тестовый контроль осуществляется в специально отведенные промежутки времени на основе решения специальных, тестовых задач. Он основан на тестах, обеспечивающих контроль всех элементов системы (аппаратуры, команд программы) за короткое время. Недостаток тестового контроля - затраты дополнительного процессорного времени.
По способу организации различают контроль прямой, обратный и смешанный. При прямом контроле основной вычислительный процесс О с исходными данными х и результатами у сопровождается параллельным вычислительным процессом П (рис. а). В случае безошибочной работы системы рез-ты процессов О и П д-ны совпадать, что опр-ся устройством сравнения БС.
Если результаты отличаются, то БС выдает сигнал об ошибке. Если процессы О и П осуществляются по одной и той же программе, то приведенная схема позволяет выявить только сбои и отказы аппаратуры. В случае, когда информация обрабатывается по различным, но функционально эквивалентным программам, прямой контроль позволяет, кроме того, выявлять и ошибки в программах.
Недостаток прямого контроля - большие затраты аппаратных средств. Они могут быть снижены, если параллельный процесс П будет упрощен за счет снижения точности: можно предположить, что большинство ошибок приведет к сильному отклонению результата О от правильного значения, такому, которое перекроет погрешность результата процесса П и ошибка будет обнаружена по расхождению между результатами процессов О и П.
При обратном контроле (рис. б) параллельный процесс П с исходным данными у и результатами х осуществляет обратное преобразование результата контролируемого процесса О. Сопоставление обратного решения с исходными данными позволяет обнаружить ошибку.
Н
едостаток
обратного контроля, кроме ограниченности
класса решаемых задач, заключается и
в том, что время, необходимое на получение
контролируемого решения, будет не меньше
суммарного времени выполнения процессов
О
и
П.
По объекту контроля различают контроль аппаратуры (АЛУ, функциональные преобразователи, память, управление, ввод-вывод), программного обеспечения и работы операторов.