
- •Тема 1.2. Основные показатели надежности невосстанавливаемых (неремонтируемых) систем
- •Тема 1.3. Основные показатели надежности восстанавливаемых (ремонтируемых) систем
- •Тема 1.4. Законы распределения, используемые при оценке надежности
- •Тема 1.5. Аналитические методы расчета надежности информационных систем. Мостиковые схемы. Комбинированные системы
- •Тема 1.6. Повышение надежности систем путем резервирования
- •Тема 1.7. Расчет надежности по статистическим данным
- •Тема 1.8. Доверительные интервалы при нормальном распределении случайной величины
- •Тема 1.9. Доверительные интервалы при экспоненциальном распределении случайной величины
- •Тема 1.10. Определение доверительных интервалов при отсутствии отказов
- •Тема 1.11. Критерии согласия. Критерий Пирсона
- •Тема 1.12. Критерий Колмогорова
- •Тема 2.1. Проблемы надежности программных комплексов
- •Тема 2.2. Модели надежности программных комплексов
- •Тема 2.3. Типы отказов и сбоев при исполнении комплекса программ
- •Тема 2.4. Основные факторы, влияющие на надежность функционирования комплекса программ
- •Тема 2.5. Обеспечение надежности и повышение качества программ
- •Тема 2.6. Тестирование и испытание программ
- •Тема 2.7. Критерии надежности программных комплексов
- •Тема 3.1. Содержание технической диагностики
- •Тема 3.2. Функциональная диагностическая модель
- •Тема 3.3. Построение таблицы неисправностей или матрицы состояний
- •Тема 3.4. Основные способы построения алгоритмов поиска неисправностей
- •Тема 4.1. Общие положения
- •Тема 4.2. Методы аппаратурного контроля
- •Тема 4.3. Программно-логические методы контроля
- •Тема 4.4. Тестовый контроль
Тема 3.4. Основные способы построения алгоритмов поиска неисправностей
При построении алгоритма способом последовательного функционального анализа предварительно определяются, исходя из назначения информационной системы, основные параметры, характеризующие исправность системы. Последовательно контролируя сигналы на выходе каждого элемента системы, можно определить неисправный элемент.
Способ последовательного функционального анализа прост, нагляден. Полученный с использованием этого способа алгоритм поиска неисправностей не оптимален ни во времени, ни по средним затратам.
Способ половинного разбиения используется при разработке алгоритмов поиска неисправностей в информационных системах с последовательно соединенными элементами.
Диагностируемая информационная система, состоящая из N последовательно включенных элементов, неработоспособна из-за отказа i-го элемента (i = 1,2,...,N). Целесообразно контролировать такой выходной сигнал, который разбивает объект диагностики пополам. Каждый последующий параметр для контроля выбирается аналогично, т. е. делят пополам образующуюся систему после выполнения предыдущей проверки, в зависимости от результатов её исхода.
Тема 4.1. Общие положения
Под контролем ИС понимают процессы, обеспечивающие обнаружение ошибок в их функционировании, вызванных отказами аппаратуры, ошибками в программах или другими причинами.
В сочетании с мерами по резервированию контроль является одним из самых эффективных средств повышения надежности и достоверности обработки информации.
Ошибки, возникающие в процессе функционирования цифровых систем, можно рассматривать как композицию следующих потоков ошибок:
ошибки проектирования;
ошибки операторов ЭВМ;
ошибки исходных данных;
ошибки в линиях связи при передаче данных;
ошибки при хранении информации на машинных носителях;
сбои в работе аппаратуры.
Ошибки проектирования. К ним относят ошибки в документации, аппаратуре или программном обеспечении, которые не были обнаружены в процессе проектирования и опытной эксплуатации системы, но проявились в процессе работы.
В математическом обеспечении ИС можно выделить следующие типы ошибок:
программные ошибки ― ошибки, порождаемые неправильным использованием команд, операторов, адресации и т. п. Их количество зависит от квалификации программистов и степени автоматизации проектирования программ;
алгоритмические ошибки возникают из-за неадекватности модели реальному процессу, неправильного выбора численного метода решения задачи.
системные ошибки являются следствием неправильного взаимодействия алгоритмов друг с другом при функционировании системы в целом.
Ошибки операторов возникают в работе системы из-за неправильных действий обслуживающего персонала, а также вследствие плохой организации технической эксплуатации. Поэтому важно правильно предусмотреть роль человека в системе, учитывая его возможности по физическим, психическим и другим видам нагрузок.
Ошибки исходных данных возникают в ИС, в которых большое количество исходной информации подготавливается вручную. Например, при обработке экономической информации наиболее характерными являются ошибки из-за неправильного заполнения исходной документации и при вводе данных с исходных документов в ЭВМ.
Ошибки в линиях связи. Линии связи, предназначенные для передачи информации, являются в настоящее время неотъемлемой компонентой большого числа ИС. Средняя вероятность ошибки q для большинства линий связи составляет 10-3–10-5.
Ошибки, порождаемые неисправностями логических и специальных элементов. Для их вычисления необходимо знать вероятности возникновения ошибок (неисправностей) в отдельных элементах. В инженерной практике, как правило, предполагают, что поток неисправностей в работе элементов является пуассоновским с параметром λ, причем значение λ состоит из двух составляющих, т. е. λ = λ0+λсб, где λ0 ― интенсивность отказов элемента, λсб ― интенсивность сбоев.
Значения λ0, λсб определяют на основании испытаний аппаратуры на надежность или с помощью статистических данных, полученных при эксплуатации. При отсутствии статистических данных по интенсивностям возникновения сбоев для приближенных расчетов можно полагать, что λсб на порядок больше, чем интенсивность отказа.
Суммарный поток рассмотренных ошибок определяет возможность соблюдения временного регламента решения задач в ИС и достоверность информации, получаемой при решении. Выдачу системой недостоверных результатов почти во всех случаях следует рассматривать как отказ в ее работе. Поэтому понятие «ошибка» в ряде случаев целесообразно рассматривать как явление искажения информации, подающееся с определенной вероятностью обнаружению и регистрации.
Для обнаружения ошибок в работе информационных систем широко используют различные методы контроля, позволяющие зафиксировать наиболее типичные ошибки. Поэтому необходимо знание причин и характеристик возникающих ошибок для правильного выбора метода контроля. Сбои, зафиксированные системой контроля, устраняют, и тем самым не допускается их распространение на выход системы. При обнаружении систематической ошибки требуется локализовать и устранить причину ошибки.
Средства контроля ИС подразделяются на:
аппаратные;
программные;
смешанные.
Они характеризуются тремя основными параметрами:
Полнотой (глубиной) контроля.
Временем обнаружения ошибки.
Сложностью.
Полнота контроля оценивается как доля отказов, обнаруживаемых в результате контроля, от общего их количества:
,
(4.1)
где Mk ― множество элементов, подлежащих контролю; M ― множество всех элементов системы; ni ― число элементов i-го типа; λi ― интенсивность отказов элементов i-го типа.
Время обнаружения ошибки (время контроля) определяется как интервал времени от момента возникновения ошибки до момента ее обнаружения.
Сложность средств контроля характеризуется массой, размерами, стоимостью, потребляемой энергией, памятью и другими параметрами аппаратных средств.
По характеру контроль в ИС подразделяется на:
оперативный контроль осуществляется в ходе решения задач и позволяет в процессе их решения немедленно обнаруживать ошибку. Однако оперативный контроль в принципе является неполным, поскольку выполняется на случайных, не приспособленных для целей контроля задачах;
тестовый контроль осуществляется в специально отведенные промежутки времени на основе решения специальных, тестовых задач. Он основан на тестах, обеспечивающих контроль всех элементов системы (аппаратуры, команд программы) за короткое время. Недостаток тестового контроля ― затраты дополнительного процессорного времени.
По способу организации различают контроль прямой, обратный и смешанный.
При прямом контроле основной вычислительный процесс О с исходными данными х и результатами у сопровождается параллельным вычислительным процессом П рис. 4.1.1 (а). В случае безошибочной работы системы результаты процессов О и П должны совпадать, что определяется устройством сравнения БС. Если результаты отличаются, то БС выдает сигнал об ошибке. Если процессы О и П осуществляются по одной и той же программе, то приведенная схема позволяет выявить только сбои и отказы аппаратуры. В случае, когда информация обрабатывается по различным, но функционально эквивалентным программам, прямой контроль позволяет, кроме того, выявлять и ошибки в программах.
Рисунок 4.1.1. Схемы организаци контроля
Недостаток прямого контроля ― большие затраты аппаратных средств. Они могут быть снижены, если параллельный процесс П будет упрощен за счет снижения точности: можно предположить, что большинство ошибок приведет к сильному отклонению результата О от правильного значения, такому, которое перекроет погрешность результата процесса П и ошибка будет обнаружена по расхождению между результатами процессов О и П.
При обратном контролерис. 4.1.1 (б) параллельный процесс П с исходным данными у и результатами х осуществляет обратное преобразование результата контролируемого процесса О. Сопоставление обратного решения с исходными данными позволяет обнаружить ошибку.
Недостаток обратного контроля, кроме ограниченности класса решаемых задач, заключается и в том, что время, необходимое на получение контролируемого решения, будет не меньше суммарного времени выполнения процессов О и П.
По объекту контроля различают контроль аппаратуры (АЛУ, функциональные преобразователи, память, управление, ввод-вывод), программного обеспечения и работы операторов.
Контрольные вопросы
Что понимается под контролем ИС?
Какие типы ошибок можно выделить в математическом обеспечении ИС?
На какие виды подразделяются средства контроля ИС?
Дайте определение понятия ошибка.
Каков недостаток прямого контроля?
Каков недостаток обратного контроля?
Каков недостаток тестового контроля?
Какие виды контроля различают в зависимости от объектов контроля?
Чем характеризуется сложность средств контроля?