- •I. ВВЕДЕНИЕ. ЦЕЛИ И ЗАДАЧИ ИЗУЧЕНИЯ ДИСЦИПЛИНЫ
- •II. СТРУКТУРА И ОБЪЕМ ДИСЦИПЛИНЫ
- •III. СОДЕРЖАНИЕ И ТЕМАТИЧЕСКИЙ ПЛАН ИЗУЧЕНИЯ ДИСЦИПЛИНЫ
- •1. ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ НАДЕЖНОСТИ
- •2. НАДЕЖНОСТЬ НЕРЕМОНТИРУЕМЫХ ОБЪЕКТОВ. НАДЕЖНОСТЬ РЕМОНТИРУЕМЫХ ОБЪЕКТОВ
- •3. НАДЕЖНОСТЬ СИСТЕМ РАЗЛИЧНЫХ СТРУКТУР
- •4. МЕТОДЫ РАСЧЕТА НАДЕЖНОСТИ СИСТЕМ РАЗЛИЧНЫХ ТИПОВ
- •5. НАДЕЖНОСТЬ ИНФОРМАЦИОННЫХ СИСТЕМ
- •6. АНАЛИЗ НАДЕЖНОСТИ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ
- •7. НАДЕЖНОСТЬ РАБОТЫ ЦИФРОВЫХ СИСТЕМ
- •8. ПРОЕКТИРОВАНИЕ СИСТЕМ С ЗАДАННОЙ ЭКСПЛУАТАЦИОННОЙ НАДЕЖНОСТЬЮ
- •IV. СОДЕРЖАНИЕ САМОСТОЯТЕЛЬНОЙ РАБОТЫ
- •4.1. Примерный перечень вопросов для подготовки к экзамену по дисциплине «Надежность ВТ и ИС»
- •5.1. Расчет показателей надежности нерезервированных невосстанавливаемых систем
- •5.2. Расчет показателей надежности резервированных невосстанавливаемых систем
- •5.3. Расчет показателей надежности нерезервированных восстанавливаемых систем
- •5.4. Расчет показателей надежности резервированных восстанавливаемых систем
- •5.5. Анализ надежности систем сложной структуры
- •БИБЛИОГРАФИЧЕСКИЙ СПИСОК
8
2. НАДЕЖНОСТЬ НЕРЕМОНТИРУЕМЫХ ОБЪЕКТОВ. НАДЕЖНОСТЬ РЕМОНТИРУЕМЫХ ОБЪЕКТОВ
Показатели надежности неремонтируемых объектов. Теоретические распределения наработки до отказа.
Показатели надежности ремонтируемых объектов, не восстанавливаемых в процессе применения. Показатели надежности ремонтируемых объектов, восстанавливаемых в процессе применения. Ремонтопригодность и готовность технических устройств. Методы испытания на надежность и статистической обработки опытных данных.
Неремонтируемые объекты работают до первого отказа. Для оценки их надежности используют вероятностные характеристики случайной величины – наработки до отказа Т. Под наработкой понимают продолжительность или объем работы объекта, измеряемые в часах, километрах, гектарах, циклах, кубометрах или в других единицах. Когда наработку выражают в единицах времени, иногда используют термин «время безотказной работы» или, что то же самое, «время до возникновения отказа».
Полной характеристикой любой случайной величины является ее закон распределения, т. е. соотношение между возможными значениями случайной величины и соответствующими этим значениям вероятностями. Распределение наработки до отказа может быть описано с помощью различных показателей надежности неремонтируемых изделий. К числу таких показателей относятся: функция надежности p(t); плотность распределения наработки до отказа f(t); интенсивность отказов λ (t).
Функцией надежности называют функцию, выражающую вероятность того, что Т – случайная наработка до отказа объектов – будет больше заданной наработки (0, t), отсчитываемой от начала эксплуатации, т. е. p(t) = р{Т ≥ t}.
Перечислим некоторые очевидные свойства p(t):
1)р(0) = 1, т. е. можно рассматривать безотказную работу лишь тех объектов, которые были работоспособны в момент включения;
2)p(t) является монотонно убывающей функцией заданной наработки t;
3)p(t) → 0 при t → +∞, т. е. любой объект со временем откажет.
f (t) = dqdt(t) = − dpdt(t) .
Показатели надежности ремонтируемых объектов вычисляются по наработке. Суммарная наработка до возникновения п-го отказа
Тп =Т(1) +Т(2) +... +Т(п) ,
где Т(i) – наработка между (i – 1)-ом и i-ым отказами.
Возможны два пути оценки надежности ремонтируемых объектов: 1) вычисление характеристик потока отказов; 2) вычисление условных распределений наработки между отказами.
В настоящее время наиболее распространено вычисление характеристик потока отказов. Рассматриваются потоки случайных событий, каждое из которых состоит в появлении отказа объекта. Поток отказов можно характеризовать основной функцией потока Ω(t) – математическим ожиданием числа отказов на интервале (0, t). Однако чаще в качестве показателя надежности используют параметр потока отказов – плотность вероятности возникновения отказа ремонтируемого объекта, определяемую для рассматриваемого момента суммарной наработки. Это определение нуждается в пояснении.
Показатели надежности ремонтируемых объектов, восстанавливаемых в процессе применения, вычисляются лишь в календарном времени.
Восстанавливаемые в процессе применения ремонтируемые объекты можно разделить на две группы.
К первой группе относятся объекты, для которых в течение заданного времени работы допускаются отказы и вызванные ими кратковременные перерывы в работе. Для объектов этой группы большое значение имеет свойство готовности – способности находиться в про-
9
цессе эксплуатации максимальное время в работоспособном и готовом к применению состоянии.
Ко второй группе относятся объекты, отказы которых в течение заданного времени недопустимы. Если в этих объектах (системах) имеются избыточные элементы, то при отказах некоторых из них объект остается работоспособным и можно проводить ремонт отказавших элементов во время выполнения задачи.
Один и тот же объект может быть отнесен к разным группам в зависимости от режима его применения.
Литература: [1], с. 4-89; [3], 241-309.
3. НАДЕЖНОСТЬ СИСТЕМ РАЗЛИЧНЫХ СТРУКТУР
Общие сведения. Надежность систем из последовательно и параллельно соединенных элементов. Надежность последовательных систем при нормальном распределении нагрузки по однотипным подсистемам. Оценка надежности систем, построенных в виде цепи. Надежность систем с резервированием.
Надежность большинства изделий в технике определяют, рассматривая их как системы. Сложные системы делятся на подсистемы.
Системы с позиций надежности могут быть последовательными, параллельными и комбинированными. Наиболее наглядным примером последовательных систем служат автоматические станочные линии без резервных цепей и накопителей. Однако понятие «последовательная система» в задачах надежности имеет более широкое значение. К таким системам относят все системы, в которых отказ элемента приводит к отказу всей системы. Например, систему подшипников механических передач с позиции теории надежности следует рассматривать как последовательную, хотя фактически подшипники каждого вала работают параллельно.
Примерами параллельных систем являются энергетические системы из электрических машин, работающих на общую сеть, многомоторные самолеты, суда с двумя машинами и резервированные системы.
Вкачестве примеров комбинированных систем можно назвать частично резервированные системы.
Многие системы состоят из элементов, отказы каждого из которых можно рассматривать как независимые. Такое рассмотрение достаточно широко применяется при наличии отказов функционирования и иногда в первом приближении при наличии параметрических отказов.
Системы могут включать в себя элементы, изменение параметров которых определяет отказ системы в совокупности или даже влияет на работоспособность других элементов. К таким системам относится большинство систем в случаях точного рассмотрения их при наличии параметрических отказов. Например, отказ прецизионных металлорежущих станков по параметрическому критерию (потере точности) определяется совокупным изменением точности отдельных элементов: шпиндельного узла, направляющих и др.
Зависимости надежности простейших последовательных систем, относящиеся к самым общим зависимостям надежности, приведены в разд. 1.
Всистеме с параллельным соединением элементов представляет интерес знание вероятности безотказной работы всей системы, т. е. всех ее элементов (или подсистем), системы без одного, без двух элементов в пределах сохранения системой работоспособности хотя бы
ссильно пониженными показателями. Например, четырехмоторный самолет может продолжать полет после отказа тух двигателей.
Сохранение работоспособности системы из одинаковых элементов определяется с помощью биномиального распределения.
Литература: [1], с. 90-111; [3], с. 310-370.
10
4. МЕТОДЫ РАСЧЕТА НАДЕЖНОСТИ СИСТЕМ РАЗЛИЧНЫХ ТИПОВ
Расчет надежности систем по последовательно-параллельным логическим схемам. Выбор значений показателей надежности элементов. Коэффициентный способ расчета. Расчет систем с неодновременно работающими элементами. Учет цикличности работы аппаратуры. Применение формулы полной вероятности при расчете надежности систем. Переход от логической схемы для расчета надежности к графу состояний системы. Логи- ко-вероятностный метод расчета надежности систем.
Анализ надежности сложных систем с учетом их реализуемости. Приближенные методы анализа надежности. Описание функционирования системы графом типа дерева. Анализ надежности восстанавливаемой системы по усеченному графу состояний. Метод эквивалентных схем. Системы с m/n нагруженным резервом и неограниченным восстановлением. Системы с автоматом контроля и коммутации. Системы с последействием отказов. Анализ надежности системы с учетом неодновременности работы ее элементов.
При методе расчета систем по последовательно-параллельным логическим схемам производят изображение в виде специальной логической схемы, характеризующей состояние (работоспособное или неработоспособное) системы в зависимости от состояний отдельных элементов. На логических схемах обычно применяют три вида соединений элементов.
Последовательное (основное) соединение соответствует случаю, когда при отказе элемента отказывает вся система; наработка до отказа системы равна наработке до отказа того элемента, у которого она оказалась минимальной:
Тс = min (Tj), j = 1, 2, ..., n,
где n – число элементов системы.
Параллельное нагруженное соединение соответствует случаю, когда система сохраняет работоспособность, пока работоспособен хотя бы один элемент из k включенных в работу; наработка до отказа системы равна максимальному из значений наработки до отказа элементов:
Tс = mах (Tj), j = 1, 2, ..., k.
Параллельное ненагруженное соединение соответствует случаю, когда при отказе элемента включается в работу очередной резервный элемент и таким путем система сохраняет работоспособность; наработка до отказа системы равна сумме наработок до отказа элементов.
После составления логической схемы рассчитывают и уточняют значения показателей надежности элементов, а затем вычисляют значение показателя надежности системы. Рассмотрим содержание каждой из этих операций.
Литература: [1], с. 136-154; [3], с. 132-240.
5. НАДЕЖНОСТЬ ИНФОРМАЦИОННЫХ СИСТЕМ
Фундаментальные понятия теории надежности информационных систем. Критерии надежности информационных систем. Методы анализа надежности информационных систем. Анализ многоканальной системы массового обслуживания с отказами. Готовность многоканальной системы массового обслуживания. Надежность систем диспетчирования. Методы расчетов моментов распределений в задачах надежности. Распределение работ по этапам в дискретных системах. Расчет надежности систем от программных ошибок на основе диверсификационного программирования. Анализ надежности многофункциональных систем. Анализ эффективности систем управления при многофазном режиме функционирования.
Понятие «надежность» в том виде, как оно было сформулировано ранее, не применимо для нетехнических объектов. Надежность функционирования нетехнической системы не является ее физическим свойством. Это лишь способность системы выполнять определенные функции. Этому понятию можно дать следующее определение: надежностью называется способность объекта выполнять свои функции в процессе эксплуатации.
11
Дадим следующее определение понятию «отказ». Отказом нетехнического объекта называется событие, после возникновения которого его показатели выходят за допустимые пределы.
Но аналогии с техническими объектами, видами отказов нетехнического объекта могут быть: внезапные, постепенные и перемежающиеся. При внезапном отказе функционирование объекта либо прекращается, либо становится малоэффективным. При постепенном отказе характеристики объекта с течением времени ухудшаются до наступления полного отказа, когда функционирование объекта становится нецелесообразным. Перемежающимся отказом называется событие, после возникновения которого функционирование объекта лишь временно становится неэффективным.
Отказы нетехнического объекта являются событиями случайными, т.к. в большинстве случаев предсказать время их возникновения практически невозможно, хотя прогнозирование отказа здесь более вероятно, чем в технических системах.
Типичными примерами информационных систем являются: информационно-поисковые системы, базы данных, диспетчерские системы, банкоматы, библиотеки, телефонные сети, справочные системы и т. д. Заявками на обслуживание в этих системах являются люди – потребители информации, обслуживающими органами – базы данных, диспетчерские пункты, библиотеки, справочники, банки данных и т. п. Все эти системы можно отнести к системам массового обслуживания (СМО).
Широкое распространение СМО требует серьезных научных исследований по оценке их эффективности, одним из показателей которой является надежность. Рассмотрим функционирование СМО с позиции ее надежности и уточним понятия «надежность» и «отказ».
Существуют два класса СМО: системы с отказами и системы с очередью. Как те, так и другие могут быть одноканальные и многоканальные с различными приоритетами обслуживания. Системы массового обслуживания с отказами наиболее часто бывают многоканальными. В этих системах очередь на обслуживание не образуется. Если все каналы заняты, то очередной заявке отказывают в обслуживании. Примерами таких систем являются: больница с ограниченным числом мест для больных, диспетчерский пункт системы управления воздушным движением, платная стоянка автомобилей, телефонный узел и т. п.
Для заявок на обслуживание наиболее важным показателем функционирования СМО является возможность обслуживающего органа принять заявку на обслуживание в любой произвольный момент времени t. Тогда отказом СМО является событие, при котором заявка не будет принята на обслуживание в момент ее поступления.
Системы массового обслуживания с очередью в обслуживании не отказывают. Можно подумать, что эти системы отказов не имеют. Однако это далеко не так. Если, например, очередь на обслуживание длинная, а заявка ограничена во времени, то последняя покинет обслуживающий орган и для нее такая СМО является ненадежной. Для СМО с очередью отказом является событие, при котором заявка покидает очередь. В данном случае отказ СМО является понятием субъективным, зависящим от мнения заявки. Для заявки наиболее важным показателем функционирования такой СМО является длительность обслуживания.
Литература: [1], с. 155-171; [3], с. 464-552.
6. АНАЛИЗ НАДЕЖНОСТИ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ
Модель работы программы с изменяющимся распределением времени до появления ошибки. Модель чередования интервалов решения задачи и интервалов контроля. Анализ эффективности программного обеспечения как системы массового обслуживания. Учет иных особенностей функционирования программного обеспечения. Оценка безотказности программ при наработке. Оценка готовности программ. Надежностные характеристики оператора.
В компьютерных системах компьютер, как часть системы, обычно выполняет функции управления и должен работать в режиме реального времени. В типовых компьютерных системах компьютер выполняет бесконечный цикл, в котором сначала считываются сигналы и
12
показания датчиков и сенсоров, затем затрачивается определенное время, чтобы вычислить или спланировать некоторый отклик или реакцию на воздействие, и в конце цикла компьютер выполняет эту реакцию. Очевидно, что структура одного периода цикла управления может быть и гораздо сложнее. Однако укрупнение различных операций обычно сводится к описанным этапам. Надежность компьютерной системы может определяться как последовательное соединение статистически независимых аппаратной и программной компонент системы. Но наиболее подходящей мерой надежности является вероятность того, что система выполняет свою миссию или справляется с функциями управления в течение заданного времени при условии взаимодействия аппаратуры и программы. Надежность такой системы определяется надежностью аппаратной и программной частей в их взаимодействии. Отказы аппаратуры происходят вследствие многих причин: износ компонентов, сбои, короткое замыкание, обрывы и т. п. Причинами отказов программного обеспечения являются:
•наличие ошибок в программе;
•использование неоптимальных и несовершенных алгоритмов, таких как эвристические, приближенные, численные;
•ограничения на функционирование в реальном времени.
Остановимся подробнее на некоторых факторах, влияющих на надежность компьютерной системы:
1.Надежность элементов аппаратуры. Компоненты аппаратной части компьютерной системы имеют самые различные механизмы отказов. Некоторые из них могут быть вызваны воздействием программной части системы. Например, чрезмерное «стрессовое» использование каких-либо компонентов аппаратуры, особенно имеющих механические элементы функционирования. Примерами этого являются: длительное и непрерывное использование принтера, интенсивные чтение и запись на жесткий диск, частое изменение режимов работы дисплея. Таким образом, можно утверждать, что во многих случаях отказы программного обеспечения и техники компьютера являются событиями зависимыми.
2.Влияние программы на надежность аппаратуры. Например, рассмотрим двухфункциональную систему. Один план управления требует, чтобы обе функции были активными для расчета реакции на входные данные, в то время как другой требует, чтобы только одна функция была бы активной. Когда программа влияет на надежность аппаратуры таким образом, мы можем говорить только об условной статистической независимости аппаратной и программной частей.
3.Отказы в программе. Если программное обеспечение не модифицируется, то интенсивность его отказов остается постоянной вследствие оставшихся в ней необнаруженных ошибок.
4.Внутренние отказы программы. Такие отказы обусловлены фундаментальными ограничениями алгоритма, используемого в программном обеспечении. Например, использование эвристик может привести к случайным отказам, даже если в программе отсутствуют ошибки.
5.Отказы, обусловленные ограничением на функционирование в реальном времени. В рассматриваемых системах среда может изменяться динамически. Поэтому если время планирования или расчета отклика слишком велико, то к моменту выполнения отклика среда может быть уже измененной так сильно, что вычисленный или спланированный отклик не будет иметь требуемого эффекта. Эти отказы часто характеризуются неспособностью системы функционировать в ограничениях на реальное время.
Следует отметить, что перечисленные факторы влияют друг на друга. Например, имеется противоречие между устранением внутренних отказов и отказов, обусловленных ограничением на функционирование в реальном времени. Использование оптимального и высокоточного алгоритма решения какой-либо задачи требует значительных затрат времени для получения решения, что может привести к нарушению ограничений, связанных с реальным временем функционирования системы. В то же время, использование рационального (но не оптимального) или приближенного эвристического алгоритма позволит преодолеть пробле-
