
- •71.Фундаментальные понятия теории надежности информационных систем
- •68. Надежность ивс
- •Показатели долговечности
- •67. Теория надежности как наука и научная дисциплина
- •69. Критерии надежности невосстанавливаемых систем
- •73. Обеспечение надежности функционирования ивс
- •70. Критерии надежности восстанавливаемых систем
- •75. Способы создания абсолютно надежных систем
- •72. Критерии надежности информационных систем
Любая
наука развивается, исходя из основных
понятий и определений. Такими
понятиями в теории надежности являются
"надежность" и "отказ".
Надежностью
называется
физическое свойство технического
устройства сохранять
свои
характеристики в процессе эксплуатации.
Это определение является
объективным фундаментальным понятием.
Оно не вызывает возражений
и каких-либо уточнений, если речь идет
о надежности техники.
Отказом
называется
событие, после возникновения которого,
характеристики
технического
устройства выходят за допустимые
пределы. Это понятие является
субъективным, т. к. допустимые пределы
зависят от нашего сознания и
в
большинстве
случаев не могут быть установлены
объективно.
В
классической теории надежности
нетехнические системы, например
информационные,
не
рассматривались. Более того, считалось,
что понятие надежность
к таким системам, как производство,
диспетчерский пункт, экономическое
предприятие и т. п., не применимо.
Функционирование этих объектов
с позиции теории надежности должно
было оцениваться показателями их
эффективности.
Указанное ограничение в теории надежности
необходимо снять.
Теория надежности должна развиваться
не только вглубь, но и вширь. Ее понятия
и методы полезно использовать для
оценки функционирования только
технических объектов.
Понятие
"надежность" в том виде, как оно
было сформулировано ранее, не применимо
для нетехнических объектов. Надежность
функционирования нетехнической
системы не является ее физическим
свойством. Это лишь способность
системы выполнять определенные функции.
Этому понятию можно дать следующее
определение: надежностью
называется
способность объекта выполнять
свои функции в процессе эксплуатации.
Дадим
следующее
определение понятию "отказ".
Отказом нетехнического объекта
называется событие, после возникновения
которого, его показатели
выходят
за допустимые пределы.
По аналогии с
техническими объектами, видами отказов
нетехнического объекта могут быть:
внезапные, постепенные и перемежающиеся.
При внезапном
отказе
функционирование объекта либо
прекращается, либо становится
малоэффективным.
При постепенном отказе характеристики
объекта с течением времени
ухудшаются до наступления полного
отказа, когда функционирование
объекта становится нецелесообразным.
Перемежающимся отказом называется
событие, после возникновения которого
функционирование объекта лишь
временно становится неэффективным.
Отказы
нетехнического объекта являются
событиями случайными, т. к. в большинстве
случаев предсказать время их возникновения
практически невозможно,
хотя прогнозирование отказа здесь
более вероятно, чем в технических
системах.
Типичными
примерами информационных систем
являются: информационно-поисковые
системы, базы данных, диспетчерские
системы, банкоматы, библиотеки,
телефонные сети, справочные системы и
т. д. Заявками на обслуживание
в этих системах являются люди —
потребители информации, обслуживающими
органами— базы данных, диспетчерские
пункты, библиотеки, справочники,
банки данных и т. п. Все эти системы
можно отнести к системам
массового обслуживания (СМО).
Широкое
распространение СМО требует серьезных
научных исследований по
оценке их эффективности, одним из
показателей которой является надежность.
Рассмотрим функционирование СМО с
позиции ее надежности и уточним
понятия "надежность" и "отказ".
Существуют
два класса СМО: системы с отказами и
системы с очередью. Как те,
так и другие могут быть одноканальные
и многоканальные с различными приоритетами
обслуживания. Системы массового
обслуживания с отказами наиболее
часто бывают многоканальными. В этих
системах очередь на обслуживание
не образуется. Если все каналы заняты,
то очередной заявке отказывают
в обслуживании. Примерами таких систем
являются: больница с ограниченным
числом мест для больных, диспетчерский
пункт системы управления
воздушным движением, платная стоянка
автомобилей, телефонный
узел и т. п.
Для
заявок на обслуживание наиболее важным
показателем функционирования СМО
является возможность обслуживающего
органа принять заявку на обслуживание
в любой произвольный момент времени
t.
Тогда отказом СМО
является событие, при котором заявка
не будет принята на обслуживание
в момент ее поступления.
Системы
массового обслуживания с очередью в
обслуживании не отказывают. Можно
подумать, что эти системы отказов не
имеют. Однако это далеко не
так. Если, например, очередь на обслуживание
длинная, а заявка ограничена
во времени, то последняя покинет
обслуживающий орган и для нее такая
СМО является ненадежной. Для СМО с
очередью отказом является событие,
при котором заявка покидает очередь.
В данном случае отказ СМО является
понятием субъективным, зависящим от
мнения заявки. Для заявки наиболее
важным показателем функционирования
такой СМО является длительность
обслуживания.
Надежность
—
важнейшая характеристика качества
любой системы, поэтому разработана
специальная теория — теория надежности.
Теория
надежности может
быть определена как научная дисциплина,
изучающая закономерности, которых
следует придерживаться при разработке
и эксплуатации систем для обеспечения
оптимального уровня их надежности с
минимальными затратами ресурсов.
Надежность —
характеристика временная, она может
быть ориентирована либо в прошлое, либо
в будущее время и не допускает «точечных»
во времени оценок. Иными словами,
надежность — это свойство системы
«штатно» функционировать во времени.
Надежность
—
комплексное свойство системы, оно
включает в себя более простые
свойства, такие как безотказность,
ремонтопригодность, долговечность и
т. д.
Безотказность —
свойство системы сохранять работоспособное
состояние в течение некоторого
времени или наработки (наработка —
продолжительность или объем работы
системы).
Ремонтопригодность
—
свойство системы, заключающееся в
приспособленности к предупреждению и
обнаружению причин возникновения
отказов, повреждений и поддержанию
и восстановлению работоспособного
состояния путем проведения технического
обслуживания и ремонтов.
Долговечность
—
свойство системы сохранять при
установленной системе технического
обслуживания и ремонта работоспособное
состояние до наступления предельного
состояния, то есть такого момента, когда
дальнейшее использование системы по
назначению недопустимо или нецелесообразно.
Одним из основных
понятий теории надежности является
отказ. Отказом называют полную или
частичную потерю работоспособности
системы или ее элемента. Отказы
бывают: внезапные и постепенные;
зависимые и независимые; полные и
частичные; устойчивые и самоустраняющиеся;
аппаратные, эргатические (связанные с
персоналом) и программные и т. п. [26].
Устойчивый
отказ обусловливает
длительную неработоспособность системы
и устраняется только в результате ее
технического обслуживания, то есть
выполнения специальных мер, принятых
для восстановления работоспособности
системы. Самоустраняющийся отказ
(обычно его называют сбоем)
—
отказ, имеющий кратковременный характер
и самоустраняющийся произвольно, без
принятия специальных мер для его
устранения. Ряд сбоев одного и того же
характера, следующих друг за другом,
называют перемежающимся отказом.
Аппаратный отказ
обусловлен нарушением работоспособности
технического элемента системы,
соответственно, эргатический —
эргатического и программный —
программного элементов системы. В
соответствии с приведенной классификацией
отказов можно рассматривать и надежность
трех видов:
аппаратную;
эргатическую;
программную.
В
многофункциональных системах часто
вводят понятие функциональной
надежности выполнения
локальной функции системы. Это понятие
важно тогда, когда разные функции
системы различны по значимости,
обеспечиваются различными подсистемами
и дифференцируются по предъявляемым
к ним требованиям.
Все системы в
теории надежности классифицируются
по ряду признаков. Важными
классификационными группами являются:
восстанавливаемые;
невосстанавливаемые;
обслуживаемые;
необслуживаемые
системы.
Восстанавливаемой
называется
такая система, работоспособность
которой в случае возникновения
отказа подлежит восстановлению.
Невосстанавливаемая
система
— такая система, работоспособность
которой в случае отказа восстановлению
не подлежит.
Обслуживаемая
система
— система, для которой предусматривается
проведение регулярного технического
обслуживания. Необслуживаемая
система
— система, для которой не предусматривается
проведение регулярного технического
обслуживания.
Информационные и
вычислительные системы первых поколений,
за редким исключением, относятся к
восстанавливаемым обслуживаемым
системам. Многие современные вычислительные
системы относятся к необслуживаемым
восстанавливаемым системам (например,
персональные компьютеры) и даже к
необслуживаемым и невосстанавливаемым
системам (отдельные узлы вычислительных
систем, например микропроцессор).
Основные
показатели надежности
Показатель
надежности —
это количественная
характеристика одного
или нескольких свойств, определяющих
надежность системы. В основе большинства
показателей надежности лежат оценки
наработки системы, то есть продолжительности
или объема работы, выполненной системой.
Показатель надежности, относящийся к
одному из свойств надежности, называется
единичным.
Комплексный
показатель надежности характеризует
несколько свойств, определяющих
надежность системы.
Далее приводятся
наименования основных показателей
надежности систем и их определения в
соответствии с ГОСТ 27.002-80 «Надежность
в технике. Термины и определения».
Единичные
показатели надежности
К
единичным показателям надежности в
соответствии с ГОСТ 27.002-80 относятся
показатели безотказности,
ремонтопригодности и
долговечности.
Показатели
безотказности
Вероятность
безотказной работы —
вероятность того, что в пределах
заданной наработки отказ системы
не возникнет.
Вероятность
отказа — обратная
величина, вероятность того, что в
пределах заданной наработки отказ
системы возникнет.
Средняя
наработка до отказа — математическое
ожидание наработки системы до
первого отказа (существенно для
невосстанавливаемых систем).
Средняя
наработка на отказ (T0,
MTBF
— Main
Time
Between
Failures)
— отношение наработки восстанавливаемой
системы к математическому ожиданию
числа ее отказов в пределах этой
наработки (имеет смысл только
для
восстанавливаемых систем).
Интенсивность
отказов — условная
плотность вероятности возникновения
отказа невосстанавливаемой системы,
определяемая для рассматриваемого
момента времени при условии, что до
этого момента отказ не возник.
Параметр
потока отказов (λ(t))
-
отношение среднего числа отказов для
восстанавливаемой системы за произвольно
малую ее наработку к значению этой
наработки.
Показатели
ремонтопригодности
Вероятность
восстановления работоспособного
состояния — вероятность того, что
время восстановления работоспособного
состояния не превысит заданного.
Среднее
время восстановления работоспособного
состояния, Тв
— математическое
ожидание времени восстановления
работоспособного состояния системы.
1)Средний
ресурс —
математическое ожидание наработки
системы от начала ее эксплуатации или
ее возобновления после ремонта до
перехода в предельное состояние.
2)Срок
службы (Tс.с)
— календарная продолжительность от
начала эксплуатации системы или ее
возобновления после ремонта до перехода
в предельное состояние.
Комплексные
показатели надежности
1)Коэффициент
готовности (Кr)
— вероятность
того, что система окажется в работоспособном
состоянии в произвольный момент времени,
кроме планируемых периодов, в течение
которых применение системы по
назначению
не предусматривается
где
Tо
— среднее время наработки на отказ,
Tв
— среднее время восстановления.
2)Коэффициент
оперативной готовности — вероятность
того, что система окажется в
работоспособном состоянии в произвольный
момент времени, кроме планируемых
периодов, в течение которых применение
системы по назначению не
предусматривается, и начиная с этого
момента будет работать безотказно
в течение заданного времени.
3)Коэффициент
технического использования —
отношение математического ожидания
интервалов времени пребывания системы
в работоспособном состоянии за
некоторый период эксплуатации к сумме
математических ожиданий интервалов
времени пребывания системы в
работоспособном состоянии, простоев,
обусловленных техническим обслуживанием,
и ремонтов за тот же период эксплуатации:
где
Tи
— время простоя системы, обусловленное
выполнением планового технического
обслуживания и ремонта (время
профилактики), пересчитанное на один
отказ.
4)Коэффициент
сохранения эффективности —
отношение значения показателя
эффективности за определенную
продолжительность эксплуатации к
номинальному значению этого
показателя, вычисленному при условии,
что отказы в системе в течение того же
периода эксплуатации не возникают.
Коэффициент
сохранения эффективности характеризует
степень влияния отказов в системе
на эффективность ее применения по
назначению. Из ранее приведенного
определения теории надежности следует,
что коэффициент сохранения эффективности
может служить интегральным критерием
оптимизации надежности системы.
Действительно, критерий оптимизации
— это показатель, для которого
указана желаемая его величина или
желаемое направление его изменения.
Направление изменения коэффициента
сохранения правильно выбранного
показателя эффективности определяет
основные ориентиры при поиске свойств
системы, которые обеспечивают ее
оптимальную надежность.
Для
пользователей информационно-вычислительных
систем понятие их надежности ощущается
в наибольшей степени по коэффициенту
готовности системы Кr
то
есть по отношению времени работоспособного
состояния системы к времени ее
незапланированного простоя. Для
типичного современного сервера Кr
=
0,99, что означает примерно 3,5 суток
простоя в год. За рубежом часто
используется классификация систем
по уровню надежности, показанная в
табл. 28.1.
Таблица
28.1. Классификация
систем по уровню надежности
Коэффициент
готовности
Максимальное
время простоя
в год
Тип системы
0,99
3,5
сут
Обычная
(Conventional)
0,999
8,5 ч
Высокой
надежности (High
availability)
0,9999
1 ч
Отказоустойчивая
(Fault
resilient)
0,99999
5
мин
Безотказная
(Fault
tolerant)
Теория надежности
– наука, изучающая закономерности
отказов технических систем. Основными
объектами ее изучения являются:
- критерии надежности
технических систем различного
назначения;
- методы анализа
надежности в процессе проектирования
и эксплуатации технических систем;
- методы синтеза
технических систем;
- пути обеспечения
и повышения надежности техники;
- научные методы
эксплуатации техники, обеспечивающие
ее высокую надежность
Особенности этой
дисциплины таковы:
- теория надежности
– общетехническая дисциплина;
- математическое
моделирование – основа изучения
дисциплины;
- комплексный
характер;
- высокая значимость
и глубокая связь с другими техническими
предметами;
- трудность
моделирования и изучения процессов,
протекающих в сложных технических
системах (в смысле их надежности).
Рассмотрим более
подробно эти особенности.
Процессы, протекающие
в сложных технических системах, в смысле
их надежности, закономерны и не зависят
от вида техники. Это дает возможность
их изучения общими для любых технических
средств методами. Разработанные
в
теории надежности методы анализа,
синтеза, способы повышения надежности
и
научные методы эксплуатации техники
являются общими для любых технических
систем. Этим определяется общетехнический
характер теории надежности и ее
научность. Особенности отдельных видов
техники изучаются в специальных
технических дисциплинах, в которых на
основании общей теории решаются
конкретные задачи надежности.
Математическое
моделирование является основой изучения
функционирования
сложных
систем в смысле их надежности. При этом
у исследователя
возникают
значительные трудности в связи со
следующими особенностями решаемых
задач:
- случайный характер
явлений;
-
многокритериальность;
- высокая размерность
уравнений;
- многовариантность;
- необходимость
обеспечения высокой точности.
Эти особенности
требуют применения в процессе
моделирования объемного математического
аппарата: теории вероятностей и
математической статистики, решения
алгебраических, дифференциальных,
интегральных уравнений, теории графов,
интегральных преобразований,
вычислительной математики,
методов оптимизации,
статистического моделирования и др.
Надежность является важнейшим параметром
любой технической системы. Она во многом
определяет такие характеристики
системы, как качество, эффективность,
безопасность, живучесть, риск, которые
изучаются в специальных предметах.
Глубокая связь с этими предметами —
еще одна особенность теории надежности
как науки.
Теория
надежности— дисциплина комплексная.
В ее разделы входят предметы,
которые
могут быть самостоятельными дисциплинами.
К ним относятся:
- математическая
теория надежности;
- физическая теория
надежности ("физика отказов"):
- прогнозирование;
- диагностика;
- теория контроля:
- теория восстановления
(управление запасами).
Надежность техники
зависит от многих факторов; критерии
и показатели
надежности
устанавливаются в зависимости от вида
техники и ее применения;
обеспечение
надежности в процессе эксплуатации
определяется дисциплиной обслуживания,
квалификацией обслуживающего персонала,
соображениями. Отсюда ясно, что техника
с позиции надежности — это объект
системного анализа.
Любая
наука развивается из основных понятий
и определений. В
теории
надежности такими понятиями являются
"надежность" и "отказ".
Сформулируем эти понятия и дадим им
научные определения.
Определение
понятия "надежность"
Надежностью
называется
свойство технического объекта сохранять
свои характеристики (параметры) в
определенных пределах при данных
условиях эксплуатации.
Из этого определения
следует, что надежность — понятие
объективное, независимое от нашего
сознания.
В природе все, что
имеет начало, имеет и конец. В течение
жизни объект расходует свои ресурсы
и, наконец, погибает. Так же происходит
и с надежностью. Создается техническое
средство с определенным ресурсом. В
процессе эксплуатации оно приносит
человеку пользу за счет потери этого
ресурса. Оно отказывает (болеет), его
ремонтируют (лечат). Этот процесс длится
до тех пор, пока эксплуатация технического
средства целесообразна.
Этот процесс и
все, что с ним связано (применительно
к техническим средствам), и изучает
теория надежности.
В
литературе и даже в некоторых стандартах
приводятся определения понятия
"надежность", существенно
отличающиеся по смыслу от сформулированного
ранее. Иногда это понятие отождествляется
с его численной оценкой: "надежностью
называется вероятность безотказной
работы системы в течение времени t".
Численные показатели не могут быть
определениями физических явлений,
подобные определения ошибочны.
Часто
понятие "надежность" связывают
со временем работы технического объекта.
Следует иметь в виду, что время — лишь
аргумент показателей надежности,
такой же, как число элементов системы
п,
интенсивность
отказов элементов. Манипулируя временем,
можно прийти к ложным выводам. Вот
типичный пример. Имеются две системы,
их вероятности безотказной работы
имеют значения Р1(100)
= 0,95, P2(200)
= 0,92. Какая из систем более надежна?
Очевидный ответ, что первая, т. к. Р1
>
Р2,
ошибочен. В ответе не учтено, что системы
работают разное время. Правильный ответ
здесь неизвестен. Ошибочны также
определения, в которых понятие
"надежность" трактуется как
совокупность свойств безотказности,
ремонтопригодности, сохраняемости,
долговечности. В подобных определениях
содержатся две принципиальные
ошибки.
Во-первых, безотказность, ремонтопригодность
и долговечность
не
являются физическими свойствами
техники. Во-вторых, физическое свойство
не
может быть совокупностью других
физических свойств. Приведенные нами
определения понятия "надежность"
не научны, их часто называют монтерскими.
Понятие
"отказ".
Классификация
и характеристики отказов
Отказом
называется
событие, после возникновения которого
характеристики технического объекта
(параметры) выходят за допустимые
пределы.
Это
понятие субъективно, т. к. допуск на
параметры объекта устанавливает
пользователь. Вот один из примеров.
Математическая система Марle
имеет в своем составе около 3000 функций.
Предположим, что перестала функционировать
одна из них, например функция вычисления
логарифма действительного числа.
Является это отказом компьютера или,
вернее, системы Мар1е или нет? Ответ
здесь не однозначный, субъективный.
Отказ— фундаментальное
понятие теории надежности. Критерий
отказа — отличительный признак или
совокупность признаков, согласно
которым устанавливается факт возникновения
отказа.
По
типу
отказы
подразделяются на:
- отказы
функционирования,
при
которых прекращается выполнение
объектом основных функций (например,
поломка зубьев шестерни);
- отказы
параметрические,
при
которых параметры объекта изменяются
в
недопустимых пределах (например,
потеря точности измерения напряжения
вольтметром).
По
своей природе
отказы
могут быть:
-
случайные, обусловленные
непредусмотренными перегрузками,
дефектами материала, ошибками персонала,
сбоями системы управления и т. п.:
-
систематические, обусловленные
закономерными явлениями, вызывающими
постепенное накопление повреждений:
усталость, износ, старение, коррозия
материалов и т. п.
Основными признаками
классификации отказов являются:
-характервозникновения;
-
причина возникновения;
- последствия
отказов;
- дальнейшее
использование объекта;
- легкость
обнаружения;
- время возникновения.
Рассмотрим подробнее
каждый из классификационных признаков.
По
характеру
возникновения отказы
могут быть внезапные, постепенные и
перемежающиеся. Внезапный
отказ—
это отказ, проявляющийся в резком
(мгновенном) изменении характеристик
объекта. Постепенный
отказ
- отказ, происходящий в результате
медленного, постепенного ухудшения
характеристик объекта из-за износа
и старения материалов. Внезапные отказы
обычно проявляются в виде механических
повреждений элементов (поломки, пробои
изоляции, обрывы и т. п.) и не сопровождаются
предварительными видимыми признаками
их приближения. Внезапный отказ
характеризуется независимостью момента
наступления от времени предыдущей
работы. Перемежающимся
называется
отказ самоустраняющийся
(возникающий/исчезающий). Типичным
примером перемежающегося отказа
является сбой компьютера.
По
причине
возникновения отказы
могут быть конструкционные,
производственные и эксплуатационные.
Конструкционный
отказ появляется
в результате недостатков и неудачной
конструкции объекта. Производственный
отказ связан
с ошибками при изготовлении объекта
по причине несовершенства или нарушения
технологии. Эксплуатационный
отказ вызывается
нарушением правил эксплуатации
объекта.
По
признаку дальнейшего
использования объекта отказы
могут быть полные или частичные. Полный
отказ
исключает возможность работы объекта
до его устранения. При возникновении
частичного
отказа
объект может частично использоваться.
По
признаку легкости
обнаружения отказы
бывают очевидные
(явные)
и скрытые
(неявные).
По
времени
возникновения отказы
подразделяются на приработочные,
возникающие
в начальный период эксплуатации, отказы
при нормальной
эксплуатации, износовые отказы,
вызванные необратимыми процессами
износа деталей, старения материалов
и т. п.
Анализ
сведений об отказах оборудования при
эксплуатации сложных систем показывает,
что с течением времени происходит
старение элементов и увеличение их
отказов, что приводит к значительному
росту затрат (материальных, временных,
финансовых) ресурсов. Многолетняя
практика эксплуатации сложных систем
показывает, что важной
задачей
при поддержании объектов в состоянии
работоспособности является организация
и проведение технического обслуживания
и различных видов ремонтов (восстановлений)
элементов систем. Исключительно важна
проблема продления ресурса стареющих
систем с учетом критериев надежности
и уменьшения техногенного риска.
71.Фундаментальные понятия теории надежности информационных систем
68. Надежность ивс
Показатели долговечности
67. Теория надежности как наука и научная дисциплина