Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
67-75.doc
Скачиваний:
1
Добавлен:
01.04.2025
Размер:
971.26 Кб
Скачать

71.Фундаментальные понятия теории надежности информационных систем

Любая наука развивается, исходя из основных понятий и определений. Такими понятиями в теории надежности являются "надежность" и "отказ". Надежностью называется физическое свойство технического устройства сохранять свои характеристики в процессе эксплуатации. Это определение является объективным фундаментальным понятием. Оно не вызывает возражений и каких-либо уточнений, если речь идет о надежности техники. Отказом называется событие, после возникновения которого, характеристики технического устройства выходят за допустимые пределы. Это понятие является субъективным, т. к. допустимые пределы зависят от нашего сознания и в большинстве случаев не могут быть установлены объективно.

В классической теории надежности нетехнические системы, например информационные, не рассматривались. Более того, считалось, что понятие надежность к таким системам, как производство, диспетчерский пункт, экономическое предприятие и т. п., не применимо. Функционирование этих объектов с позиции теории надежности должно было оцениваться показателями их эффективности. Указанное ограничение в теории надежности необходимо снять. Теория надежности должна развиваться не только вглубь, но и вширь. Ее понятия и методы полезно использовать для оценки функционирования только технических объектов.

Понятие "надежность" в том виде, как оно было сформулировано ранее, не применимо для нетехнических объектов. Надежность функционирования не­технической системы не является ее физическим свойством. Это лишь способность системы выполнять определенные функции. Этому понятию можно дать следующее определение: надежностью называется способность объекта выполнять свои функции в процессе эксплуатации.

Дадим следующее определение понятию "отказ". Отказом нетехнического объекта называется событие, после возникновения которого, его показатели выходят за допустимые пределы.

По аналогии с техническими объектами, видами отказов нетехнического объ­екта могут быть: внезапные, постепенные и перемежающиеся. При внезапном

отказе функционирование объекта либо прекращается, либо становится мало­эффективным. При постепенном отказе характеристики объекта с течением времени ухудшаются до наступления полного отказа, когда функционирова­ние объекта становится нецелесообразным. Перемежающимся отказом назы­вается событие, после возникновения которого функционирование объекта лишь временно становится неэффективным.

Отказы нетехнического объекта являются событиями случайными, т. к. в большинстве случаев предсказать время их возникновения практически невозможно, хотя прогнозирование отказа здесь более вероятно, чем в техниче­ских системах.

Типичными примерами информационных систем являются: информационно-поисковые системы, базы данных, диспетчерские системы, банкоматы, библиотеки, телефонные сети, справочные системы и т. д. Заявками на обслужи­вание в этих системах являются люди — потребители информации, обслужи­вающими органами— базы данных, диспетчерские пункты, библиотеки, справочники, банки данных и т. п. Все эти системы можно отнести к системам массового обслуживания (СМО).

Широкое распространение СМО требует серьезных научных исследований по оценке их эффективности, одним из показателей которой является надеж­ность. Рассмотрим функционирование СМО с позиции ее надежности и уточ­ним понятия "надежность" и "отказ".

Существуют два класса СМО: системы с отказами и системы с очередью. Как те, так и другие могут быть одноканальные и многоканальные с различными приоритетами обслуживания. Системы массового обслуживания с отказами наиболее часто бывают многоканальными. В этих системах очередь на об­служивание не образуется. Если все каналы заняты, то очередной заявке от­казывают в обслуживании. Примерами таких систем являются: больница с ограниченным числом мест для больных, диспетчерский пункт системы управления воздушным движением, платная стоянка автомобилей, телефон­ный узел и т. п.

Для заявок на обслуживание наиболее важным показателем функционирова­ния СМО является возможность обслуживающего органа принять заявку на обслуживание в любой произвольный момент времени t. Тогда отказом СМО является событие, при котором заявка не будет принята на обслужива­ние в момент ее поступления.

Системы массового обслуживания с очередью в обслуживании не отказыва­ют. Можно подумать, что эти системы отказов не имеют. Однако это далеко не так. Если, например, очередь на обслуживание длинная, а заявка ограничена во времени, то последняя покинет обслуживающий орган и для нее такая СМО является ненадежной. Для СМО с очередью отказом является событие, при котором заявка покидает очередь. В данном случае отказ СМО является понятием субъективным, зависящим от мнения заявки. Для заявки наиболее важным показателем функционирования такой СМО является длительность обслуживания.

68. Надежность ивс

Надежность — важнейшая характеристика качества любой системы, поэтому разработана специальная теория — теория надежности.

Теория надежности может быть определена как научная дисциплина, изучающая закономерности, которых следует придерживаться при разработке и эксплуата­ции систем для обеспечения оптимального уровня их надежности с минималь­ными затратами ресурсов.

Надежность — характеристика временная, она может быть ориентирована либо в прошлое, либо в будущее время и не допускает «точечных» во времени оценок. Иными словами, надежность — это свойство системы «штатно» функциониро­вать во времени.

Надежность — комплексное свойство системы, оно включает в себя более про­стые свойства, такие как безотказность, ремонтопригодность, долговечность и т. д.

Безотказность — свойство системы сохранять работоспособное состояние в те­чение некоторого времени или наработки (наработка — продолжительность или объем работы системы).

Ремонтопригодность — свойство системы, заключающееся в приспособленности к предупреждению и обнаружению причин возникновения отказов, поврежде­ний и поддержанию и восстановлению работоспособного состояния путем про­ведения технического обслуживания и ремонтов.

Долговечность — свойство системы сохранять при установленной системе тех­нического обслуживания и ремонта работоспособное состояние до наступления предельного состояния, то есть такого момента, когда дальнейшее использование системы по назначению недопустимо или нецелесообразно.

Одним из основных понятий теории надежности является отказ. Отказом назы­вают полную или частичную потерю работоспособности системы или ее элемен­та. Отказы бывают: внезапные и постепенные; зависимые и независимые; пол­ные и частичные; устойчивые и самоустраняющиеся; аппаратные, эргатические (связанные с персоналом) и программные и т. п. [26].

Устойчивый отказ обусловливает длительную неработоспособность системы и устраняется только в результате ее технического обслуживания, то есть вы­полнения специальных мер, принятых для восстановления работоспособности системы. Самоустраняющийся отказ (обычно его называют сбоем) — отказ, имеющий кратковременный характер и самоустраняющийся произвольно, без принятия специальных мер для его устранения. Ряд сбоев одного и того же ха­рактера, следующих друг за другом, называют перемежающимся отказом.

Аппаратный отказ обусловлен нарушением работоспособности технического элемента системы, соответственно, эргатический — эргатического и программ­ный — программного элементов системы. В соответствии с приведенной класси­фикацией отказов можно рассматривать и надежность трех видов:

  • аппаратную;

  • эргатическую;

  • программную.

В многофункциональных системах часто вводят понятие функциональной надеж­ности выполнения локальной функции системы. Это понятие важно тогда, когда разные функции системы различны по значимости, обеспечиваются различными подсистемами и дифференцируются по предъявляемым к ним требованиям.

Все системы в теории надежности классифицируются по ряду признаков. Важ­ными классификационными группами являются:

  • восстанавливаемые;

  • невосстанавливаемые;

  • обслуживаемые;

  • необслуживаемые системы.

Восстанавливаемой называется такая система, работоспособность которой в слу­чае возникновения отказа подлежит восстановлению. Невосстанавливаемая сис­тема — такая система, работоспособность которой в случае отказа восстановле­нию не подлежит.

Обслуживаемая система — система, для которой предусматривается проведение регулярного технического обслуживания. Необслуживаемая система — система, для которой не предусматривается проведение регулярного технического обслу­живания.

Информационные и вычислительные системы первых поколений, за редким ис­ключением, относятся к восстанавливаемым обслуживаемым системам. Многие современные вычислительные системы относятся к необслуживаемым восста­навливаемым системам (например, персональные компьютеры) и даже к необ­служиваемым и невосстанавливаемым системам (отдельные узлы вычислитель­ных систем, например микропроцессор).

Основные показатели надежности

Показатель надежности — это количественная характеристика одного или не­скольких свойств, определяющих надежность системы. В основе большинства показателей надежности лежат оценки наработки системы, то есть продолжи­тельности или объема работы, выполненной системой. Показатель надежности, относящийся к одному из свойств надежности, называется единичным. Комплексный показатель надежности характеризует несколько свойств, определяющих надежность системы.

Далее приводятся наименования основных показателей надежности систем и их определения в соответствии с ГОСТ 27.002-80 «Надежность в технике. Термины и определения».

Единичные показатели надежности

К единичным показателям надежности в соответствии с ГОСТ 27.002-80 отно­сятся показатели безотказности, ремонтопригодности и долговечности.

Показатели безотказности

  1. Вероятность безотказной работы — вероятность того, что в пределах задан­ной наработки отказ системы не возникнет.

  2. Вероятность отказа — обратная величина, вероятность того, что в пределах заданной наработки отказ системы возникнет.

  3. Средняя наработка до отказа — математическое ожидание наработки систе­мы до первого отказа (существенно для невосстанавливаемых систем).

  4. Средняя наработка на отказ (T0, MTBF — Main Time Between Failures) — от­ношение наработки восстанавливаемой системы к математическому ожида­нию числа ее отказов в пределах этой наработки (имеет смысл только для восстанавливаемых систем).

  5. Интенсивность отказов — условная плотность вероятности возникновения отказа невосстанавливаемой системы, определяемая для рассматриваемого момента времени при условии, что до этого момента отказ не возник.

  6. Параметр потока отказов (λ(t)) - отношение среднего числа отказов для восстанавливаемой системы за произвольно малую ее наработку к значению этой наработки.

Показатели ремонтопригодности

  1. Вероятность восстановления работоспособного состояния — вероятность того, что время восстановления работоспособного состояния не превысит заданного.

  2. Среднее время восстановления работоспособного состояния, Твматематиче­ское ожидание времени восстановления работоспособного состояния системы.

  3. Показатели долговечности

1)Средний ресурс — математическое ожидание наработки системы от начала ее эксплуатации или ее возобновления после ремонта до перехода в предельное состояние.

2)Срок службы (Tс.с) — календарная продолжительность от начала эксплуата­ции системы или ее возобновления после ремонта до перехода в предельное состояние.

Комплексные показатели надежности

1)Коэффициент готовности (Кr) — вероятность того, что система окажется в работоспособном состоянии в произвольный момент времени, кроме пла­нируемых периодов, в течение которых применение системы по назначению не предусматривается

где Tо — среднее время наработки на отказ, Tв — среднее время восстановления.

  1. 2)Коэффициент оперативной готовности — вероятность того, что система ока­жется в работоспособном состоянии в произвольный момент времени, кроме планируемых периодов, в течение которых применение системы по назначе­нию не предусматривается, и начиная с этого момента будет работать безот­казно в течение заданного времени.

  2. 3)Коэффициент технического использования — отношение математического ожидания интервалов времени пребывания системы в работоспособном со­стоянии за некоторый период эксплуатации к сумме математических ожида­ний интервалов времени пребывания системы в работоспособном состоянии, простоев, обусловленных техническим обслуживанием, и ремонтов за тот же период эксплуатации:

где Tи — время простоя системы, обусловленное выполнением планового тех­нического обслуживания и ремонта (время профилактики), пересчитанное на один отказ.

4)Коэффициент сохранения эффективности — отношение значения показателя эффективности за определенную продолжительность эксплуатации к номи­нальному значению этого показателя, вычисленному при условии, что отказы в системе в течение того же периода эксплуатации не возникают.

Коэффициент сохранения эффективности характеризует степень влияния отка­зов в системе на эффективность ее применения по назначению. Из ранее приве­денного определения теории надежности следует, что коэффициент сохранения эффективности может служить интегральным критерием оптимизации надежно­сти системы. Действительно, критерий оптимизации — это показатель, для кото­рого указана желаемая его величина или желаемое направление его изменения. Направление изменения коэффициента сохранения правильно выбранного по­казателя эффективности определяет основные ориентиры при поиске свойств системы, которые обеспечивают ее оптимальную надежность.

Для пользователей информационно-вычислительных систем понятие их надеж­ности ощущается в наибольшей степени по коэффициенту готовности системы Кr то есть по отношению времени работоспособного состояния системы к вре­мени ее незапланированного простоя. Для типичного современного сервера Кr = 0,99, что означает примерно 3,5 суток простоя в год. За рубежом часто ис­пользуется классификация систем по уровню надежности, показанная в табл. 28.1.

Таблица 28.1. Классификация систем по уровню надежности

Коэффициент готовности

Максимальное время простоя в год

Тип системы

0,99

3,5 сут

Обычная (Conventional)

0,999

8,5 ч

Высокой надежности (High availability)

0,9999

1 ч

Отказоустойчивая (Fault resilient)

0,99999

5 мин

Безотказная (Fault tolerant)

67. Теория надежности как наука и научная дисциплина

Теория надежности – наука, изучающая закономерности отказов технических систем. Основными объектами ее изучения являются:

- критерии надежности технических систем различного назначения;

- методы анализа надежности в процессе проектирования и эксплуатации технических систем;

- методы синтеза технических систем;

- пути обеспечения и повышения надежности техники;

- научные методы эксплуатации техники, обеспечивающие ее высокую надежность

Особенности этой дисциплины таковы:

- теория надежности – общетехническая дисциплина;

- математическое моделирование – основа изучения дисциплины;

- комплексный характер;

- высокая значимость и глубокая связь с другими техническими предметами;

- трудность моделирования и изучения процессов, протекающих в сложных технических системах (в смысле их надежности).

Рассмотрим более подробно эти особенности.

Процессы, протекающие в сложных технических системах, в смысле их надежности, закономерны и не зависят от вида техники. Это дает возможность их изучения общими для любых технических средств методами. Разработанные

в теории надежности методы анализа, синтеза, способы повышения надежности и научные методы эксплуатации техники являются общими для любых технических систем. Этим определяется общетехнический характер теории надежности и ее научность. Особенности отдельных видов техники изучаются в специальных технических дисциплинах, в которых на основании общей теории решаются конкретные задачи надежности.

Математическое моделирование является основой изучения функционирования

сложных систем в смысле их надежности. При этом у исследователя возникают значительные трудности в связи со следующими особенностями решаемых задач:

- случайный характер явлений;

- многокритериальность;

- высокая размерность уравнений;

- многовариантность;

- необходимость обеспечения высокой точности.

Эти особенности требуют применения в процессе моделирования объемного математического аппарата: теории вероятностей и математической статисти­ки, решения алгебраических, дифференциальных, интегральных уравнений, теории графов, интегральных преобразований, вычислительной математики,

методов оптимизации, статистического моделирования и др. Надежность является важнейшим параметром любой технической системы. Она во многом определяет такие характеристики системы, как качество, эф­фективность, безопасность, живучесть, риск, которые изучаются в специаль­ных предметах. Глубокая связь с этими предметами — еще одна особенность теории надежности как науки.

Теория надежности— дисциплина комплексная. В ее разделы входят предметы, которые могут быть самостоятельными дисциплинами. К ним относятся:

- математическая теория надежности;

- физическая теория надежности ("физика отказов"):

- прогнозирование;

- диагностика;

- теория контроля:

- теория восстановления (управление запасами).

Надежность техники зависит от многих факторов; критерии и показатели

надежности устанавливаются в зависимости от вида техники и ее применения; обеспечение надежности в процессе эксплуатации определяется дисциплиной обслуживания, квалификацией обслуживающего персонала, соображениями. Отсюда ясно, что техника с позиции надежности — это объект системного анализа.

Любая наука развивается из основных понятий и определений. В теории надежности такими понятиями являются "надежность" и "отказ". Сформулируем эти понятия и дадим им научные определения.

Определение понятия "надежность"

Надежностью называется свойство технического объекта сохранять свои характеристики (параметры) в определенных пределах при данных условиях эксплуатации.

Из этого определения следует, что надежность — понятие объективное, неза­висимое от нашего сознания.

В природе все, что имеет начало, имеет и конец. В течение жизни объект рас­ходует свои ресурсы и, наконец, погибает. Так же происходит и с надеж­ностью. Создается техническое средство с определенным ресурсом. В про­цессе эксплуатации оно приносит человеку пользу за счет потери этого ре­сурса. Оно отказывает (болеет), его ремонтируют (лечат). Этот процесс длит­ся до тех пор, пока эксплуатация технического средства целесообразна.

Этот процесс и все, что с ним связано (применительно к техническим средст­вам), и изучает теория надежности.

В литературе и даже в некоторых стандартах приводятся определения поня­тия "надежность", существенно отличающиеся по смыслу от сформулирован­ного ранее. Иногда это понятие отождествляется с его численной оценкой: "надежностью называется вероятность безотказной работы системы в течение времени t". Численные показатели не могут быть определениями физических явлений, подобные определения ошибочны.

Часто понятие "надежность" связывают со временем работы технического объекта. Следует иметь в виду, что время — лишь аргумент показателей на­дежности, такой же, как число элементов системы п, интенсивность отказов элементов. Манипулируя временем, можно прийти к ложным выводам. Вот типичный пример. Имеются две системы, их вероятности безотказной работы имеют значения Р1(100) = 0,95, P2(200) = 0,92. Какая из систем более надеж­на? Очевидный ответ, что первая, т. к. Р1 > Р2, ошибочен. В ответе не учтено, что системы работают разное время. Правильный ответ здесь неизвестен. Ошибочны также определения, в которых понятие "надежность" трактуется как совокупность свойств безотказности, ремонтопригодности, сохраняемости, долговечности. В подобных определениях содержатся две принципиальные ошибки. Во-первых, безотказность, ремонтопригодность и долговечность не являются физическими свойствами техники. Во-вторых, физическое свойство не может быть совокупностью других физических свойств. Приведенные нами определения понятия "надежность" не научны, их часто называют монтерскими.

Понятие "отказ". Классификация и характеристики отказов

Отказом называется событие, после возникновения которого характеристики технического объекта (параметры) выходят за допустимые пределы.

Это понятие субъективно, т. к. допуск на параметры объекта устанавливает пользователь. Вот один из примеров. Математическая система Марle имеет в своем составе около 3000 функций. Предположим, что перестала функциони­ровать одна из них, например функция вычисления логарифма действитель­ного числа. Является это отказом компьютера или, вернее, системы Мар1е или нет? Ответ здесь не однозначный, субъективный.

Отказ— фундаментальное понятие теории надежности. Критерий отказа — отличительный признак или совокупность признаков, согласно которым устанавливается факт возникновения отказа.

По типу отказы подразделяются на:

- отказы функционирования, при которых прекращается выполнение объектом основных функций (например, поломка зубьев шестерни);

- отказы параметрические, при которых параметры объекта изменяются в недопустимых пределах (например, потеря точности измерения напряжения вольтметром).

По своей природе отказы могут быть:

- случайные, обусловленные непредусмотренными перегрузками, дефектами материала, ошибками персонала, сбоями системы управления и т. п.:

- систематические, обусловленные закономерными явлениями, вызывающими постепенное накопление повреждений: усталость, износ, старение, коррозия материалов и т. п.

Основными признаками классификации отказов являются:

-характервозникновения; - причина возникновения;

- последствия отказов;

- дальнейшее использование объекта;

- легкость обнаружения;

- время возникновения.

Рассмотрим подробнее каждый из классификационных признаков.

По характеру возникновения отказы могут быть внезапные, постепенные и перемежающиеся. Внезапный отказ— это отказ, проявляющийся в резком (мгновенном) изменении характеристик объекта. Постепенный отказ - отказ, происходящий в результате медленного, постепенного ухудшения харак­теристик объекта из-за износа и старения материалов. Внезапные отказы обычно проявляются в виде механических повреждений элементов (поломки, пробои изоляции, обрывы и т. п.) и не сопровождаются предварительными видимыми признаками их приближения. Внезапный отказ характеризуется независимостью момента наступления от времени предыдущей работы. Пе­ремежающимся называется отказ самоустраняющийся (возникающий/исче­зающий). Типичным примером перемежающегося отказа является сбой ком­пьютера.

По причине возникновения отказы могут быть конструкционные, производст­венные и эксплуатационные. Конструкционный отказ появляется в результа­те недостатков и неудачной конструкции объекта. Производственный отказ связан с ошибками при изготовлении объекта по причине несовершенства или нарушения технологии. Эксплуатационный отказ вызывается нарушени­ем правил эксплуатации объекта.

По признаку дальнейшего использования объекта отказы могут быть полные или частичные. Полный отказ исключает возможность работы объекта до его устранения. При возникновении частичного отказа объект может частично использоваться.

По признаку легкости обнаружения отказы бывают очевидные (явные) и скрытые (неявные).

По времени возникновения отказы подразделяются на приработочные, возни­кающие в начальный период эксплуатации, отказы при нормальной эксплуа­тации, износовые отказы, вызванные необратимыми процессами износа де­талей, старения материалов и т. п.

Анализ сведений об отказах оборудования при эксплуатации сложных систем показывает, что с течением времени происходит старение элементов и увели­чение их отказов, что приводит к значительному росту затрат (материальных, временных, финансовых) ресурсов. Многолетняя практика эксплуатации сложных систем показывает, что важной задачей при поддержании объектов в состоянии работоспособности является организация и проведение техниче­ского обслуживания и различных видов ремонтов (восстановлений) элементов систем. Исключительно важна проблема продления ресурса стареющих систем с учетом критериев надежности и уменьшения техногенного риска.