Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Reliability.doc
Скачиваний:
4
Добавлен:
27.10.2018
Размер:
1.46 Mб
Скачать

Лекция 1. Введение

Учебник по теории надежности следует начать с определения понятия «надежность». В действительности, в таком определении нет необходимости, поскольку в русском языке слово «надежность» понимается вполне однозначно (как и в английском слово “reliability”) и каких-либо уточнений не требуется. Тем не менее, определения существуют. В самом общем виде оно звучит так:

Надежность – это способность системы или ее элемента выполнять свои функции в оговоренных условиях функционирования в течение некоторого обусловленного периода времени.

В рамках данного параграфа нам важнее договориться о том, что такое «Теория надежности» как наука или как учебный предмет в цикле подготовки специалистов.

Наука или направление исследования подразумевает наличие ученых, образующих сообщество, в рамках которого происходят обмен результатами, обсуждения и т.п. Для этого существуют журналы, конференции, симпозиумы.

В Советском Союзе с 1968 г. по 1998 г. существовал журнал «Надежность и контроль качества», основанный при участии классика отечественной теории вероятностей академика Гнеденко Б. Г. В США с 1951 года по настоящее время издается журнал общества IEEE «Надежность». Таким образом, мы имеем свидетельство того, что теория надежности как научная область интересна определенному кругу специалистов. Какие же вопросы обсуждаются в этих изданиях? Журнал IEEE Transactions on Reliability принимает опубликованию работы по безопасности, восстанавливаемости изделий, методам измерения эффективности. Эти задачи могут решаться применительно к отдельным устройствам, системам и производствам, к системам реализуемым «в железе» или программно, к отдельным компонентам или к системам в целом и т.п.

Мы приходим к тому, что рамки науки «Теория надежности» широки и точно не определены, она объединяет в себя весь человеческий опыт по анализу поведения систем и средствам повышения надежности их функционирования. Можно говорить о том, что теория надежности – междисциплинарная наука, обслуживающая различные технические области, как это делает, скажем, математика.

Здесь уместно привести историческую справку о том, когда и как появилась на свет теория надежности. Википедия отсылает к 19 веку, когда методы теории вероятностей использовались страховыми компаниями для вычисления тарифов на страхование жизни и имущества. Возможно, научными работами, определяющими современную методологию теории надежности послужили работы Дж. фон Неймана «Вероятностная логика и синтез надежных организмов из ненадежных компонент» (1952 г.) и К. Шеннона «Надежные схемы из ненадежных реле» (1956). Из результатов этих работ следует, что сколь угодно надежные схемы можно строить из сколь угодно ненадежных элементов. Удивительно, что более полувека назад основатели современной кибернетики предвидели стремительное развитие технологий и разрабатывали технические решения, реализация которых стала возможной только спустя десятилетия.

Чтобы выделить главные вопросы, которые следует рассмотреть в рамках семестрового курса теории надежности, условимся, прежде всего, о том, что нас главным образом интересуют информационные системы, т.е. устройства и сети устройств, предназначенные для обработки, хранения и передачи информации.

Далее, разобьем задачу разработки устройства или системы на два основных этапа: анализ и синтез. На первом этапе мы должны сформулировать требования к системе и рассчитать ее основные параметры, на втором – реализовать систему в виде совокупности аппаратных и программных средств. Это разбиение, конечно, очень условное, но оно подсказывает, какие именно цели нужно поставить перед теорией надежности:

  • разработка критериев надежности;

  • методы математического моделирования систем;

  • методы анализа систем;

  • методы повышения надежности систем.

Обсудим кратко перечисленные цели.

Прежде всего, очевидно, все отказы и сбои в работе системы мы рассматриваем как случайные события. Следовательно, и характеристики надежности систем, и методы получения их оценок формулируются в терминах теории вероятностей. Как потребители информационных систем, мы ясно представляем себе нежелательные ситуации в их работе и надежной назовем систему, в которой такие ситуации встречаются редко.

Сначала о критериях надежности. На качественном уровне, можно сказать, что сообщение, посланное в систему, должно быть обработано а) правильно; б) своевременно. Следовательно, количественными характеристиками надежности (показателями надежности) могут служить вероятность успешного решения задачи, распределение вероятностей времени решения задачи либо некоторые числовые характеристики этой величины.

В действительности, ситуация в области построения информационных сетей сложнее, чем описанная выше. На современном уровне потребитель сети предъявляет к ней целый комплекс требований, который сегодня формулируется в виде понятия QoS (quality of service). Сюда входит большой комплекс характеристик и требований, выполнение которых гарантирует субъективно комфортное использование сети группами пользователей. Невыполнение отдельных требований также может рассматриваться как сбой в работе системы. Хотя изучение современных стандартов качества обслуживания не входит в наш курс, изучаемую терминологию, подходы и модели можно творчески обобщать для использования в более сложных ситуациях.

Перейдем к обсуждению понятия модели системы.

Всякая система состоит из отдельных элементов и надежность системы в целом зависит от надежности каждого отдельного элемента. Мы уже условились о том, что для математического описания систем будем пользоваться методами теории вероятностей. Поэтому модель системы в целом может быть составлена на основании

  • модели поведения ее элементов;

  • математической модели взаимодействия элементов;

  • модели внешних факторов, влияющих на работу системы.

Например, в случае системы связи, мы должны знать математические модели источников информации, алгоритмы кодирования и модуляции информации на передающей стороне и, соответствующие алгоритмы демодуляции и декодирования на приемной стороне. Роль внешних факторов играет в данном случае, например, шум в канале связи.

При построении модели системы мы сталкиваемся с компромиссом между сложностью описания системы и точностью описания реального объекта. Чем больше деталей и нюансов учитывает модель, тем более громоздкой она становится.

Не следует забывать, что модель системы должна быть использована для получения оценок ее характеристик. Если модель достаточно проста, то для анализа системы можно применять аналитические методы и получать нужные зависимости аналитически, т.е. в виде формул. Более сложное и, возможно, более адекватное описание системы потребует применения методов компьютерного моделирования. Чрезмерно сложные математические модели элементов системы могут оказаться бесполезными.

Речь идет о том, что на этапе проектирования зачастую приходится применять весьма упрощенные описания поведения объектов и внешних факторов. Несмотря на кажущуюся абстрактность и несоответствие реальным условиям, такие модели позволяют установить важные закономерности в поведении систем и принять правильные решения на этапе проектирования.

По результатам анализа систем можно вычислить основные показатели надежности системы и принять решение о необходимости (или об отсутствии необходимости) изменить ее структуру с целью повышения надежности. Методов повышения надежности много, но, очевидно, их применение всегда связано с дополнительными затратами. Например, наиболее простым и естественным решением является резервирование – использование дополнительного комплекта оборудования, включаемого в случае выхода из строя основного комплекта. В данном случае повышение надежности достигнуто за счет удвоения стоимости. Как мы увидим в дальнейшем, такой подход не является самым эффективным, но в любом случае повышение надежности достигается за счет введения в систему избыточностидополнительных элементов, использование которых, вообще говоря, не обязательно. Примером структурной избыточности может быть резервирование, о котором уже шла речь. Избыточным является язык общения: утрата отдельных букв текста или отдельных звуков в телефонном разговоре зачастую проходят без последствий для возможности восстановления информации. Это так называемая информационная избыточность. Можно говорить об алгоритмической избыточности и т.д.

Рациональное введение и использование избыточности – основная задача этапа проектирования надежных систем.

Итак, мы готовы к формулированию задач и структуры курса. Наш краткий курс состоит из следующих разделов:

  • Основные понятия, критерии и показатели надежности.

  • Модели последовательностей отказов и восстановлений.

  • Расчет показателей надежности систем по показателям надежности элементов.

  • Примеры построения избыточных систем.

1. Основные понятия, критерии и показатели надежности

1.1. Невосстанавливаемые устройства

В качестве объекта изучения рассматривается одиночное невосстанавливаемое устройство, которое начинает работу в момент времени и работает до момента наступления неисправности – момента отказа.

Отказ устройства представляет собой случайное событие, а время от начала работы до отказа – непрерывная случайная величина (с.в.), обозначим ее буквой . В теории надежности ее еще называют наработкой до первого отказа.

Как и всякая другая с..в., задается своей плотностью распределения вероятностей .

В теории надежности плотность называется плотностью распределения времени безотказной работы устройства.

Соответствующая функция распределения с.в.

дает возможность вычислить вероятность безотказной работы в течение времени как

.

Понятно, что знание плотности либо функции распределения дает полную информацию о с.в. и позволяет вычислить вероятность любого связанного с ней события. Кроме того, мы можем вычислять числовые характеристики наработки до отказа. В частности, математическое ожидание

есть средняя наработка до первого отказа.

С помощью интегрирования по частям можно связать с формулой

. (1.1)

Далее нам предстоит ввести важное понятие – интенсивность отказов. Не совсем понятно, о чем идет речь, поскольку речь шла об одном устройстве, и наблюдение прекращалось в момент времени, когда происходил отказ, т.е. отказ мог быть только один. Одна из возможных интерпретаций термина «интенсивность отказов» применительно к невосстанавливаемому устройству состоит в том, что рассматривается совокупность из многих идентичных независимых устройств. Все устройства включены одновременно и нас интересует доля устройств, отказавших в момент . Более точная постановка вопроса: какова доля отказавших устройств за малый интервал времени , отнесенная к длине интервала? Иными словами, с какой мгновенной скоростью происходит отказ устройств.

Доля отказавших устройств – это, конечно, вероятность отказа. Поскольку на момент начала интервала устройство работало, речь идет об условной вероятности того, что отказ произойдет на интервале при условии, что момент отказа . Итак, искомая величина может быть записана в виде

.

Предел этой величины при равный

(1.2)

называют интенсивностью отказов. Заметим, что имеет размерность, она измеряется в единицах обратных единицам времени (1/с, 1/час и т.п.).

Из определения (1.2) следует

и отсюда

. (1.3)

Из этой формулы, в частности, следует, что интенсивность несет полную информацию о с.в. .

На рис. 1.1. приведена типичная кривая, показывающая поведение интенсивности отказов . Принято считать, что интенсивность отказов высока в начальный период существования устройства (период приработки) и после длительного срока эксплуатации (период старения). Между ними – период нормальной эксплуатации, в течение которого интенсивность отказов наименьшая.

Подведем итоги. Показателями надежности невосстанавливаемого элемента системы являются

  • вероятность безотказной работы в течение заданного интервала времени;

  • средняя наработка на отказ;

  • интенсивность отказов.

Приведенные выше формулы позволяют установить связь этих параметров с математическим описанием модели отказов устройства в виде плотности или функции распределения времени безотказной работы.

При решении практических задач плотность распределения отказов неизвестна. В качестве невосстанавливаемых устройств можно отдельные элементы схемы, ремонт которых либо невозможен, либо намного дороже самого элемента. Речь может идти о транзисторах, микросхемах, реле, модулях памяти и т.п. Современные устройства, состоящие из тысяч элементов, зачастую устаревают морально и заканчивают свою службу гораздо раньше, чем наступает отказ хотя бы одного элемента. Поэтому трудно себе представить, каким образом могла бы быть собрана убедительная статистическая информация об отказах таких устройств или их элементов. Тем не менее, задача получения оценок показателей надежности по результатам статистических испытаний важна, поскольку понятие элемента и отказа в информационной системе имеет очень широкий смысл. Так, отказом может быть ошибка при передаче сигнала по каналу связи, при считывании бита с носителя с высокой плотностью записи, кратковременное превышение допустимой нагрузки на сеть и т.п. Кроме того, супер-быстродействующие вычислители будущего, основанные, например, на квантовых технологиях, могут быть построены на быстрых, но ненадежных элементах. При этом совокупная надежность вычислителя может быть высокой за счет рационального введения избыточности.

Итак, рассмотрим задачу вычисления показателей надежности невосстанавли-ваемых элементов по результатам их статистических испытаний.

Предположим, что испытана большая партия из идентичных устройств и определено время до отказа каждого из них. Результаты измерений представлены в виде совокупности значений наработки устройств . Для получения показателей надежности используются стандартные методы математической статистики.

В частности, оценка средней наработки на отказ вычисляется как

. (1.4)

Оценка вероятности безотказной работы в течение времени представляет собой кусочно-постоянную функцию вида

, (1.5)

где  число моментов отказов, превышающих (число устройств, исправно работавших в момент ).

Экспериментальная оценка интенсивности отказов вычисляется по формуле

. (1.6)

Как уже отмечалось, по интенсивности отказов можно вычислить все показатели, в частности, плотность распределения отказов. Однако лучше построить гистограмму распределения отказов непосредственно по выборке. Для этого область значений выборки разбивается на непересекающиеся интервалы, каждый из которых содержит хотя бы несколько измеренных значений, и для каждого интервала вычисляется оценка его вероятности как отношение числа попаданий в интервал к общему числу измерений:

, , (1.7)

где  число образцов, отказавших в течение интервала времени .

При построении модели распределения времени работы устройства может понадобиться эмпирическая функция распределения

,

где – число устройств, отказавших к моменту времени , и несмещенная оценка выборочной дисперсии наработки на отказ:

.

Зачастую задачей исследования надежности элемента является построение аналитической модели его отказов. В этом случае нужно выбрать подходящее параметрическое семейство распределений вероятностей и подобрать параметры так, чтобы добиться близости теоретической и экспериментальной плотностей распределения в смысле некоторого статистического критерия. К этой проблеме мы вернемся в следующей главе после обсуждения типичных моделей отказов.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]