
- •2. Свойство надежности - безотказность и его показатели.
- •3. Свойство надежности - ремонтопригодность и его показатели.
- •4. Свойство надежности - долговечность и его показатели.
- •5. Свойство надежности - сохраняемость и его показатели.
- •6. Основные понятия теории надежности: события, состояния, классификация отказов
- •7. Единичные и комплексные показатели надежности
- •8. Основные факторы, влияющие на надежность аппаратуры
- •9. Влияние диагностики и контроля на надежность ис
- •10. Оперативный контроль
- •11. Тестовый контроль
- •12. Математическая модель восстанавливаемого и невосстанавливаемого элемента
- •13. Расчет надежности систем с параллельно-последовательным соединением элементов
- •14. Основные этапы логико-вероятностного подхода
- •15. Способы повышения надежности технических систем
- •16. Техническое обслуживание и его влияние на надежность
- •Резервирование - способ надежности и его виды
- •Методы структурного и временного резервирования. Расчет надежности систем с резервированием
- •19. Методы обеспечения сохранности программ и данных
- •20. Различие понятий надежности технических средств и программного обеспечения
- •21. Факторы, влияющие на надежность ис и способы их нейтрализации
- •22. Модели надежности по
- •23. Методы повышения надежности по
- •Методы введения структурированной избыточности в программы и метод контрольных функций
- •Назначение и планы испытаний на надежность
- •26. Экспериментальные оценки надежности и методы их расчета
- •27. Виды испытаний на надежность
- •28.Методы обеспечения отказоустойчивости информационных систем.
- •29.Понятие систем высокой и непрерывной готовности, систем эластичным к отказам и устойчивым к стихийным бедствиям. Примеры построения таких систем.
- •30.Оценка влияния человеческого фактора на надежность ис
Назначение и планы испытаний на надежность
Испытания на надежность - это определение показателей надежности объекта на основании непрерывного наблюдения за состоянием его работоспособности в условиях, предписанных методикой испытаний. Испытания на надежность являются обязательным видом испытаний при изготовлении изделий и при приемке их от заводов-изготовителей.
По целевой направленности испытания на надежность подразделяются на определительные, контрольные и специальные.
Определительные испытания - испытания, в результате которых определяются количественные показатели надежности, как точечные (средняя наработка до отказа), так и интервальные (среднеквадратическое отклонение времени работы до отказа относительно среднего значения).
Контрольные испытания на надежность - испытания, в результате которых контролируемые изделия по некоторым признакам и с заданным риском относятся либо к категории годных, либо к категории негодных по уровню своей надежности. Такими признаками могут быть: отсутствие отказов на заданном интервале времени; число отказов в случайный момент времени и т.п. По результатам таких испытаний может быть сделан, к примеру, следующий вывод: изделия с риском поставщика (т.е. с вероятностью забраковать годные), равным 0,02, и риском заказчика -потребителя (т .е . вероятностью принять негодные), равным 0,03, могут быть отнесены к категории годных. Это менее информативный результат по сравнению с определительными испытаниями, но зато он требует меньшего объема испытаний.
Ускорение испытаний. Ускоренные испытания - испытания в условиях, ко- гда используются факторы, ускоряющие процесс возникновения отказов. Такими факторами могут быть температура, повышенная нагрузка, влажность и т.п. Для проведения ускоренных испытаний предварительно получают зависимости пока- зателя надежности от изменения ускоряющего фактора или связь между значе- ниями показателя надежности, полученными при различных условиях испытаний.
Исключение «анормальных» результатов испытаний. Статистические дан- ные о надежности элементов, входящих в состав сложной системы, собираются обычно на разных объектах. Поэтому важно обеспечить однородность статисти- ческого материала. «Анормальные» результаты испытаний должны исключаться из статистической совокупности по правилам исключения «анормальных» резуль- татов измерений. Суть этих правил состоит в следующем:
1) если некоторое измерение хК внушает сомнение в его принадлежности к ге- неральной совокупности, определяются: а) среднее значение хср и средне- квадратическое отклонение а генеральной совокупности без сомнительных измерений; б) коэффициент к, равный
к = (хК-хср)/а,
26. Экспериментальные оценки надежности и методы их расчета
По экспертным оценкам причины отказов в ИС выглядят следующим образом:
отказы дисков - 27%,
отказы сервера или его ядра - 24%,
отказы в программах - 22%,
отказы в коммуникационном оборудовании - 11%,
отказы в каналах передачи данных - 10%,
отказы из-за ошибок персонала - 6%.
Следует отметить, что отказы в коммуникационном оборудовании и каналах передачи данных составляют 21%.
Рассмотрим пути повышения надежности по частоте возникновения отказов.
На первом месте отказы подсистемы памяти. Имеются три основных типа подсистем внешней памяти с высокой готовностью. Для своей реализации они используют технологию Избыточных Массивов Независимых Дисков (RAID - Redundant Arrays of Inexpensive Disks). Наиболее часто используются следующие решения (более подробно об уровнях RAID см. разд. 9.3.2): RAID уровня 1 или зеркальные диски, RAID уровня 3 с четностью и RAID уровня 5 с распределенной четностью. Эти три типа внешней памяти в общем случае имеют практически почти мгновенное время восстановления в случае отказа. Кроме того, подобные устройства иногда позволяют пользователям смешивать и подбирать типы RAID в пределах одного дискового массива. В общем случае дисковые массивы представляются прикладной задаче как один диск.
Технология RAID уровня 1 (или зеркалирования дисков) основана на применении двух дисков так, что в случае отказа одного из них, для работы может быть использована копия, находящаяся на дополнительном диске.
В массивах RAID уровня 3 предусматривается использование одного дополнительного дискового накопителя, обеспечивающего хранение информации о четности (контрольной суммы) данных, записываемых на каждые два или четыре диска. Если один из дисков в массиве отказывает, информация о четности вместе с данными, находящимися на других оставшихся дисках, позволяет реконструировать данные, находившиеся на отказавшем накопителе.
Массив RAID уровня 5 является комбинацией RAID уровня 0, в котором данные расщепляются для записи на несколько дисков, и RAID уровня 3, в которых имеется один дополнительный диск. В RAID уровня 5 полезная информация четырех дисков и контрольная информация распределяется по всем пяти дискам так, что при отказе одного из них, оставшиеся четыре обеспечивают считывание необходимых данных.
Отказы сервера и ядра могут быть устранены путем резервирования. Системы высокой готовности связаны со своими резервными системами посредством очень небольшого программного демона "сердечный пульс", который позволяет резервной системе управлять основной системой или системами, которые она резервирует. Когда "пульс" пропадает, кластер переходит в режим переключения на резервную систему.