
- •Основные понятия эксплуатационного обслуживания. Определения, виды обслуживания
- •2. Основные эксплуатационные и надёжностные характеристики эвм и эксплуатационного обслуживания. Численные показатели и области применения.
- •Методы оценки производительности эвм.
- •Способы повышения эксплуатационной надёжности.
- •Надёжность по. Причины отказов и типы ошибок, методы их устранения.
- •Иерархия процессов обслуживания эвм. Форма организации эксплуатационного обслуживания.
- •Подготовительный этап:
- •Эксплуатация эвм:
- •Формы эксплуатационного обслуживания эвм
- •7. Классификация систем автоматического контроля.
- •Функции и характеристики систем контроля. Виды контролируемых преобразований. Виды избыточности сак.
- •Методы контроля передачи информации. Преимущества, недостатки, техническая реализация. Контроль счётчиков.
- •Контроль комбинационных схем. Классификация и техническая реализация.
- •Самопроверяемые схемы контроля. Сущность метода. Техническая реализация схем на примерах. Диагностические средства системы автоматического контроля.
- •Диагностические средства проверки работоспособности схем контроля
- •Определение эффективности системы автоматического контроля эвм (методы, сущность, достоинства и недостатки). Методы оценки эффективности системы аппаратного контроля
- •Математический аппарат и техническая реализация контроля по модулю. Организация контроля алу по модулю. Классификация методов контроля по модулю и области их применения.
- •Методы построения схем свёрток по произвольному модулю (классификация, техническая реализация).
- •Система автоматического контроля процессора и алу.
- •18. Автоматическое восстановление вычислительного процесса после отказов. Методы реконфигурации озу, пзу, буферной памяти.
- •19. Автоматическое восстановление вычислительного процесса после отказов. Алгоритмические методы исправления одиночных и некоторых двойных ошибок в оп. Реконфигурация пу.
- •20. Структурное резервирование. Методы, их достоинства и недостатки. Области применения структурного резервирования.
- •Механизм обнаружения отказа и замещения резервным блоком может быть:
- •21. Методы контроля на основе самопроверяемого дублирования. Алгоритм, техническая реализация отказоустойчивых схем.
- •22. Методы защиты информации от несанкционированного доступа. Сущность методов, достоинства и недостатки.
- •23. Система диагностирования эвм. Классификация методов, сущность и определение методов, средства реализации и области применения.
- •24. Характеристики систем диагностирования. Оценка эффективности систем диагностирования.
- •25. Типы тестов, области их применения в зависимости от режимов работы процессора и состояния работоспособности эвм. Типы профилактических испытаний.
- •26. Диагностирование озу. Классические методы диагностирования озу. Определение состава тестов и оценка их эффективности.
- •27. Методы диагностирования озу, применяемые в ibm pc. Принципы организации тестирования ibm pc. Методы диагностирования озу, реализованные в программе MemTest-86.
- •28. Автоматическое накопление информации о машинных ошибках. Обработка и использование накопленной информации об ошибках в автоматизированных системах сбора и накопления информации об ошибках.
- •29. Организация профилактического обслуживания эвм. Профилактика дисков и дисководов. Основные правила работы с дисками.
- •30. Техника безопасности при работе в вц и ремонте. Обеспечение пожарной безопасности. Требования к помещениям и параметрам окружающей среды. Оборудование помещений в машинных залах
- •31. Работа с эксплуатационной документацией. Проведение планово-профилактического обслуживания.
- •32. Факторы, влияющие на работоспособность эвм и методы борьбы с ними (шумы, типы шумов, коррозия, помехи в источниках питания и другие).
- •33. Корректирующие коды. Классификация. Принципы формирования кода Хемминга (на примере) и техническая реализация аппаратуры для исправления одиночных ошибок.
- •34. Аппаратура и алгоритм исправления одиночных ошибок на основе кода ко-од на примере.
- •36. Самопроверяемая схема контроля оп по коду Хэмминга (аппаратура, алгоритм работы схемы на примере).
- •37. Обеспечение отказоустойчивости озу с применением корректирующих кодов (аппаратные методы исправления двойных ошибок в памяти методами логической перестановки адресов)
Способы повышения эксплуатационной надёжности.
Под контролем в ЭВМ понимаются процессы, обеспечивающие обнаружение ошибок в работе ЭВМ, вызванных отказом или сбоем аппаратуры, ошибкой оператора, ошибкой в программе или другими причинами.
Контроль является одним из самых эффективных средств увеличения надежности и достоверности информации.
Следовательно, для обнаружения ошибок (сбоев и отказов) в момент их возникновения ЭВМ должна быть снабжена системой автоматического контроля и, препятствовать дальнейшему выполнению программы.
Для сокращения потерь времени на восстановление достоверности информации и вычислительного процесса после сбоя всr необходимо иметь автоматическую систему восстановления вычислительного процесса
Процесс восстановления работоспособности ЭВМ при отказе состоит из следующих процедур:
диагностирование и локализация;
замена или ремонт неисправного элемента или узла;
проверка работоспособности после ремонта.
Важнейшим средством повышения ремонтопригодности (снижения вoj) является оснащение ЭВМ средствами автоматического диагностирования, которые также сокращают время и труд для проверки работоспособности ЭВМ после ремонта.
Для сокращения времени восстановления ЭВМ при ремонте вoj повышению эксплуатационной надежности способствует автоматическая аппаратно-программная система регистрации и сбора данных об отказах и сбоях
Выбор периодичности и глубины проведения профилактических работ пфs требует системного подхода, так как увеличение объема и глубины профилактических работ способствует повышению надежности (сокращается число сбоев и отказов между профилактиками), но с другой стороны требует затрат машинного времени и труда. Для повышения проверкопригодности ЭВМ во время проведения профилактических работ ЭВМ должна быть снабжена достаточно мощной встроенной и внешней системой диагностирования.
По назначению тесты можно разделить на три группы:
проверочные (контролирующие) - предназначены для диагностирования устройств и ЭВМ в целом с целью определения работоспособности ЭВМ;
диагностические - предназначены для поиска и локализации места неисправности с точностью до съемного элемента;
наладочные - предназначены для измерения каких-либо параметров узлов и устройств ЭВМ, снятия технических характеристик, которые могут измениться в течение эксплуатации и влиять на работоспособность ВС в целом. Например, измерение скорости вращения дисковода, уровней сигналов в контрольных точках, запись констант на сектор, дорожку, диск и проверка правильности его работы и т.д.
Надёжность по. Причины отказов и типы ошибок, методы их устранения.
Надежность программного обеспечения - определена как свойство программы, которое выражается в выполнении заданных функций в заданных условиях работы и на заданной вычислительной машине.
Отказ программного обеспечения обусловлен несоответствием программного обеспечения поставленным задачам. Несоответствие может возникать по двум причинам:
либо разработчиком программы допущено нарушение спецификации—технических требований к программе;
либо спецификация неточная или неполная.
Несоответствие по первой причине встречается в первую очередь в сложных программных системах, где отдельные ошибки программиста трудно обозримы и могут оставаться нераскрытыми.
Несоответствие по второй причине возникает в первую очередь потому, что при составлении спецификации многие факторы, влияющие на работу программы, неизвестны. Они выясняются только постепенно, в ходе эксплуатации программы. Особенно это относится к управляющим программам.
Кроме того, ни в технических требованиях, ни при проверке программы невозможно оговорить и проверить все ситуации, которые возникают при использовании программы. Поэтому записать в спецификациях все ситуации свойства функций, которые должна выполнить программа, будет не намного проще, чем разработать соответствующую программу.
Надежность программы определяется ее безотказностью и восстанавливаемостью.
Безотказность программы характеризуется средним временем между возникновением отказов в функционировании программы, при этом аппаратура находится в исправном состоянии и работоспособна. Безотказность программы определяется ее корректностью (правильностью), и, следовательно, целиком зависит от наличия в ней ошибок, внесенных на этапах ее создания.
Восстанавливаемость программы определяется затратами времени и труда на устранение ошибок в программе и их последствий.
Ошибки программ могут быть разделены:
на ошибки, обусловленные ограниченными возможностями программы (отказ в получении результатов за заданное время или при заданных ограничениях по объему вычислений);
на логические ошибки (выражаются в получении неправильных результатов, не взирая на время и объем вычислений), причинами которых могут быть;
ошибки, скрытые в самой программе;
искажения входной информации:
при вводе с клавиатуры;
при вводе с первичных носителей;
из-за ошибок в документации (инструкции оператора);
неверные действия оператора, связанные с неправильной интерпретацией сообщений и неправильными действиями оператора в процессе диалога;
сбои в работе аппаратуры, на которой реализуется вычислительный процесс.
Способы обеспечения и повышения надежности программ могут быть разделены на следующие основные категории:
1) усовершенствование технологии программирования;
2) выбор алгоритмов, не чувствительных к различного рода нарушениям вычислительного процесса (использование алгоритмической избыточности);
резервирование программ — дуальное и N-версионное программирование, другие методы введения структурной избыточности;
контроль при вводе по диапазону изменения входных данных;
контроль за зацикливанием программ, возникновением самоблокировок и т.д.;
контроль и тестирование программ с последующей коррекцией.