- •Основные понятия эксплуатационного обслуживания. Определения, виды обслуживания
- •2. Основные эксплуатационные и надёжностные характеристики эвм и эксплуатационного обслуживания. Численные показатели и области применения.
- •Методы оценки производительности эвм.
- •Способы повышения эксплуатационной надёжности.
- •Надёжность по. Причины отказов и типы ошибок, методы их устранения.
- •Иерархия процессов обслуживания эвм. Форма организации эксплуатационного обслуживания.
- •Подготовительный этап:
- •Эксплуатация эвм:
- •Формы эксплуатационного обслуживания эвм
- •7. Классификация систем автоматического контроля.
- •Функции и характеристики систем контроля. Виды контролируемых преобразований. Виды избыточности сак.
- •Методы контроля передачи информации. Преимущества, недостатки, техническая реализация. Контроль счётчиков.
- •Контроль комбинационных схем. Классификация и техническая реализация.
- •Самопроверяемые схемы контроля. Сущность метода. Техническая реализация схем на примерах. Диагностические средства системы автоматического контроля.
- •Диагностические средства проверки работоспособности схем контроля
- •Определение эффективности системы автоматического контроля эвм (методы, сущность, достоинства и недостатки). Методы оценки эффективности системы аппаратного контроля
- •Математический аппарат и техническая реализация контроля по модулю. Организация контроля алу по модулю. Классификация методов контроля по модулю и области их применения.
- •Методы построения схем свёрток по произвольному модулю (классификация, техническая реализация).
- •Система автоматического контроля процессора и алу.
- •18. Автоматическое восстановление вычислительного процесса после отказов. Методы реконфигурации озу, пзу, буферной памяти.
- •19. Автоматическое восстановление вычислительного процесса после отказов. Алгоритмические методы исправления одиночных и некоторых двойных ошибок в оп. Реконфигурация пу.
- •20. Структурное резервирование. Методы, их достоинства и недостатки. Области применения структурного резервирования.
- •Механизм обнаружения отказа и замещения резервным блоком может быть:
- •21. Методы контроля на основе самопроверяемого дублирования. Алгоритм, техническая реализация отказоустойчивых схем.
- •22. Методы защиты информации от несанкционированного доступа. Сущность методов, достоинства и недостатки.
- •23. Система диагностирования эвм. Классификация методов, сущность и определение методов, средства реализации и области применения.
- •24. Характеристики систем диагностирования. Оценка эффективности систем диагностирования.
- •25. Типы тестов, области их применения в зависимости от режимов работы процессора и состояния работоспособности эвм. Типы профилактических испытаний.
- •26. Диагностирование озу. Классические методы диагностирования озу. Определение состава тестов и оценка их эффективности.
- •27. Методы диагностирования озу, применяемые в ibm pc. Принципы организации тестирования ibm pc. Методы диагностирования озу, реализованные в программе MemTest-86.
- •28. Автоматическое накопление информации о машинных ошибках. Обработка и использование накопленной информации об ошибках в автоматизированных системах сбора и накопления информации об ошибках.
- •29. Организация профилактического обслуживания эвм. Профилактика дисков и дисководов. Основные правила работы с дисками.
- •30. Техника безопасности при работе в вц и ремонте. Обеспечение пожарной безопасности. Требования к помещениям и параметрам окружающей среды. Оборудование помещений в машинных залах
- •31. Работа с эксплуатационной документацией. Проведение планово-профилактического обслуживания.
- •32. Факторы, влияющие на работоспособность эвм и методы борьбы с ними (шумы, типы шумов, коррозия, помехи в источниках питания и другие).
- •33. Корректирующие коды. Классификация. Принципы формирования кода Хемминга (на примере) и техническая реализация аппаратуры для исправления одиночных ошибок.
- •34. Аппаратура и алгоритм исправления одиночных ошибок на основе кода ко-од на примере.
- •36. Самопроверяемая схема контроля оп по коду Хэмминга (аппаратура, алгоритм работы схемы на примере).
- •37. Обеспечение отказоустойчивости озу с применением корректирующих кодов (аппаратные методы исправления двойных ошибок в памяти методами логической перестановки адресов)
28. Автоматическое накопление информации о машинных ошибках. Обработка и использование накопленной информации об ошибках в автоматизированных системах сбора и накопления информации об ошибках.
Для повышения эффективности обслуживания ЭВМ предусматриваются средства автоматического накопления информации об ошибках при работе ВС с целью получения статистики ошибок для выявления наиболее вероятных источников ошибок, помех, ненадежных узлов, а также для локализации причин случайных сбоев и перемежающихся отказов.
Для автоматического накопления информации об ошибках в составе ОС предусмотрены специальные средства регистрации и обработки различных типов ошибок в специальных системных журналах ошибок (обычно это область памяти на резидентном магнитном диске).
Для обработки ошибок используются следующие программные средства:
обработчик машинных ошибок;
обработчик интерфейсных ошибок;
регистраторы сбоев и отказов ПУ;
регистратор перезагрузок ОС;
регистратор программных ошибок;
регистратор реконфигураций.
Обработчики машинных и интерфейсных ошибок предназначены для обработки информации об ошибках, обнаруженных схемами контроля. При этом в системном журнале осуществляется регистрация состояния устройства, в котором система контроля обнаружила ошибку и производится попытка восстановления вычислительного процесса.
Сначала ошибки регистрируются в отдельной области ОП или специальном быстродействующем буфере памяти, а затем переписывается в системный журнал ошибок на магнитный диск. В дальнейшем информация из системного журнала ошибок может переписываться в "истории" для исключения потери информации и ее накопления за большой период времени эксплуатации.
Регистраторы выполняют функции определения статистики о сбоях и отказах в различных устройствах, например:
сбоев для каждого ПУ;
информации о неисправимых ошибках в ПУ;
информации о случаях динамической реконфигурации устройств и т.д.
о причине перезагрузки ОС, так как перезагрузка ОС равносильна по своим последствиям отказу системы, причинами которой могут быть:
неисправность питания;
ошибки системных программ;
ошибки аппаратуры;
ошибки носителя данных;
ненормальное завершение начальной загрузки;
ошибки оператора;
ошибки в программах пользователя и другие.
Программные средства обработки ошибок включают два режима использования зарегистрированной информации об ошибках: независимую и системную программы.
Системные программы обрабатывают информацию из журнала ошибок с резидентного диска и позволяют получить статистику об ошибках только за последний период времени, а также копируют содержимое системного журнала на сменный магнитный носитель (магнитную ленту).
Независимая программа работает с лентами "истории" и " накопления".
Результатом работы данных программ является:
обобщенная и систематизированная информация о сбоях и отказах:
- за заданный интервал времени;
- по периферийным и внешним устройствам;
- распечатку истории сбоев и отказов за заданный промежуток времени с краткой характеристикой задания, порта ПУ, команды, на которой произошла ошибка, а также действий системы и т.д.
Все эти данные используются в дальнейшем для:
усовершенствования ЭВМ;
проведения мероприятий по повышению качества и эффективности обслуживания;
создания банка симптомов ошибок.
