- •Основные понятия эксплуатационного обслуживания. Определения, виды обслуживания
- •2. Основные эксплуатационные и надёжностные характеристики эвм и эксплуатационного обслуживания. Численные показатели и области применения.
- •Методы оценки производительности эвм.
- •Способы повышения эксплуатационной надёжности.
- •Надёжность по. Причины отказов и типы ошибок, методы их устранения.
- •Иерархия процессов обслуживания эвм. Форма организации эксплуатационного обслуживания.
- •Подготовительный этап:
- •Эксплуатация эвм:
- •Формы эксплуатационного обслуживания эвм
- •7. Классификация систем автоматического контроля.
- •Функции и характеристики систем контроля. Виды контролируемых преобразований. Виды избыточности сак.
- •Методы контроля передачи информации. Преимущества, недостатки, техническая реализация. Контроль счётчиков.
- •Контроль комбинационных схем. Классификация и техническая реализация.
- •Самопроверяемые схемы контроля. Сущность метода. Техническая реализация схем на примерах. Диагностические средства системы автоматического контроля.
- •Диагностические средства проверки работоспособности схем контроля
- •Определение эффективности системы автоматического контроля эвм (методы, сущность, достоинства и недостатки). Методы оценки эффективности системы аппаратного контроля
- •Математический аппарат и техническая реализация контроля по модулю. Организация контроля алу по модулю. Классификация методов контроля по модулю и области их применения.
- •Методы построения схем свёрток по произвольному модулю (классификация, техническая реализация).
- •Система автоматического контроля процессора и алу.
- •18. Автоматическое восстановление вычислительного процесса после отказов. Методы реконфигурации озу, пзу, буферной памяти.
- •19. Автоматическое восстановление вычислительного процесса после отказов. Алгоритмические методы исправления одиночных и некоторых двойных ошибок в оп. Реконфигурация пу.
- •20. Структурное резервирование. Методы, их достоинства и недостатки. Области применения структурного резервирования.
- •Механизм обнаружения отказа и замещения резервным блоком может быть:
- •21. Методы контроля на основе самопроверяемого дублирования. Алгоритм, техническая реализация отказоустойчивых схем.
- •22. Методы защиты информации от несанкционированного доступа. Сущность методов, достоинства и недостатки.
- •23. Система диагностирования эвм. Классификация методов, сущность и определение методов, средства реализации и области применения.
- •24. Характеристики систем диагностирования. Оценка эффективности систем диагностирования.
- •25. Типы тестов, области их применения в зависимости от режимов работы процессора и состояния работоспособности эвм. Типы профилактических испытаний.
- •26. Диагностирование озу. Классические методы диагностирования озу. Определение состава тестов и оценка их эффективности.
- •27. Методы диагностирования озу, применяемые в ibm pc. Принципы организации тестирования ibm pc. Методы диагностирования озу, реализованные в программе MemTest-86.
- •28. Автоматическое накопление информации о машинных ошибках. Обработка и использование накопленной информации об ошибках в автоматизированных системах сбора и накопления информации об ошибках.
- •29. Организация профилактического обслуживания эвм. Профилактика дисков и дисководов. Основные правила работы с дисками.
- •30. Техника безопасности при работе в вц и ремонте. Обеспечение пожарной безопасности. Требования к помещениям и параметрам окружающей среды. Оборудование помещений в машинных залах
- •31. Работа с эксплуатационной документацией. Проведение планово-профилактического обслуживания.
- •32. Факторы, влияющие на работоспособность эвм и методы борьбы с ними (шумы, типы шумов, коррозия, помехи в источниках питания и другие).
- •33. Корректирующие коды. Классификация. Принципы формирования кода Хемминга (на примере) и техническая реализация аппаратуры для исправления одиночных ошибок.
- •34. Аппаратура и алгоритм исправления одиночных ошибок на основе кода ко-од на примере.
- •36. Самопроверяемая схема контроля оп по коду Хэмминга (аппаратура, алгоритм работы схемы на примере).
- •37. Обеспечение отказоустойчивости озу с применением корректирующих кодов (аппаратные методы исправления двойных ошибок в памяти методами логической перестановки адресов)
18. Автоматическое восстановление вычислительного процесса после отказов. Методы реконфигурации озу, пзу, буферной памяти.
В современных компьютерах все устройства строятся по модульному принципу, что позволяет в ряде случаев при отказе какого-либо модуля выполнить реконфигурацию технических средств и продолжить вычислительный процесс при ухудшенных характеристиках. Особенно данное свойство характерно применительно к памяти ЭВМ, которая имеет иерархическую структуру, а также к сопроцессорам, функции которых в случае необходимости может на себя взять ЦП.
Выделим следующие способы восстановления работоспособности ЭВМ при отказах без ремонта:
методы логической перестановки адресов: ручная перестановка (для СИС); управляемая логическая перестановка адресов; автоматическая логическая перестановка адресов;
исправление одиночных и некоторых двойных ошибок с помощью корректирующих кодов: алгоритмические методы; аппаратурные методы;
метод замещения неисправной БИС памяти;
методы резервирования;
реконфигурация ОП при отказе одного из модулей памяти;
исключение из работы отказавших ячеек памяти;
переадресация в исправный блок;
отключение части или всей буферной (кэш) памяти при ее отказе;
исправление отказов в ПЗУ;
альтернативные алгоритмы выполнения операций;
реконфигурация ПУ.
Реконфигурация ОП при отказе одного из модулей памяти. ОП и структурно и конструктивно строится по модульному принципу в виде байтных модулей, что позволяет наращивать ее емкость применительно к задачам пользователя. При выходе из строя одного из модулей (его ячеек) осуществляется логическое переключение модулей путем помещения неисправного модуля в конец адресного пространства и указания нового предела емкости ОП, доступной ОС.
Исключение модуля осуществляется при инициализации ОС, так как предварительно выполняются тесты самодиагностирования, определяющие неисправные модули и выполняющие реконфигурацию ОП.
Исключение из работы отказавших ячеек памяти.
При страничной организации памяти для каждой страницы в дескрипторе страницы можно предусмотреть бит недоступности страницы d.
При обнаружении неисправных ячеек при диагностировании или от схем контроля ОС отмечает страницу в ее дескрипторе как недоступную.
Переадресация в исправный блок. Автоматическая переадресация в исправный блок памяти выполняется с помощью инверсии, например старшего бита адреса. При этом объем доступной памяти модуля уменьшится вдвое и все запросы к неисправной области памяти переадресуются в другую половину модуля памяти.
Отключение части или всей буферной (кэш) памяти при ее отказе. Буферные ЗУ (или часто говорят кэш-память, уточняя ее назначение) включаются между ОП и другим медленно действующим устройством и служит для сокращения среднего времени выборки данных из ОП.
В БЗУ каждой ячейке (строке данных) ставится признак достоверности данных d и бит признака исправности ячейки s. При обнаружении неисправной ячейки бит s сбрасывается и информация не записывается в данную область памяти (ячейку) БЗУ.
При отказе множества ячеек или адресной части БЗУ в регистрах управления процессора предусмотрены специальные биты, позволяющие отключать буферную память полностью и ЭВМ продолжает работу с ухудшенными характеристиками.
Исправление отказов в ПЗУ. При работе с ПЗУ выход из строя хотя бы одной из ячеек делает ВС неработоспособной и требует замены неисправной БИС ПЗУ. Однако существует возможность работы и с неисправными ячейками ПЗУ, так как информация хранимая по каждому адресу известна (карта прошивки на каждую БИС ПЗУ должна поставляться в технической документации).
При обнаружении отказа в накопителе ПЗУ ОС записывает правильное значение информации в полностью ассоциативное ЗУ, в котором хранится в поле тегов адрес неисправной ячейки ПЗУ, а в СОЗУ данных требуемая информация. Адрес параллельно поступает на адресные входы ПЗУ и АЗУ. Если вырабатывается сигнал А Тег, то он блокирует доступ к ПЗУ, а в RgO поступают данные, считанные из блока СОЗУ данных АЗУ.
Альтернативные алгоритмы выполнения операций. Так как современные компьютеры в своем составе имеют множество сопроцессоров для увеличения производительности ВС, а также устройства обработки данных, которые строятся по алгоритмам с RISС архитектурой, то появляется возможность за счет алгоритмической избыточности на одном устройстве выполнять функции другого, но с ухудшенными характеристиками по быстродействию. Это позволяет при выходе из строя одного из устройств его функции переадресовать на другое устройство.
