- •Основные понятия эксплуатационного обслуживания. Определения, виды обслуживания
- •2. Основные эксплуатационные и надёжностные характеристики эвм и эксплуатационного обслуживания. Численные показатели и области применения.
- •Методы оценки производительности эвм.
- •Способы повышения эксплуатационной надёжности.
- •Надёжность по. Причины отказов и типы ошибок, методы их устранения.
- •Иерархия процессов обслуживания эвм. Форма организации эксплуатационного обслуживания.
- •Подготовительный этап:
- •Эксплуатация эвм:
- •Формы эксплуатационного обслуживания эвм
- •7. Классификация систем автоматического контроля.
- •Функции и характеристики систем контроля. Виды контролируемых преобразований. Виды избыточности сак.
- •Методы контроля передачи информации. Преимущества, недостатки, техническая реализация. Контроль счётчиков.
- •Контроль комбинационных схем. Классификация и техническая реализация.
- •Самопроверяемые схемы контроля. Сущность метода. Техническая реализация схем на примерах. Диагностические средства системы автоматического контроля.
- •Диагностические средства проверки работоспособности схем контроля
- •Определение эффективности системы автоматического контроля эвм (методы, сущность, достоинства и недостатки). Методы оценки эффективности системы аппаратного контроля
- •Математический аппарат и техническая реализация контроля по модулю. Организация контроля алу по модулю. Классификация методов контроля по модулю и области их применения.
- •Методы построения схем свёрток по произвольному модулю (классификация, техническая реализация).
- •Система автоматического контроля процессора и алу.
- •18. Автоматическое восстановление вычислительного процесса после отказов. Методы реконфигурации озу, пзу, буферной памяти.
- •19. Автоматическое восстановление вычислительного процесса после отказов. Алгоритмические методы исправления одиночных и некоторых двойных ошибок в оп. Реконфигурация пу.
- •20. Структурное резервирование. Методы, их достоинства и недостатки. Области применения структурного резервирования.
- •Механизм обнаружения отказа и замещения резервным блоком может быть:
- •21. Методы контроля на основе самопроверяемого дублирования. Алгоритм, техническая реализация отказоустойчивых схем.
- •22. Методы защиты информации от несанкционированного доступа. Сущность методов, достоинства и недостатки.
- •23. Система диагностирования эвм. Классификация методов, сущность и определение методов, средства реализации и области применения.
- •24. Характеристики систем диагностирования. Оценка эффективности систем диагностирования.
- •25. Типы тестов, области их применения в зависимости от режимов работы процессора и состояния работоспособности эвм. Типы профилактических испытаний.
- •26. Диагностирование озу. Классические методы диагностирования озу. Определение состава тестов и оценка их эффективности.
- •27. Методы диагностирования озу, применяемые в ibm pc. Принципы организации тестирования ibm pc. Методы диагностирования озу, реализованные в программе MemTest-86.
- •28. Автоматическое накопление информации о машинных ошибках. Обработка и использование накопленной информации об ошибках в автоматизированных системах сбора и накопления информации об ошибках.
- •29. Организация профилактического обслуживания эвм. Профилактика дисков и дисководов. Основные правила работы с дисками.
- •30. Техника безопасности при работе в вц и ремонте. Обеспечение пожарной безопасности. Требования к помещениям и параметрам окружающей среды. Оборудование помещений в машинных залах
- •31. Работа с эксплуатационной документацией. Проведение планово-профилактического обслуживания.
- •32. Факторы, влияющие на работоспособность эвм и методы борьбы с ними (шумы, типы шумов, коррозия, помехи в источниках питания и другие).
- •33. Корректирующие коды. Классификация. Принципы формирования кода Хемминга (на примере) и техническая реализация аппаратуры для исправления одиночных ошибок.
- •34. Аппаратура и алгоритм исправления одиночных ошибок на основе кода ко-од на примере.
- •36. Самопроверяемая схема контроля оп по коду Хэмминга (аппаратура, алгоритм работы схемы на примере).
- •37. Обеспечение отказоустойчивости озу с применением корректирующих кодов (аппаратные методы исправления двойных ошибок в памяти методами логической перестановки адресов)
36. Самопроверяемая схема контроля оп по коду Хэмминга (аппаратура, алгоритм работы схемы на примере).
При работе системы контроля ошибки могут возникать как в основной аппаратуре, так и в самих схемах контроля. Для обнаружения ошибок в аппаратуре контроля в схему введем дополнительный (дублирующий) генератор КХ и формирования бит нечетности GKH2.
При записи:
- информация из ПР поступает в RgDI в виде 64-разрядного слова и 8 бит нечетности для каждого байта слова, а адрес для записи - в RgA;
- с выхода RgDI через MS1 слово поступает на генератор кода Хэмминга и бит нечетности GKH для формирования КХ СТ-С0 и контрольных бит нечетности байт К7-К0. На схеме сравнения (Сх.ср.) определяется правильность приема информации из ПР в RgDI путем сравнения бит контрольного кода нечетности, принятых из процессора, и бит нечетности, сформированных схемой GKH;
- если сигнал ошибки передачи по нечетности не выработан, то сформированный код Хэмминга СТ-С0 с выходов GKH вместе с информационными разрядами слова записывается в ОП;
- если выработан сигнал ошибки передачи по нечетности, то выполняется попытка повторной передачи информации из процессора с контрольными битами КК для классификации типа отказа: постоянный или случайный (сбой) (иногда до 8 раз);
- если отказ постоянный, то устанавливается триггер ошибки и вырабатывается сигнал прерывания от схем контроля, иначе запись слова и КХ СТ-С0 в ОП.
Чтение из ОП:
Из ОП считываются 64 бита слова и 8 бит КХ СТ-С0. Считанное 64-разрядное слово через MS1 поступает на схемы генератора кода Хэмминга и формирования бит нечетности байт.
Полученные в GKH биты СТ-С0н сравниваются со считанными из ОП битами СТ-С0сч. и при их несовпадении схема определения синдрома ошибки (Сх.ОСО) формирует код синдрома ошибок ST-S0, определяющего номер ошибочного бита в слове, а также тип ошибки на схеме классификации ошибок (одиночная или двойная).
Адрес слова ОП, его синдром ошибки и тип ошибки запоминаются в специальном регистре ошибок для последующей записи его значения в журнал ошибок ОС.
При одиночной ошибке схема определения вектора ошибки (Сх.ОВО) формирует код вектора ошибки Е, а в схеме коррекции ошибок выполняется ее исправление путем инверсии ошибочного бита, а также выполняется изменение бита нечетности того байта, в котором выполнена коррекция. Скорректированная информация поступает в RgRD, а из него в процессор.
Неисправимая (двойная) ошибка ОП вызывает установку бита ошибки в Тош и прерывание от схем контроля. Все случаи ошибок, обнаруженные при обращении к памяти, фиксируются в журнале ошибок ОС.
При чтении в пункте 1 считанное из ОП слово сначала поступает в RgDО, и параллельно выполняется алгоритм проверки работоспособности схем контроля, т.е. данные из RgDО через MS1 поступают на входы GKH1 для получения нового кода Хэмминга и бит нечетности считанного слова и параллельно для формирования нового кода Хэмминга и бит нечетности на входы GKH2. Полученные контрольные биты нечетности и кода Хэмминга СТ-С0 сравниваются на схемах сравнения (Сх.ср.2 и Сх.ср.3) и принимается решение о работоспособности аппаратуры контроля, т.е. если хотя бы одна схема сравнения вырабатывает сигнал неравенства кодов, то формируется сигнал прерывания от схем контроля и фиксируется тип ошибки в регистре ошибок.
