Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ВТ_4 часть.doc
Скачиваний:
10
Добавлен:
16.09.2019
Размер:
550.91 Кб
Скачать

10.10. Взаимодействие систем технического обслуживания.

В МПС, снабжённой системой автоматического контроля, возникновение ошибок в каком-либо устройстве порождает сигнал ошибки.

С появлением этого сигнала приостанавливается выполнение программы целиком или только рабочей процедуры в неисправном устройстве.

При этом 1 в соответствующем разряде регистра ошибок указывает укрупнённо место, где обнаружена ошибка (устройство, узел, регистр и т.д.).

Сигнал ошибки инициирует работу системы восстановления.

Система автоматического восстановления во взаимодействии с системой автоматического контроля обычно выполняет следующие функции:

  1. распознавание характера обнаруженной ошибки, т.е. выяснение, вызвана ошибка случайным сбоем, перемежающимся или устойчивым отказом;

  2. организация "рестарта", т.е. продолжения выполнения программы путём повторения ошибочно выполненной микрооперации, команды или сегмента программы. Таким образом, устраняется ошибка в информации, вызванная сбоем;

  3. запись в память информации о сбое;

  4. при обнаружении отказа инициирование работы САД.

На САД в данном случае возлагается:

  1. локализация места отказа с заданной степенью подробности (например, до уровня сменной платы) и, если возможно, реконфигурация, т.е. отключение неисправного узла или устройства с передачей его функций другому соответствующему узлу или устройству;

  2. запись в память информации об отказе для последующей обработки.

Общую логику взаимодействия систем технического обслуживания можно представить в следующем виде: (рис. на следующей странице).

Первой выполняется процедура обработки сигнала прерывания от системы контроля.

Начинается эта процедура записью состояний регистров МП и старого

слова состояния программы

в соответствующие ячейки

памяти, а также выборкой

нового слова состояния про-

граммы системы

Запись ситуации в МПС в момент появления ошибки

восстановления.

Далее произ-

водится запись в

Распознавание характера ошибки путём повторения МК, команды или сегмента программы

специальные ре-

гистры или ячей-

ки памяти ситуа-

ции в МПС в мо-

Устойчивая ошибка?

Нет сбой

Оператор

мент обнаруже-

ния ошибки (за-

Да отказ

писывается сос-

тояние запомина-

Диагностические процедуры локализации неисправностей

ющих элементов

и шин передачи

Отказ устранён

Отказ лока лизован

данных неиспра-

Запись информации об отказе

Запись информации о сбое

вного устройст-

ва).

Возможна

Нет

Для распоз-

Возврат к программе

реконфигура-

навания характе-

Да

ция?

ра ошибки (сбой

Автоматическое отключение неисправ-ного устройства

Вывод сообщения о месте отказа

или отказ) необ-

ходимо повторить, может

быть даже несколько раз,

Вывод сообщения о причине отказа и сделанной реконфиг.

Действия оператора по устранению отказа

операцию, в которой обна-

ружилась ошибка.

С этой точки зрения

лучше всего, если МП и

система контроля выполнены таким образом, что проверяется правильность каждой микрооперации и вычислительный процесс останавливается на ошибочно выполненной микрооперации, которая может быть повторена.

Микрооперация (команда) может быть повторена, если не исказилась используемая в ней информация (операнды, адреса и т.д.), т.е. если не пройден "порог повторения".

Это проверяет входящая в систему программа обработки ошибок, которая по записанной ситуации, соответствующей появлению ошибки, определяет, пройден или нет порог повторения микрооперации или команды.

Если соответствующий порог пройден, то вместо микрооперации повторяется команда, а вместо команды – сегмент программы.

Последнее возможно, если программист предусмотрел в программе "контрольные точки", сохраняющие промежуточные данные и тем самым позволяющие повторить программу с данного места.

Если при повторении микрокоманды (команды, сегмента, программы) ошибка не повторяется, событие распознаётся как сбой и происходит возврат к точке прерывания программы.

Однако перед этим в память записывается дополнительная информация о состоянии вычислительной системы в момент сбоя (какие в это время выполнялись операции в периферийных и других устройствах, название программы, адрес команды, операнды, время).

Эта информация о ситуациях при сбоях и отказах накапливается во внешнем ЗУ и в последствии обрабатывается специальной программой, вырабатывающей определённые рекомендации обслуживающему персоналу.

Если при определённом числе повторений (например, 8) ошибка сохраняется, событие распознаётся как отказ и автоматически приводится в действие САД для определения места неисправности.

Диагностические процедуры могут включаться и вручную оператором.

После выявления места отказа проверяется возможность реконфигурации путём автоматического отключения неисправного устройства и передачи его функций другому устройству.

Если это возможно, производится реконфигурация системы, после чего выдаётся сообщение оператору об отказе и произведённой реконфигурации и происходит возврат к контрольной точке программы.

Если реконфигурация невозможна, САД инициирует на мониторе код неисправности.

Оператор, пользуясь справочником неисправностей, находит и заменяет неисправный блок, а затем включает диагностические процедуры.

Если отказ устранён, производится возврат к контрольной точке программы.