Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Самохин А.Ф. Эксплуатация цифровых вычислительных машин [учеб. пособие]

.pdf
Скачиваний:
11
Добавлен:
23.10.2023
Размер:
8.6 Mб
Скачать

- с о ­

управляющих импульсов в группах определяются структурой ЛУ.

Кроме управляющих импульсов, на элементы ИНН заведены выходы от шифратора. С целью упрощения схемы сравнения шифратор выдает код, дополняющий правильный код в регистре до нулей или единиц

(для одной группы команд - до нулей, для другой - до единиц).

Проверка правильности работы БУО выполняется подачей контроль­ ного импульса на ту или другую группу элементов И в зависимости от выполняемой операции (если в данной операции контрольный код дополняется до единиц - на I , если до нулей - на I I ) .

Эффективность контроля в данной схеме определяется не только избыточностью аппаратуры, но и рациональным группированием импульсов.

Рассмотрим теперь случай, когда в машине имеется АУ КК. В

этом случае контроль работы БУО может быть осуществлен за счет контроля результата операции при условии, что одноименные.

микрооперации в АУ чисел и АУ КК управляются не одними и теми

же импульсами. Если это условие не соблюдено, то пропадание ка­ кого-либо импульса может быть не обнаружено, так как невыполне­ ние этой микрооперации вызовет равноценное изменение в резуль­ тате операции над числами и кодами.

Если блок управления вырабатывает раздельные серии импуль­

сов для ЛУ чисел и АУ КК, то это условие соблюдается, и по ре­ зультату операции можно судить о правильности работы БОУ, за исключением двух случаев: когда БОУ вместо одной операции выпол­ няет другую и когда в АУ чисел возникнет необнаружиыая ошибка.

Если АУ чисел и АУ КК управляются одной серией импульсов, то выполнение указанного выше условия можно обеспечить сдвигом вы­ полнения микрооперации в том и другом АУ друг относительно дру­ га . В этом случае пропадание какого-либо импульса вызовет нерав­ ноценные изменения в результатах. Для повышения эффективности контроля наряду с контролем по результату операции может быть осуществлен контроль по методике, рассмотренной в начале параг­ рафа.

§ 7 .7 . Принцип организации аппаратного контроля

Аппаратный контроль может быть либо локальным, когда

контролируется выполнение отдельных операций или работа от­ дельных, наиболее важных устройств, либо сквозным, когда о контролю подвергаются все устройства и все операции.

 

Сквозной хсонтроль может быть организован двумя способами:

-

с

использованием распределенного принципа размещения эле-ч

ментов

аппаратного контроля

свертки и схем сравнения) |

-

с

использованием сосредоточенного принципа построения ап­

паратуры контроля, когда имеется

одно контрольное устройство,

-152-

через которое пересылаются числа с целью проверки выполнения различных действий (считывания, пересылки, выполнения арифмети­ ческих действий и т . д . ) .

Достоинством первою способа является возможность обнаруже­ ния неисправности или сбоя в момент их возникновения и возмож­ ность без дополнительных средств локализовать место неисправнос­ ти с точностью до узла.

Недостаток в том, что требуется дополнительная затрата ап­ паратуры до 15 * 20$ от основного объема оборудования машины.

Во втором случае экономится аппаратура, но снижается опера­ тивность и разрешающая способность системы контроля.

§ 7 .8 . Структура устройства фиксации, анализа и исправления ошибок и последовательность действий по выявленному

сигналу сбоя

Исправление ошибок, возникающих вследствие сбоев , может

быть организовано так же, как и контроль с помощью схемных оредств. Однако при этом появляется необходимость введения в

ЭЦВЫ весьма большой аппаратурной избыточности. Поэтому в совре­

менных ЭЦШ обычно схемными методами только фиксируют появление ошибки, исправление же осуществляют с использованием специальных

исправляющих программ. Для этой цели в ЦВМ кроме системы контро­ ля вводится устройство фиксации и анализа сбоя , которое совм ест-

ио о исправляющей программой обеспечивает:

- фиксацию выявленных аппаратным контролем ошибок и кодировку места возникновения сбоя (в каком из устройств машины произошел

-153

с б о й ); - подачу сигнала прерывания основной программы и включение

специальной подпрограммы анализа и исправления последствий сбоя ;

-

накопление информации об

ошибке путем повторных исправлений

с целью определения характера

сбоя (случайный или систематичес­

кий) ;

 

 

 

 

-

передачу управления основной рабочей программе,

включение

диагностического

теста шш останов машины.

 

 

Схема такого

устройства

представлена на рисунке

7 .5 .

Рис. 7.5.

'3*ж.8Л

-Ч5Ч-

В устройство

входят

следующие у алы и элементы:

-

регистр сбоев

на число разрядов " к ",

равное количеству

контрольных

точек, установленных в машине;

 

-

блок

индикации выявленного сбоя (на

схеме не показал);

-счетчик сбоев;

-схема ШИ, объединяющая выходы всех схем сравнения,

выявляющих сбои в контролируемых устройствах машины;

-

блок индикации счетчика сбоев (на

схеме не показан);

-

триггеры

T j и Т2 , обеспечивающие

блокировку

входов

счетчика сбоев

и регистра

сбоев;

 

 

-

группы элементов И,

блокирующих прохождение

сигналов

на регистр сбоев и вход счетчика сбоев.

На регистр сбоев в позиционном коде принимаются и фикси­ руются сигналы сбоя, выявленного аппаратурой контроля, каждому контролируемому узлу и устройству в регистре отведен один фик­ сированный разряд, следовательно, каждой контрольной точке соответствует код, имеющий единицу только в одном разряде. Кро­ ме кодовых комбинаций, соответствующих сбоям в контролируемых устройствах, в коде моцут быть предусмотрены комбинации, соот­ ветствующие неисправностям в контрольной аппаратуре, если в последней имеются контролирующие узлы.

Для передачи содержимого регистра сбоя в МОЗУ служит груп­ па выходных элементов И. Триггер Tg и элемент И служат для блокировки входов регистра сбоя после поступления первого сиг­ нала сбоя . Разблокировка входов осуществляется начальной коман-.

дой повторного цикла вычисления. Сигналы сбоя от всех контроль­ ных точек поступают через схему МИ на вход счетчика сбоев.

Триггер T j и элемент И обеспечивают блокировку входа счетчика

сбоев после поступления первого сигнала сбоя . Разблокировка

- /55-

осущесталяется начальной командой повторного вычисления опера­ тора.

Приведенная выше схема и налагаемая ниже последовательность действий по сигналу сбоя предполагает разбивку программы па от­ дельные участки (операторы) с сохранением в МОЗУ информации,

необходимой для повторения кавдого оператора.

Сигнал сбоя, выявленный аппаратурой контроля, поступает в определенный разряд Рг сбоя и через схему МИ п элемент И на вход счетчика сбоев. Одновременно этот сигнал подается в устройство прерываний для прерывания основной рабочей програм­ мы и передачи управления подпрограмме исправления ошибок,

имеющей наивысший приоритет. После прохождения первого сигна­ ла сбоя триггеры Tj и Т2 перебрасываются и блокируют поступ­ ление сигналов на входа регистра сбоев и счетчика сбоев, что необходимо для того , чтобы за время передачи управления под­ программе анализа исправления ошибок повторные сигналы сбоев,

которые могут явиться следствием первого сбоя , не исказаяи содержимое Рг сбоя и Сч сбоя. Переход к подпрограмме не мо­ жет быть завершен до выполнения текущей операции и если сбой произошел в начальной микрооперации, то в поел едущей он мо­ жет проявиться как сбой в других устройствах, участвующих в данной операции.

Одной из первых команд подпрограммы анализа сбоев и исправления ошибок осуществляется запись содержимого Сч АК в определенную ячейку МОЗУ, а затем производится опрос регис­ тра сбоев и пересылка его содержимого в фиксированную ячей­ ку МОЗУ. По записанному содержимому Сч АК определяется номер команда, в которой произошел сбой.

Первый сбой машина квалифицирует как случайный и поэтому пытается исправить его повторением определенного участка про-

- 156-

грашы (оператора). Для этой цели следующая команда подпрограммы осуществляет безусловный переход к начальной команде оператора,

номер начальной команды которого хранится в фиксированной ячейке МОЗУ. Для возможности повторешш данного оператора в МОЗУ должна сохраняться и необходимая исходная информация. Начальной коман­ дой оператора или специальной командой подпрограммы гасится Рг сбоев и разблокируются входа Рг сбоев и Сч сбоев.

Вели при повтороном выполнении данного оператора сигнал сбоя не повторился, то , следовательно, это был случайный сбой, который исправлен, и управление передается основной рабочей программе.

Содержимое регистра сбоев и счетчика сбоев при этом гасится.

Для повышения надежности вычислении может быть предусмотре­ но повторное вычисление и сравнение результатов. Совпадение ре­ зультатов при отсутствии сигналов сбоя свидетельствует об исправ­ лении ошибок,и вычисление продолжается по основной программе.

Если же при повторении оператора сигнал сбоя фиксируется в каждом цикле (в течение нескольких циклов), то необходимо, прел;- .

де чем квалифицировать его как систематический, определить от одного ли устройстиа приходит сигнал сбоя. Распознавание сигна­ ла по указанному признаку можно осуществить, если не стирать со ­ держимое Рг сбоев.Проверкой его содержимого на наличие только одной единицы в коде, что легко осуществляется. Если содержимое Рг сбоев стирается, то анализ может быть проведен сравнением предыдущего и последующего кода сбоев, фиксируемых в ячейках МОЗУ. Для повышения достоверности может быть предусмотрено срав­ нение номеров команд, при которых произошел сбой.

При фиксации каждого сбоя обычно в машине осуществляется печать содержимого регистра ошибок и номера команда, при выпол­ нении которой произошел сбой. Блок-схема подпрограммы анализа сбоев н исправления ошибок показана на рис. 7 .6 .

- 157-

Vuc. 7.Б .

Работа программы очевидна. Блоки 2, 3 и 4 позволяют вы­ яснить, в одном и том не, или в разных устройствах возникнет

сбой при повторном просчете. Если сбой повторился некоторое за­ данное число раз, то счетчик сбоев выдает сигнал о том, что в устройстве возникла неисправность и необходимо принять меры к ее устранению. При этом, если в машине предусмотрено резервирова­ ние, то этим сигналом автоматически может быть подключен резерв­ ный блок. Если резервирование не предусмотрено, то включается

диагностический тест , локализуется место неисправности с выпе-

-158 —

чатыванием соответствующей информащш, и машина выходит на остан нов.

Если при повторных выполнениях оператора сбои возникают от

разных устройств, то

это

обычно свидетельствует о том, что

маши­

на не работоспособна,

и

ее следует остановить для ремонта.

Ис­

ключение здесь представляет пропадание одного из импульсов в УУ,

которое монет вызвать одновременные сбои в разных устройствах.

Поэтому, если будет зафиксирован сбой в УУ, следует продолжать

повторения циклов до переполнения счетчика сбоев и только после этого производить переключение. Заметим, что в принципе не обя­ зательно долото быть организовано повторение операторов. Может быть организовано повторение команды, в которой произошел сбой.

Для этой

цели номер команды со Сч АК также переписывается в МОЗУ,

из него

вычитается единица и команда передается для выполнения

вСч АК (вычитание может быть осуществлено и непосредственно

вСч АК). Дтя того , чтобы иметь возможность повторить операцию,

очевидно, в АУ необходимо иметь дополнительный регистр, в котором хранится исходное число для данной операцш до конца выполнения операции. Так как операция выполняется достаточно быстро, а сбой

может быть достаточно длинным, то целесообразно выполнять повто­ рение с некоторой задержкой Т , порядка десятых долей секун­ ды. В остальном работа схемы и подпрограммы аналогична работе

с onepaTopai.ni.

В некоторых ЦВМ при выявлении сигнала сбоя проводится ана­ лиз, на какой микрооперации произошел сбой. Если в результате этой микрооперации исходная информация не разрушена, повторя­ ется данная операция (например, результат в МОЗУ еще не записан),

если информация разрушена, повторяется весь блок программы.

Для определения рабочего состояния машины в устройство фик­ сирования сбоев целесообразно ввести еще один счетчик сбоев, в

- *59-

который засш1акгася все сигналы сбоя. Этот счетчик должен сбрасы­ ваться через определенные интервалы наработки машины. Если за установленный интервал наработки, в счетчике возникнет перепол­ нение, то это свидетельствует о низкой работоспособности машины и, следовательно, о необходимости остановки ее на ремонт.

При разработке системы анализа и исправления ошибок, необ­ ходимо решить, какое количество повторных просчетов достаточно для установления (Такта наличия отказа.

Если принять допущение, что длительность помехи меньше длительности выполнения операции, то сбои, возникающие при вы­ полнении различных операций, можно очитать независимыми событи­ ями. Тогда вероятность появления сбоя при выполнении некоторого оператора можно выразить еле,дующей формулой:

где

М - количество

операций в операторе,

 

Р- - вероятность появления

сбоя в одной операции.

Так как вероятность появления сбоя

в одном операторе - величина

достаточно малая, то можно записать:

Вероятность появления сбоя

в J

контролируемом устройстве

в "к" раз меньше (если вероятность

сбоя в них одинакова), т . е .

 

Р

-

Ш

 

Вероятность появления сбоев в одном и том же устройстве в двух

.просчетах оператора будет

Соседние файлы в папке книги из ГПНТБ