![](/user_photo/_userpic.png)
книги из ГПНТБ / Самохин А.Ф. Эксплуатация цифровых вычислительных машин [учеб. пособие]
.pdf-so-
характера операции, при которой они возникли. Так, при переда че информации между отдельными устройствами машины и при хране нии ее в запоминающем устройстве одиночная ошибка состоит в изменении содержимого одного двоичного разряда. Если же измене
нию подверглись несколько разрядов, то такая ошибка называется групповой: двухкратной, трехкратной и т .д . Таким же образом
определяются одиночные и групповые ошибки в результатах пораз рядных логических операций.
Иначе обстоит дело с ошибками в результатах арифметических
операций. При выполнении этих операций ошибка, возникшая в од ном разряде, из-за переносов может привести к тому, что содер
жимое ряда разрядов будет отличаться от истинного. Тем не ме нее, такие ошибки понимают как одиночные, ибо разность между
правильным и ошибочным результатом будет иметь единицу только в одном разряде. Например, правильный результат должен быть Ю П И , а получено число 110000. Они отличаются в пяти позици ях, но их разность равна 000001, что свидетельствует об одиноч ной ошибке в младшем разряде.
Групповыми считаются две и более ошибки, которые .ф оизо-
пли при выполнении одной операции независимо в нескольких раз рядах (не из-за переносов).
Наиболее просто обнаруживаются и исправляются одиночные ошибки. С повышением кратности их обнаружение и исправление ста новится все более сложным. Вместе с тем, вероятность появления ошибок с увеличением кратности уменьшается.
Для машин параллельного действия можно считать возникнове ние ошибок в отдельных двоичных разрядах независимыми случайны ми событиями, имеющими одинаковую вероятность. Тогда для ошибок
L-Я кратности в Л -разрядном числе справедлив биномиальный
2.1-
закон |
распределения |
[/ |
. n-i |
|
г |
||
где |
Qi - пероптность ошибки |
|
I ~й кратности в числе, |
-вероятность ошибки в отдельном разряде в течение одной операции,
|
/7 - разрядность слова. |
|
|
|
Из |
формулы видно, что при |
малых (реальных) |
значениях |
на |
ибольшую вероятность имеет |
случай одиночной |
ошибки. |
|
|
|
Для машин последовательного действия положение осложняет |
|||
ся |
тем, что ошибки в разных разрядах происходят в разное |
время. |
Поэтому вероятность возникновения ошибок зависит от быстродейст вия машины и продолжительности сбоя. Во всяком случае, следует ожидать, что вероятность групповых сбоев будет выше, чем в пре дыдущем случае, но вероятность возникновения ошибок с увеличени ем кратности также уменьшается. Несколько большее значение ве роятность возникновения групповых ошибок имеет место в накопите лях на магнитной лепте, барабанах и дисках.' Это объясняется, с
одной с т о р о т , тем, что запись в этих накопителях ведется обычно последовательно-параллельно, и, с другой стороны, тем, что чаще всего ошибки здесь возникают из-за повреждений поверхности носи теля и попадания под головки пылинок, которые по своим разме рам обычно больше места, занимаемого одним разрядом. Указанное разделение на одиночные и групповые ошибки приходится обычно учитывать не только при выборе систем контроля ЭВМ, но и в практике эксплуатации при поиске неисправностей.
Наконец, следует обратить внимание еще на один признак де ления ошибок. Ошибка проявляется либо в наличии нуля вместо еди ницы, либо единицы вместо нуля. При этом вероятность появления
-22-
тех и других ошибок может бить равновероятной или не равнове роятной в зависимости от исполнения того или иного устройства.
Если |
позаимствовать терминологию, применяемую для каналов |
свя |
|
зи, |
то в первом случае устройство можно назвать симметричным, |
||
во втором - несимметричным |
относительно двоичного кода. Напри |
||
мер, |
в регистре, собранном |
на полупроводниковых триггерах, |
ве |
роятность появления как той, так и другой ошибок равна. |
|
В накопителе на магнитной ленте при записи по двум уровням с промежутками изменение воздушного зазора или отказ усилителей записи и чтения приводит только к пропаданию единиц, т .е ;
устройство оказывается резко несимметричным. Рассмотренное об стоятельство так же, как и предыдущие, следует учитывать при создании системы контроля и в процессе поиска неисправностей.
§ 2 .2 . Задачи контроля работы ЭЦВМ
Проблема контроля работы ЭЦВМ имеет много общего с пробле мой контроля передачи информации по каналам связи, как там, так и здесь контроль служит для обнаружения и исправления ошибок.
Однако, контроль работы ЭЦВМ более сложен, так как здесь прихо дится контролировать разнородные по характеру операции.
Во-первых, в машине происходит пересылка и хранение инфор мации. Сюда относится в^од информации в ЭЦВМ, вывод из ЭЦВМ,
запись и чтение из запоминающих устройств, пересылка из одних устройств машины в другие. Методы обнаружения ошибок в этом случае те же, что и при передаче по каналам связи. В обоих слу чаях необходимо убедиться в том, что слово осталось неизменным.
Во-вторы^ в машине над информацией производятся арифме тические и логические действия, в результате которых возникает
-23-
новая информация. Таким образом, возникает необходимость конт роля правильности получения результатов.
В-третьих, кроме обрабатываемой информации в ЭЦВМ существу
ет управляющая информация - программа. С точки зрения контроля последние два вида информации отличаются друг от друга. Ошибка
в программе, как правило, приводит к более тяжелым последстви ям. Поэтому система контроля должна, в первую очередь, обеспе чить защиту программы и ее выполнения.
В-четвертых, как обрабатываемая информация, так и програм ма, хранятся в памяти по определенным адресам. Ошибка в адресе может привести к весьма тяжелым последствиям. Поэтому возника ет задача контроля адресного тракта.
Наконец, в машине имеются широкие возможности автоматичес кого исправления ошибок. Поэтому система контроля должна пред усматривать выдачу управляющих воздействий для автоматического исправления ошибок.
Такое разнообразие операций, которые необходимо контроли ровать, обусловливает и разнообразие методов и средств, исполь зуемых при контроле ЭЦВМ.
С точки зрения вероятности возникновения ошибок различные устройства машины не одинаковы. Наиболее слабим местом, нужда ющимся в контроле, являются обычно накопители на магнитной лен те , диски на барабанах, а также устройства ввода и вывода.
Эти устройства обеспечиваются контролем в первую очередь.
§ 2 .3 . Классификация видов контроля ЭЦНМ
Для контроля ЦШ используется программный и аппаратный
- 2 4 -
методы контроля. Общей основой этих методов является: - использование избыточной информации.
Под информационной избыточностью понимается наличие по полнительного колкче( тва символов или сигналов по сравнению с минимально необходимым для решения задачи.
Аппаратной избыточностью является наличие дополните>н,ной ап паратуры кроме минимально необходимой .для выполнении основной задачи.
Информационная избыточность может быть получена либо за счет дополнительной затраты времени, либо за счет избыточной аппа ратуры:
-Применение двойного счета,
-Введение дополнительных контрольных разрядов.
Совокупность аппаратных и программных методов и средств,
обеспечивающих контроль достоверности информации, выдаваемой ЦВМ, контроль правильности функционирования отдельных устройств и машины в целом, а также автоматический поиск неисправности принято называть системой контроля ЦВМ.
Требования, предъявляемые к системе контроля, можно сфор
мулировать следующим образом. |
|
|
||
Система контроля в максимальном случае |
должна обеспечивать: |
|||
- |
автоматическое |
обнаружение Факта |
неправильной |
работы |
ЭВМ или устройства с |
точностью до нескольких операций |
ЭВМ; |
||
- определение характера сбоя (случайный или систематичес |
||||
кий); |
|
|
|
|
- |
устранение последствий случайных |
сбоев непосредственно |
впроцессе вычислений;
-локализацию (поиск) места неисправности с точностью до сменного блока при минимальной затрате времени.
- 2 5 -
Перечисленные требования в различных машинах удовлетво ряются в разной степени.
По характеру решаемых задач все средства, входящие в си стему контроля, можно разделить на средства обнаружения и исправления ошибок и на средства поиска и устранения неисправ ностей.
По характеру использования контроль можно разделить на контроль в рабочем режиме, т .е . в процессе решения задач, и
контроль в профилактическом режиме.
В зависимости от метода, положенного в основу контроля,
его можно разделить на следующие виды: программный, аппарат ный, или схемный, и комбинированный, в которм сочетаются программный и аппаратный виды контроля. Каждый из этих видов,
в свою очередь, разделяется на подвиды в зависимости от мето дов, выполняемых функций и средств, затрачиваемых на органи зацию контроля.
Классификация по назначению и видам контроля приведена на рис. I ,
Контроль в рабочем режиме предназначен для обнаружения и исправления ошибок, обнаружения отказов, а также для выяв ления неисправных блоков с целью автоматической замены их резервными.
Контроль в режиме профилактики предназначен для провер ки работоспособности машины, отыскания неисправных блоков и выявления малонадежных элементов и узлов машины.
Программный контроль предназначен для проверки вычисли тельного процесса и основан на использовании специальных ло гических методов и программ, контролируипих работу машины и правильность выполнения вычислительного процесса.
аак.0^7, •
- 2 6 -
Рис. 2.1.
Программно-логический контроль заключается в контроле ин формации, вырабатываемой в процессе вычислений на основе исполь зования избыточности исходной и промежуточной информации. Сюда относится повторный счет по всей или по части программы, ис пользование контрольных соотношений и т .д . Достоинствами этого вида контроля являются:
- отсутствие необходимости в избыточной аппаратуре;
-2 7 -
-возможность обнаружения случайных сбоев.
К недостаткам следует отнести:
- снижение производительности работы машины за счет рас ходования времени на контроль;
- загрузку памяти машины контрольными числами и вспомо гательными программами;
- возможность необнаружения ошибки в случае устойчивого сбоя или отказа;
- запаздывание в обнаружении збоя на время выполнения со ответствующего этапа вычисления;
- невозможность, в общем случае, локализации места не исправности.
Тестовый контроль - это проверка машины на работоспособ
ность с помощью испытательных программ. При выполнении тесто вых программ машина выполняет заданную последовательность опе раций, периодически сравнивая получаемые результаты с заранее известными. Задача теста - выявить неисправность в работе ма шины и по возможности локализовать место неисправности.
В отличие от программно-логического контроля тестовый контроль не проверяет правильность выполнения машиной основ ной программы, так как во время пуска теста счет по основной программе прекращается.
Тестовые программ, используемые в рабочем режиме, разде ляются на контролирующие и диагностические.
Контролирующие тесты предназначены для определения факта наличия неисправности в матине или устройстве.
Диагностические тесты служат для локализации места воз никновения неисправности и обеспечивают, таким образом, авто матический поиск неисправного элемента или блока и, если в
- 2 8 -
машине предусмотрено резервирование, автоматическое включение резерва. Входной информацией для включения диагностического теста является признак наличия неисправности, выработанный в
результате прогона контролирующего теста. Включение же конт
ролирующих тестов обеспечивается операционной системой ЭВМ или иными средствами, предусмотренными в системе.
|
Достоинствами системы тестового контроля являются: |
||
|
- |
возможность автоматизации поиска неисправности и заме |
|
ны отказавших блоков резервными; |
|
||
|
- отсутствие необходимости в дополнительной аппаратуре, |
||
кроме некоторого объема памяти. |
|
||
|
К недостаткам следует отнести: |
|
|
. , |
- |
невозможность обнаружения случайных сбоев в работе ос |
|
новной |
программы; |
|
|
|
- обнаружение неисправностей происходит не сразу после |
||
возникновения, а только в момент прогона |
тестов, т .е . с за |
||
держкой в среднем на половину периода, с |
которым пропускают |
||
ся |
тесты; |
|
|
|
- |
снижение производительности работы |
машины за счет за |
траты временила прогон тестов. |
|
||
|
Аппаратный, или схемный, контроль - |
такой способ контро |
ля, при котором машина контролируется автоматически с помошью введенного в ее структуру контрольного оборудования. Аппарат ный хонтроль позволяет контролировать все этапы работы маши ны при выполнении каждой операция, а также последовательность операций. Таким образом, аппаратный контроль позволяет обна руживать ошибку с точностью до операции и без запаздывания во времени.
Недостатком является необходимость введения в структуру
-29-
машины дополнительного оборудования. Аппаратный контроль под разделяется на оперативный (непрерывный), аппаратно-логичес кий, осуществляемый периодически, и встроенный.
Оперативный аппаратный контроль - такой контроль, который функционирует постоянно в процессе всей работы машины парал лельно с решением основной задачи.
Оперативный контроль может быть либо сквозным, когда конт ролю подвергаются все этапы работы машины (хранение, считыва ние, пересылка и переработка адресной, числовой и командной информации), либо локальным, когда контролю подвергаются отдель ные устройства машины.
По методу, положенному в основу оперативного контроля,
его можно разделить на
- контроль с использованием специальных кодов, - контроль с использованием специальных технических ре
шений.
Достоинствами оперативного аппаратного контроля являются:
-непрерывность контроля,
-способность обнаруживать случайные и систематические ошибки в момент их возникновения,
-способность локализовать место неисправности с точ
ностью до функционального узла, - способность автоматически устранять последствия слу
чайных сбоев непосредственно в процессе вычислений.
Недостатком является необходимость усложнения машины введением дополнительной аппаратуры.
Аппаратно-логический контроль организуется с использо ванием аппаратных средств, обеспечивающих при периодическом включении подачу в контролируемый узел заданной последователь-