книги из ГПНТБ / Нечаев А.Н. Устройство и работа электронных цифровых машин
.pdfрые позволили бы без существенных затрат машинного времени и дополнительного оборудования получать до стоверные результаты. Таким образом, проблема в изве стной степени решается путем уменьшения .непроизводи тельных потерь машинного времени на отладку про грамм, контроль машины, профилактическое обслужива ние, а также на обнаружение и ликвидацию неисправно стей, возникающих в процессе .эксплуатации машины.
Обеспечение надежности
Применение в ЭЦМ большого количества элементов, обладающих ограниченным сроком службы, совместная работа нескольких машин, использование ЭЦМ в систе
мах автоматического |
управления, а также хранение и |
обработка огромных |
объемов информации — все это |
делает проблему надежности ЭЦМ не менее важной, чем такие специфические для вычислительной техники во просы, как разработка структуры, логики.и принципов построения машин.
У п р а в л я ю щ и е м а ш и н ы требуют обеспечения надежности работы, во много раз превышающей надеж ность современных цифровых вычислительных машин. Неисправности и сбои, возникающие в управляющих машинах, могут привести к неправильной работе целых систем, что в некоторых случаях совершенно недопусти мо. Особенно это относится к машинам, входящим в ком плексы, которые должны обладать высокой степенью го товности и безусловной работоспособностью.
Эксплуатационная надежность характеризуется ве роятностью того, что машина в период работы сможет правильно и бесперебойно выполнять свои функции.
Существующие методы повышения надежности и контроля за правильностью работы машины позволяют создавать машины, отвечающие высоким требованиям эксплуатационной надежности.
К основным факторам, определяющим надежность эксплуатации, относятся электрическая и механическая надежность самой машины, вспомогательного оборудова ния и запасных частей, удобство эксплуатации, квалифи кация оператора и обслуживающего персонала.
■172
Простота и удобство эксплуатации машины зависят от конструктивного выполнения ее устройств, системы контроля за их работой (включающей в себя аппарат ный контроль, контрольные задачи, решаемые при рабо те, испытательные программы), а также от наличия вспомогательной аппаратуры, позволяющей быстро об наруживать и устранять возникшие в схемах неисправ
ности. |
высокой надежности машин |
осущест |
Обеспечение |
||
вляется в основном двумя путями: |
|
|
повышением |
их т е х н и ч е с к о й надежности, т. е. |
|
соответствующим выбором деталей и элементов, |
а также |
режимов их работы, отработкой максимально надежных и долговечных схем, использованием профилактического
контроля и др.; повышением с т р у к т у р н о й надежности, т. е. со
зданием такой структуры и логики работы машин и раз работкой таких методов вычислений, которые обеспечи вали бы правильность получаемых результатов даже при наличии в машине отдельных сбоев и ошибок.
При эксплуатации ЭЦМ различают два основных ви да ее неисправностей: вызванные отказом ее элементов, т. е возникшие в результате невозвратимого изменения параметров или выхода из строя электронной лампы, полупроводникового триода, сопротивления, конденсато ра и т п., и неисправности, проявляющиеся в виде крат ковременных сбоев в работе из-за ненадежных контак тов, всплесков питающих напряжений, выработки сла бых сигналов и других подобных причин.
Частота проявления отказав обусловлена сроком службы, режимом работы и количеством элементов в схемах машины. Для уменьшения числа неисправностей такого рода обычно стремятся использовать схемы с воз можно меньшим количеством элементов, обладающих к тому же длительным сроком службы и работающих в облегченных режимах.
Особенно большие неприятности при эксплуатации машин доставляют кратковременные сбои, так как опре делить причину и место их возникновения обычно бы вает. очень трудно. Вероятность появления сбоев может быть уменьшена' путем тщательного выполнения монта жа схем и уменьшения количества контактных соедине ний (это достигается использованием печатных схем), а
173
также применением жестких допусков на основные па раметры деталей и питание схем от стабилизированных источников. ч
Методы повышения технической надежности ЭЦМ в настоящее время достаточно хорошо разработаны и широко применяются на всех этапах проектирования, изготовления и эксплуатации машин. Для повышения технической надежности следует прежде всего вы бирать для схем высоконадежные детали, обладающие большим сроком службы (десятки и сотни тысяч часов), с малым отклонением основных параметров от номи нальных значений, минимальными изменениями пара метров от времени, температуры и режима работы, с хо рошими конструктивными показателями. Увеличение срока службы деталей к повышение надежности работы схем машины достигается путем устранения в процессе эксплуатации форсированных режимов работы деталей, обеспечения нормальных климатических и механических условий эксплуатации, а также путем создания достаточ ных запасов в отношении разброса и изменения харак теристик элементов.
Обслуживание машины значительно облегчается при стандартизации деталей и отдельных схем, применении легкозаменяемых деталей и блоков, при защите схем от перегрузок при включении машины или выходе из строя какой-либо детали. Блочная конструкция машины позво ляет улучшить рабочие характеристики устройств, так как дает возможность заменить любой неисправный блок запасным, предварительно отлаженным и проверенным. Максимальная стандартизация блоков по их логическим функциям и схемам дает возможность обходиться с меньшим количеством запасных блоков и упрощает на ладочную аппаратуру.
Для защиты элементов схем от перегрузок, способ ных вывести их из строя при включении и выключении устройств машины или при внезапном пропадании одно го из питающих напряжений, предусматривается блоки ровка подачи напряжений на устройства. Схемы .не должны содержать деталей, которые выходили бы из
строя при неисправности других, связанных о ними де талей и элементов.
Помимо мероприятий, направленных на улучшение качества отдельных элементов, конструкций и схем
174
ЭЦМ, для повышения надежности очень важно обеспе чить возможность предусматривать выход из строя от дельных элементов и деталей машины, а также опреде лять место неисправности с помощью специальной конт
ролирующей аппаратуры.
Достаточно высокая надежность работы машины в течение ближайшего периода времени обычно достигает ся проверкой правильности функционирования отдель ных устройств и всей машины в целом в режиме профи лактического контроля. Профилактический контроль заключается в том, что схемы машины проверяются в утяжеленном режиме. Например, при изменении напря жения в источнике тока выявляются и заменяются эле менты, изменившие свои параметры выше допустимых пределов. Характеристики и параметры применяемых деталей могут выходить за пределы допустимых значе ний в результате их естественного старения, воздейст вия температуры, влажности и т. п. Кроме того, при из готовлении деталей имеют место некоторые технологи ческие разбросы параметров, вследствие которых дейст вительные их значения отличаются от номинальных. По этому характеристики правильно рассчитанного схемно го элемента (даже с учетом отклонений параметров де талей от .номинальных значений) с течением времени так изменяются, что этот элемент начинает вносить ошибки в работу машины.
Опыт эксплуатации ЭЦМ, построенных «а электрон ных лампах, показывает, что наименее .надежными дета лями из числа применяемых в машине являются элек тровакуумные приборы (электронные лампы, электрон но-лучевые трубки, тиратроны и др.). В процессе работы они изменяют свои параметры постепенно., и наиболее ненадежные из них в режиме профилактического конт роля выявляются достаточно легко.
При разработке системы профилактического контро ля учитываются статистические данные о разбросе и ха рактере изменения параметров деталей в зависимости от времени их .работы. Способ профилактического конт роля выбирается на основе анализа амплитудных и ча стотных характеристик элементов схем и уточняется в процессе эксплуатации машины в зависимости от эффек тивности и частоты ее применения. Для удобства опре деления места неправильно работающего элемента и
175
коммутации цепей профилактического контроля схемы устройств разбиваются на участки в соответствии с ло гикой их работы и способом профилактического контро ля. Режим работы электронно-ламповых схем при про филактическом контроле устанавливается , путем измене ния напряжений, питающих схему (напряжения смещения на управляющих сетках электронных ламп, напряжения накала и др.), или путем изменения параметров сигналов, поступающих на вход проверяемых элементов (амплиту ды или частоты входных сигналов). Второй способ приме ним также и для полупроводниковых схем.
Контроль работы
Достоверность результатов машинного решения задач в значительной мере зависит от применяемых методов контроля за правильностью функционирования устройств и за работой программиста. Для получения правильных результатов все этапы решения задачи, начиная от со ставления программы и кончая обработкой отпечатанных результатов, должны тщательно контролироваться.
При программировании возможность появления оши бок так велика, что запрограммировать сложную задачу без единой ошибки практически не удается. Ошибка мо жет быть вызвана неправильным выбором метода реше ния задачи, она может заключаться в содержании команд, в порядке их выполнения или даже быть следст вием простой описки при записи программы на бланки. Поэтому перед вводом программы в машину все ошибки должны быть исправлены. Проверка должна выполнять ся программистом особенно тщательно, так как отлад ка ее на машине стоит очень дорого.
Продолжительность отладки программ зависит от разнообразия и сложности решаемых задач. Статисти ческие данные показывают, что практически время от ладки программ составляет в среднем 20% полного ма шинного времени. В связи с этим становится очевидным, что для эффективного использования машины наиболее выгодны задачи, решаемые по одной и той же програм ме и имеющие большое количество вариантов.
. Ошибки легко могут возникнуть и при нанесении про граммы на перфокарты или перфоленту с помощью
т
внешних устройств машины. Они могут быть следствием нечеткого написания программы на бланке, невниматель ности оператора, работающего на клавиатуре перфора тора, неисправности самого перфоратора. Большинство типов машин имеет специальные устройства и режимы работы для контроля подготовки данных: например, на бивка перфокарт или перфолент может производиться дважды с последующей проверкой их на совпадение при помощи контрольника или контрольно-считывающего устройства.
Решение задачи начинается с ввода программы и ис ходных числовых данных в машину. Передача больших объемов информации между устройствами ЭЦМ всегда сопряжена с опасностью возникновения в переданной информации ошибки или даже серии ошибок. Они могут быть вызваны сбоями в работе или неисправностями в цепях передачи чисел или команд и в устройствах ма шины. Поэтому выполнение машиной программы вычис лений также должно постоянно контролироваться.
Появление ошибок во время работы машины вызы вает искажения получаемых результатов и нарушает правильный ход вычислительного процесса. Основная цель контроля — возможно быстро и. точно определить возникшие ошибки. Наилучший контроль обнаруживает ошибку в том такте, в котором она произошла, а также точно указывает блок, в котором появилась неисправ ность.
Для контроля правильности обработки и передачи информации применяются различные методы контроля, которые можно, в зависимости от принципа использова
ния избыточной информации, разделить |
на две группы: |
|
программного контроля |
(самоконтроля) |
и аппаратного |
(схемного или встроенного) контроля. |
|
|
П р о г р а м м н ы й |
к о н т р о л ь использует избы |
|
точность исходной информации и для своей реализации |
требует дополнительного машинного времени. При про граммных методах контроля используются специальные приемы программирования, позволяющие обнаружить ошибки, возникающие в ходе вычислений. Выход из строя какого-либо элемента или кратковременное на рушение нормального функционирования машины вы зывает появление неправильных результатов, но при программном контроле не останавливает выполнения
12 д . Нечаев |
J77 |
программы. Останов машины может произойти только при нарушениях вычислительного процесса, приводящих к таким результатам, которые не могут быть представ лены в машине (например, переполнение разрядной сет ки при делении .на нуль, получение мнимого результата при извлечении квадратного корня из отрицательного числа .и т. п.). Продолжение вычислений над неправиль ными числами или по искаженной программе, приводя щее к наложению ошибок, затрудняет определение при чины их возникновения и места неисправности.
В современных электронных цифровых машинах при меняются следующие методы программного контроля: двойной счет, контроль обратным ходом решения задачи, контрольное суммирование, выполнение испытательных программ (тестов), контрольные соотношения по шагу интегрирования и подстановка вычисленных неизвестных линейного уравнения в исходное уравнение.
Последние три метода программного контроля приме няются лишь в тех случаях, когда это позволяет вид решаемой задачи.
Наиболее распространен программный контроль ме тодом двойного счета, применяемый при эксплуатации большинства существующих машин. Он заключается в том, что каждая задача решается дважды и результаты, полученные при выполнении отдельных участков про граммы, сравниваются между собой. При совпадении результатов машина автоматически переходит к выпол нению следующего участка программы, при несовпаде нии— останавливается, и оператор определяет причины, вызвавшие это несовпадение. После восстановления ра ботоспособности машины вновь выполняется тот же уча сток программы.
Применение этого метода контроля увеличивает вре мя решения задачи вдвое, что снижает эффективность использования машины. Поэтому, хотя метод контроля двойным счетом достаточно надежен при обнаружении
ошибок в вычислениях, экономически он очень невыго ден.
Контроль обратным ходом решения задачи приме нялся в некоторых электронных цифровых вычислитель ных машинах первых выпусков. Программная реализа ция этого метода заключается в том, что каждая опера ция над числами в следующем такте проверяется выпол-
178
пением обратной операции (сложение — вычитанием, ум ножение— делением и т. д.) с последующим сравнением ее результата с исходными числами основной операции. Время решения задачи в этом случае может увеличиться почти в три раза.
По сравнению с методом двойных просчетов контроль вычислений обратным ходом решения задачи обладает существенным преимуществом — ошибка в вычислениях обнаруживается при проверке правильности выполнения основной операции в следующем за ней контрольном так те работы машины. Это локализует ее распространение и позволяет быстро определить место сбоя или неис-прав" ности.
Аппаратурная реализация этого метода значительно увеличивает объем, оборудования и усложняет логику работы .устройств при незначительном уменьшении вре мени, затрачиваемого на контроль. Из-за этих недостат ков контроль вычислений обратным ходом решения за дачи не получил широкого распространения.
Метод контрольного суммирования широко приме няется для контроля групповых передач информации при вводе, обмене между оперативным и внешним запо минающими устройствами, хранении в ЗУ и при выводе ее из машины. Существо этого метода заключается в том, что подсчитывается и запоминается сумма контро лируемого массива чисел. После каждой передачи или хранения этого массива подсчитывается новая сумма, которая сравнивается о полученной ранее. Несовпадение этих сумм говорит об ошибке.
Контроль правильности ввода, основанный на исполь зовании двух комплектов перфокарт, приводит к боль шой непроизводительной затрате машинного времени. Если программу необходимо вводить в машину много кратно, да еще с двух комплектов перфокарт, то естест венно, что требуется вдвое больше времени, чем на ввод
содного комплекта.
Вэлектронных цифровых вичислительных машинах контрольное суммирование массивов информации, пере даваемых из одного устройства в другое или хранящихся в запоминающих устройствах, производится по специаль ной команде. Использование обычной команды для сум мирования большого количества команд и чисел почти
всегда приводит к переполнению разрядной сетки и вы
12* |
179 |
зывает останов машины раньше окончания вычисления контрольной суммы. Поэтому команда «контрольное сум мирование» суммирует программный и числовой мате риал без учета адресов, кодов операций, знаков числа, мантиссы, порядка. Реализация такой операции в маши не требует незначительных затрат дополнительного обо рудования.
Испытательные программы (тесты) используются в основном в период отладки машины и при ее профи лактических проверках. Поэтому время, затрачиваемое на выполнение испытательны^ программ, относится к за тратам машинного времени на профилактическое обслу живание и частично на обнаружение и устранение неис правностей, возникающих при работе. Каждый тип ма шины имеет систему испытательных программ, вклю чающую контролирующие и диагностические программы. Первые позволяют только установить, что в машине есть неисправность, вторые — помогают обслуживающе му персоналу быстро и довольно точно отыскивать мес то неисправности.
Испытательные программы составляются на основе анализа схем и определения комбинаций кодов, вызы вающих тяжелые режимы работы устройств и элемен тов, с учетом системы профилактического контроля и времени, отводимого для проверки машины с помощью этих программ. Время, необходимое для их выполнения, и глубина проверки зависят от эффективности этих про грамм и качества их составления. Поэтому в процессе эксплуатации машины систему испытательных про грамм необходимо совершенствовать и дополнять новы ми, более эффективными программами, позволяющими полнее и глубже проверять машину.
Контрольные соотношения используются для про верки правильности решения довольно ограниченного класса задач. Такими соотношениями могут быть: по,- стоянство суммы потенциальной и кинетической энергий (при решении задач о движении тела в поле притяже ния Земли без учета сопротивления воздуха), постоян ство суммы реактивных энергий при расчете колебатель ного контура, равенство единице суммы квадратов сину са и косинуса угла (при решении тригонометрических задач), равенство с заранее установленной точностью результатов решения дифференциального уравнения
180
различными численными методами — более точным, нб громоздким и менее точным, но простым и т. п.
Контролируемость машины этим методом опреде ляется точностью, которую обеспечивает используемое контрольное соотношение, т. е. количеством сравнивае мых разрядов.
Контроль по шагу интегрирования и контроль под становкой вычисленных неизвестных в исходное управле
ние — частные случаи метода контроля |
вычислений с |
|
помощью контрольных соотношений. |
|
|
А п п а р а т н ы й |
к о н т р о л ь использует информа |
|
цию, создаваемую |
за счет избыточности |
оборудования |
машины, поэтому применение его требует дополнитель ных схем, но зато почти не требует затраты машинного времени. Машина останавливается в момент возникнове ния ошибки, что облегчает определение причины и мес та произошедшего отказа, а следовательно, значительно сокращает время на устранение неисправности. При этом вследствие увеличения объема оборудования общая на дежность машины несколько уменьшается.
В современных ЭЦВМ применяются три основных метода аппаратного контроля: дублирование блоков, устройств или машин в целом и сравнение результатов, получаемых на их выходах; использование различных контролирующих кодов (с запрещенными комбинациями, с обнаружением и исправлением ошибок и т. д.); конт роль работы отдельных блоков и устройств машины (счетчиков, регистров, сумматоров, последовательности выборки команд и расшифровки кодов операций и др.).
Для решения проблем аппаратного контроля при одновременном повышении надежности машин приме няется резервирование (включение в параллельную ра боту) отдельных блоков, устройств и даже машин в це лом. Дублирование позволяет в каждом такте работы машины устанавливать факт возникновения ошибки пу тем сравнения результатов. Несовпадение результатов останавливает машину в том же такте. Этот метод не снижает быстродействия машины, и в то же время он достаточно надежен. Однако он весьма неэкономичен, так как для его реализации требуется много дополни тельного оборудования. К тому же при останове машины из-за появления ошибки дублирование в большинстве случаев не дает возможности быстро определить устрой
181