
книги из ГПНТБ / Каган Б.М. Цифровые вычислительные машины и системы учеб. пособие
.pdfМикрооперация (команда) может быть повторена, если не исказилась используемая в операции информа ция (операнды, адреса и т. д.), т. е. если не пройден
«порог повторения». Это проверяет входящая в систему программа обработки сбоев, которая по записанной си туации, соответствующей появлению ошибки, определя ет, пройден ли порог повторения микрооперации или
650
команды*. Если соответствующий порог пройден, то вмес то микрооперации повторяется команда, а вместо коман
ды — сегмент |
программы. |
Последнее возможно, |
если |
||||
программист |
предусмотрел |
в |
программе |
«контрольные |
|||
точки» |
(макрокоманды типа |
checkpoint), сохраняющие |
|||||
промежуточные данные, |
позволяющие |
повторить |
про |
||||
грамму с данного места. |
микрокоманды |
(команды, |
сег |
||||
Если |
при |
повторении |
|||||
мента программы) ошибка |
не повторяется, событие ди |
агностируется как сбой и происходит возврат к точке прерывания программы, но перед этим в память запи сывается дополнительная информация о состоянии в мо мент сбоя вычислительной системы (какие в это время выполнялись операции в периферийных и других уст ройствах, название программы, адрес команды, операн ды, время). Информация о ситуациях при сбоях и об отказах накапливается во внешнем запоминающем уст ройстве и в последующем обрабатывается специальной программой, вырабатывающей определенные рекоменда ции обслуживающему персоналу, выполняющему про филактические работы.
Если при определенном числе повторений (например, 16) ошибка сохраняется, событие диагностируется как отказ и автоматически приводятся в действие диагности ческие процедуры и соответствующие средства для опре деления места неисправности. Диагностические проце дуры также могут включаться вручную с пульта, напри мер, при пуске машины.
Комплекс диагностических программ содержит диаг ностические программы процессора, оперативной памя ти, каналов и периферийных устройств. Работа комплек са диагностических программ и схем диагностики орга низуется специальной управляющей программой— ди агностическим монитором, получающим от супервизора операционной системы требование на диагностирование определенного устройства, в котором обнаружилась не исправность.
Диагностический монитор может инициировать вы полнение специальной команды «Диагностика», приводя щей в действие управляющие схемы, предназначенные
для диагностики. После |
выявления места |
отказа прове |
* О п е р а ц и и в в о д а - в ы в о д а |
в с е г д а д о п у с к а ю т |
п о в т о р е н и я н а |
у р о в н е к о м а н д ы . |
|
|
41* |
651 |
ряется возможность реконфигурации вычислительной системы путем автоматического отключения неисправно го устройства и передачи его функций другому устройст ву. Если это возможно, то производится реконфигурация системы, при этом меняются нужным образом логичес кие номера устройства. Затем после сообщения операто ру об отказе и произведенной реконфигурации происхо дит возврат к контрольной точке программы. Если ре конфигурация невозможна, САД инициирует на пульте оператора код неисправности. Оператор, пользуясь спра вочником неисправностей, находит неисправный блок, ремонтирует или заменяет его. Затем с пульта включает диагностические процедуры. Если отказ устранен, про изойдет автоматический возврат к контрольной точке программы.
12-6. П Р И Н Ц И П Ы П О С Т Р О Е Н И Я С И С Т Е М А В Т О М А Т И Ч Е С К О Й Д И А Г Н О С Т И К И
Внедрение интегральных схем, технологии многослой ного печатного монтажа и других технологических усо вершенствований приводит к уменьшению размеров цифровых вычислительных машин, но одновременно ус ложняет доступ к функциональным модулям со стороны обслуживающего персонала.
Быстро увеличивается количество машин, находящих ся в эксплуатации. В результате возрастает численность обслуживающего персонала и повышаются требования к его квалификации. Увеличение надежности машин приводит к тому, что вмешательство в целях поиска не исправных элементов и ремонта их становится сравни тельно редким явлением. Следовательно, наряду с повы шением надежности машин наблюдается тенденция к потере эксплуатационным персоналом определенных на выков отыскания и устранения неисправностей.
Таким образом, возникает проблема обслуживания непрерывно усложняющихся вычислительных систем в условиях, когда не хватает обслуживающего персонала высокой квалификации.
Современная вычислительная техника ищет решение указанных проблем путем создания систем автоматиче ской диагностики неисправностей, которые должны об легчить обслуживание и ремонт машин.
652
В зависимости от вида используемых для диагности ки средств различают программную, аппаратную (или аппаратно-программную) диагностику. В зависимости от размещения средств диагностики различают внутреннюю диагностику, когда диагностические средства размеща ются внутри исследуемого устройства, и внешнюю диаг ностику, когда диагностические средства находятся вне устройства. Наконец, в зависимости от времени включе ния диагностической системы различают оперативную и профилактическую диагностику. При оперативной диаг ностике поиск неисправностей выполняется в процессе работы машины по сигналам системы контроля, опре деляющим момент возникновения неиспривности.
Профилактическая диагностика выполняется перио дически в заранее запланированные моменты времени, обычно соответствующие периодам профилактической проверки машины. В дальнейшем под системой автома тической диагностики (САД) будем понимать внутрен нюю оперативную диагностику, средства которой могут использоваться и при профилактической диагностике.
Система автоматической диагностики представляет собой комплекс программных, микропрограммных и ап паратных средств и справочной документации (справоч ников неисправностей, инструкций, схем ЦВМ, тестов).
Основными характеристиками САД являются: а) точность САД, определяемая как вероятность пра вильного обнаружения отказа; б) разрешающая способ ность САД, равная среднему числу подозреваемых смен ных блоков для различных отказов; в) среднее время диагностирования неисправности; г) доля аппаратных средств САД в общем составе оборудования ЦВМ.
При построении систем автодиагностики ЦВМ в ос новном используются следующие методы:
1)взаимная диагностика машин или процессоров в многомашинных и многопроцессорных системах;
2)разделение ЦВМ на несколько одинаковых час тей (подмашин), осуществляющих взаимную диагнос тику;
3)метод «раскрутки».
Суть первых двух методов ясна из их наименований. Метод «раскрутки» предполагает поэтапное последова тельное расширение работоспособной части ЦВМ путем включения в эту часть элементов, проверенных на пре дыдущем этапе.
653
В случае метода «раскрутки» на каждом t-м этапе диагностического процесса подмашина М,-, представ ляющая собой часть оборудования проверяемой ЦВМ, диагностирует аппаратуру ДМ,, которая, если в ней нет отказов, присоединяется к подмашине Мг-, образуя новую
|
|
|
|
|
|
МпО. |
I . |
|
У |
|
Уі |
і і ? |
|
/ecт ы |
|
|
^ r5 |
і |
|
H > чаль- |
><§Q |
|||||
|
|
|
|
мой. область |
ОЗУ |
><51Г* |
||
|
|
|
Мпг |
|
|
Mn. |
I*5? |
|
|
|
|
|
|
|
|
|
A -5 |
|
|
|
|
M0 |
|
|
|
5: |
|
|
|
|
Дигностическое |
||||
|
|
|
|
|
ядро |
|
||
|
|
|
Тесты яд. .pa. р е ж и м а , |
О З У |
|
|||
I |
§1 |
|
|
М, |
|
|
|
|
£ S-S 4 cl |
|
|
Тесты. П З У |
|
|
|||
|
|
|
|
|
|
|||
|
|
|
М г |
|
|
|
|
|
СК.!V |
1 , |
|
Тесты |
ядра р е ж и м а П З У |
||||
|
|
Мл |
|
|
|
|
||
§ S |
|
Тесты |
з а п о м и н а ю щ и х |
|
||||
|
|
|
элементов процес |
М¥ сора
ІІЗ§>
К
Тесты к о м В и н а ц и о н н ы х с х е м
|
М$ |
|
|
|
Тесты |
мультиплексного |
|
|
Me |
канала |
|
|
|
||
|
|
се ле кт ор ны х |
|
|
|
каналов |
|
|
~м? |
~1 |
|
Cä |
Тесты |
ядра м о н и т о р а |
|
(VT |
|
|
|
|
М8 |
|
|
|
|
Функциональные |
|
|
|
' |
т е с т ы |
|
м3=цвм |
||
Рис. 12-8. Процесс автоматической |
диагностики |
||
|
Ц В М (метод раскрутки). |
подмашину Мі+\ = Мі [JAM*, которая выполняет диагно стическую процедуру на следующем этапе.
Подмашина М0, с которой начинается «раскрутка», называется диагностическим ядром ЦВМ. Диагностиче ское ядро должно иметь повышенную надежность и до
654
пускать проверку работоспособности с пульта вручную или в полуавтоматическом режиме.
Метод «раскрутки» нашел широкое применение в си стемах диагностики ЦВМ, благодаря ряду преимуществ, важнейшее из которых — небольшой объем диагности ческого ядра. Метод «раскрутки» позволяет эффективно использовать принцип микропрограммного управления для диагностики неисправностей.
Один из возможных вариантов построения микропро граммной системы автоматической диагностики, реали
зующей |
метод |
«раскрутки», показан |
на рис. 12-8 |
[Л. 39, |
14]. При |
проверке исправности |
оборудования, |
производимой перед пуском машины, этапам автомати ческой диагностики предшествует подготовительный этап, которым управляет оператор с пульта машины.
Входящее в состав оборудования процессора ядро подготовительного этапа Ми0 содержит специальные ап паратные средства диагностики, составляющие блок проверки основной оперативной памяти. В этот блок вхо дит включаемая с пульта процессора диагностическая аппаратура: сдвиговый регистр, счетчик адреса и схемы управления, обеспечивающие проверку начальной облас
ти памяти (обычно 4 кбайта) |
в режимах записи и чтения |
||||
нулей |
(единиц) |
и так называемого |
«тяжелого» |
кода. |
|
Блок |
проверки |
оперативной |
памяти |
локализует |
неис |
правности с точностью до адреса и разряда ОЗУ.
Ядро подготовительного этапа Мп0, расширенное за счет проверенной начальной области ОЗУ, образует под машину Мпі, которая объединяется с подмашиной Мп2, представляющей собой селекторный канал и запоминаю щее устройство на магнитной ленте с записанными на ленте тестами. Селекторный канал при этом предвари тельно не проверяется, так как в ЦВМ обычно несколь ко таких каналов, и всегда может быть использован тот, который исправен. Кроме того, Ми2 содержит специаль ный регистр для четырехразрядных кодов тестовых опе раций.
Дальше процесс диагностики ЦВМ протекает авто матически. Поэтому объединение подмашин Мпі и Ма2 является в рассматриваемой диагностической системе диагностическим ядром ЦВМ
Л40 = 44nl(JAin2.
Подмашина М0 проверяет исправность схем и цепей
655
процессора, которые на последующем этапе используют ся при проверке постоянного запоминающего устройства (памяти микропрограмм). Поскольку проверка ПЗУ про изводится при управлении от оперативной памяти («ре жим ОЗУ»), то упомянутые схемы и цепи образуют «ядро режима ОЗУ». В это ядро входят: регистр адреса ОЗУ с дешифраторами, регистр адреса ПЗУ, регистр коммутатора процессора, цепи передачи информации из регистра информаций ПЗУ в регистр информации ОЗУ, а также специальный триггер системы диагностики «триггер счета успеха» при прохождении теста.
Диагностическое ядро — подмашина Мо при проверке перечисленного оборудования (ядра режима ОЗУ) ис пользует тесты, загружаемые с магнитной ленты в на чальную область оперативной памяти. В селекторном канале, используемом для загрузки тестов в оператив ную память, предусмотрено в случае неудачной попытки загрузки автоматическое многократное повторение этой операции. Если определенное число попыток (обыч но 8) оказалось неудачным, загрузка тестов в память прекращается и производится вручную поиск неисправ ностей в канале.
В случае исправности устройств, проверяемых под машиной Мо, они расширяют работоспособную часть ЦВМ до подмашины М\.
На следующем этапе диагностического процесса под машина Мі проверяет память микропрограмм — ПЗУ. Используя тесты локализации неисправностей ПЗУ, по ступающие в ОЗУ с магнитной ленты, подмашина М\ проверяет правильность работы схем дешифрации адре са ПЗУ, схем считывания информации и содержимого всех ячеек ПЗУ. На этом этапе управление диагностиче скими процедурами осуществляется информацией, по ступающей из ОЗУ, а реализуется специальными схем ными средствами системы диагностики. По окончании этапа в диагностирующий комплекс оборудования вклю чается проверенное ПЗУ, в результате чего образуется подмашина М2.
Начиная с этого момента, управление диагностичес ким процессом переходит к ПЗУ и реализуется с помо щью находящихся в ПЗУ диагностических микропро грамм («режим ПЗУ»), Этот режим диагностики начина ется с проверки подмашиной М2 специальных схемных средств, образующих «ядро режима ПЗУ». В это ядро
656
входят: «триггеры удачи и неудачи» при прохождении теста, специальные триггеры управления, регистр счета
последовательностей |
и следующие |
микропрограммы: |
|
а) установки регистров процессора, б) |
опроса состояния |
||
регистров, в) |
сравнения и ветвления. |
|
|
Проверка |
этого |
оборудования производится посред |
ством диагностических микропрограмм. При успешном завершении проверки получаем подмашину Ms.
Подмашина М3 проверяет запоминающие элементы (триггеры) процессора. Для этого с магнитной ленты
воперативную память загружаются тесты локализации неисправностей* и последовательно выполняются микро программы установки запоминающих элементов в схе мах процессора в состояния, определяемые информацией
воперативной памяти, микропрограммы считывания со стояний запоминающих элементов в диагностическую область ОЗУ, и, наконец, микропрограммы сравнения со стояний запоминающих элементов с эталонными состоя ниями (кодами). При этом проверяется установка каж дого элемента памяти в 0,1 и снова в 0. Для опроса состояний регистров используются специальные дополни тельные связи, предусмотренные для этой цели. В случае успешного завершения этого этапа работоспособная часть машины расширяется за счет включения запоми нающих элементов (регистров), образуя подмашину М4.
Подмашина М4, используя тесты**, загружаемые в оперативную память с магнитной ленты, производит ди агностику комбинационных схем процессора. При этом выполняются микропрограммы установки регистров на
входе комбинационной схемы согласно тестовому набо ру, микрооперация приема выходного сигнала комбина ционной схемы в регистр на ее выходе, микропрограмма опроса этого регистра, сравнение с эталонным кодом и в зависимости от результата переход к следующему тесту.
* Формат тестов, записанных в О З У , содержит наборы, управ ляющие установкой запоминающих элементов в определенные со стояния, коды эталонных состояний, а также адреса перехода при удачном и неудачном прохождении теста.
** Формат тестов содержит адрес проверяемой микропрограм мы, тестовые наборы, которые должны быть поданы на регистры на входе проверяемых комбинационных схем, эталонные наборы для контроля состояний регистро* на выходе комбинационных схем, адреса переходов.
657
Подмашина М4, расширенная за счет проверенных комбинационных схем процессора, образует подмаши ну М5. На этом этапе завершается проверка процессора и заканчивается режим диагностики при управлении от ПЗУ.
Далее диагностика производится при помощи про граммных тестов с использованием специальной коман ды «Диагностика». Эта команда позволяет связывать программный и микропрограммный уровни управления работой ЦВМ, вызывать к исполнению любую микро программу процессора, а затем передавать управление снова программе, устанавливать регистры в нужные со стояния, опрашивать состояния регистров после выпол нения команды, организовать проверку выполнения ко манд на любом такте.
Подмашина М5, используя записанные на магнитной ленте программные тесты, диагностирует мультиплекс ный канал. После включения в состав диагностического оборудования этого канала получаем подмашину Мб, которая в свою очередь на следующем этапе диагности рует селекторные каналы.
Каналы обоих типов проверяются вплоть до интер фейса, который при этом логически отключается. Ими тация сигналов интерфейса производится посредством команды «Диагностика» и специального регистра имита ции интерфейса. После этого этапа селекторные каналы включаются в работоспособную часть машины (подма шина М7).
Далее начинается диагностика под управлением ди агностического монитора. Сперва подмашина М7 прове ряет правильность выполнения микропрограмм некото рых команд ЦВМ (переключение программ, загрузка слова, загрузка адреса и др.), необходимых для работы диагностических программ, входящих в состав так на зываемого диагностического монитора. Проверяемые ко манды ЦВМ образуют «ядро монитора». В результате этого этапа раскрутки работоспособная часть ЦВМ рас ширяется до подмашины М8.
Далее осуществляется программная диагностика с помощью функциональных тестов, проверяющих работу всех ячеек оперативной памяти, системы прерывания, интерфейса и периферийных устройств.
В случае, если результат прохождения какого-либо теста оказывается неудачным, система диагностики вы
658
свечивает на индикаторном табло пульта оператора но мер этого теста. Оператор, пользуясь справочником не исправностей, по номеру теста находит место неисправ ности. В такой форме система сообщает оператору о мес те неисправности на всех этапах — от начала диагности ческого процесса до этапа проверки мультиплексного ка нала включительно. В последующих за этим этапах ди агностики система печатает на печатающем устройстве сообщение оператору о месте неисправности и указание, какая сменная плата подлежит замене.
Из приведенного в настоящем параграфе описания принципа работы системы автоматической диагностики ЦВМ видно, что эта система представляет собой ком плекс аппаратных, программных средств и справочных материалов, предназначенных для локализации неис правностей в машине.
К аппаратным средствам системы диагностики отно сятся: а) средства ручного управления диагностически ми процедурами, б) схемы для управления диагностиче скими режимами, в) схемы для непосредственной уста новки и опроса запоминающих элементов ЦВМ, г) диаг ностические микропрограммы, д) схемы для введения ошибок при проверке схем контроля.
Система диагностики использует следующие програм мные средства:
а) наладочные тестовые программы, б) диагностиче ский монитор, в) диагностические программы процессо ра, каналов, внешних устройств, г) автономные и си стемные диагностические программы.
Справочные материалы системы диагностики содер жат справочники неисправностей, инструкции, схемы ЦВМ и документацию на диагностические тесты.
12-7. П О С Т Р О Е Н И Е Т Е СТ О В Д Л Я К О Н Т Р О Л Я И Д И А Г Н О С Т И К И К О М Б И Н А Ц И О Н Н Ы Х С Х Е М
Неисправности, возникающие в комбинационных логических схе мах, могут вызываться различными причинами и носить различный характер. Мы будем рассматривать неисправности только логическо го типа, т. е. такие, которые соответствуют появлению в какой-либо точке схемы устойчивого значения сигнала, соответствующего логиче ской 1 или логическому 0.
Будем предполагать, что в подлежащей диагностике схеме ука занные неисправности могут возникать на всех входных зажимах комбинационной схемы и на выходах всех ее логических элементов. Будем рассматривать случай, когда одновременно в схеме присутст
659