- •Раздел 3. Технические средства информационных технологий Лекция № 9. Информационные основы контроля работы цифровых автоматов
- •1 Основные характеристики надежности эвм. Функции систем
- •2 Систематические коды. Контроль по четности, нечетности, по Хеммингу.
- •1 Основные характеристики надежности эвм.
- •1.1 Надежность информационной системы
- •1.2 Достоверность функционирования информационной системы
- •1.3 Функции систем контроля и диагностирования
- •2 Систематические коды. Контроль по четности,
- •2.1 Код с проверкой четности (нечетности)
- •2.2 Контроль по совпадению
- •2.3 Корректирующий код Хэмминга
1.3 Функции систем контроля и диагностирования
Чтобы уменьшить потери от сбоев и отказов, порождающих ошибки, надо предотвратить распространение ошибки в вычислительном процессе, так как в противном случае существенно усложнятся и удлинятся процедуры проверки правильности работы программы, определения и устранения искажений в программе, данных и промежуточных результатах. Для этого необходимо обнаруживать появление ошибки в выполняемых машиной преобразованиях информации возможно ближе к моменту ее возникновения. С этой целью надо иметь систему автоматического контроля правильности работы ЭВМ, которая при появлении ошибки в работе машины немедленно приостанавливает выполнение программы. Наличие такой системы освобождает пользователя от забот по контролю достоверности и снижает связанные с этим потери (на двойной просчет задачи, прогон контрольных вариантов, работу схем контроля и т.д.).
Для уменьшения времени восстановления достоверности информации после очередного сбоя следует иметь систему автоматического восстановления вычислительного процесса, распознающую характер (сбой или отказ) ошибки и при сбое автоматически восстанавливающую достоверность информации и выполнение программы, а при отказе – извещающую обслуживающий персонал о необходимости ремонта машины.
Для повышения комплексного коэффициента использования ЭВМ необходимо повышать обслуживаемость машины и добиваться уменьшения потерь времени на устранение отказов (повышение ремонтопригодности) и на проведение профилактических работ. Эти потери времени в таких сложных объектах, как ЭВМ, в первую очередь связаны с поиском места неисправности. Важнейшим средством уменьшения указанных потерь и повышения обслуживаемости ЭВМ является система автоматического диагностирования, позволяющая локализовать неисправность.
Обнаружение ошибок должно производиться в машине непрерывно и, следовательно, не должно вызывать заметного снижения быстродействия машины. Поэтому эта функция возлагается обычно на быстродействующие аппаратурные средства контроля, которые позволяют почти полностью совместить во времени выполнение основных и контрольных операций.
Для снижения затрат машинного времени и труда на профилактические испытания следует снабжать ЭВМ аппаратурно-программными средствами автоматизации контроля.
Продукция вычислительной машины — информация – не имеет своего эталона, т. к. машина решает задачу вычисления заранее неизвестных величин. Это условие определяет свои особые формы контроля, в основе которых лежит использование избыточной информации в процессе работы машины.
При использовании аппаратурных средств автоматизации контроля речь идет об аппаратурной избыточности, сущность которой можно охарактеризовать следующим:
- все операции выполняются параллельно на одинаковых компонентах системы, а результаты их работы затем сравниваются, что позволяет выявить ошибки;
- в случае выхода из строя какого-либо компонента его резервные аналоги продолжают работу без остановки, а отказавший компонент заменяется на работоспособный.
Программная избыточность предусматривает:
- последовательное во времени выполнение одних и тех же информационных процессов и дублирование данных;
- автоматическое восстановление отказавших операционных систем, программ-приложений и искаженных данных.
К программным средствам относятся также контрольные программы или специальные приемы программирования, позволяющие проверять правильность работы ЭВМ. Контроль может быть произведен с помощью программ тестовых задач (т. е. задач с известным решением), пропускаемых перед решением основной задачи. При правильном решении тестовых задач имеется определенная вероятность, что в течение некоторого ближайшего промежутка времени машина будет работать правильно.
Контроль во время решения основной задачи осуществляется путем введения в выполняемую программу специальных контрольных процедур, позволяющих установить достоверность решения всей задачи или ее части. Для этого проводят двойной просчет для одной и той же программы с последующим сравнением результатов. Иногда используют проверку вычислений по неиспользованным в основном алгоритме соотношениям, например, проверка правильности вычисления SIN(x) и COS(x) по формуле SIN2 Х + COS2 Х = 1 и т.п.