Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
[Надежность] / НКДЕ 10 ЛЕКЦИИ-rus_edit.doc
Скачиваний:
204
Добавлен:
07.02.2016
Размер:
2.72 Mб
Скачать

8. Контроль и диагностика систем

8.1 Основные положения

Под контролем компьютерных систем понимаются процессы, обеспечивающие обнаружение неисправной работы подсистем, вызванных отказом или сбоем аппаратуры, ошибкой оператора, ошибкой в программе или другими причинами.

В сочетании с включением резерва, корректировкой ошибок и данных, контроль является одним из эффективных средств увеличения надежности и достоверности вычислений [4,9].

Степень охвата схемы контролем определяет полноту контроля.Этоотношение охваченных контролем элементов к неохваченным.Степень охвата и определяет процессы – контроль работоспособности и технологическую диагностику.

По признаку применяемых средств, контроль разделяют на аппаратный, программный и смешанный.

Аппаратный контрольотличается быстродействием т.к. контроль производится в процессе функционирования, но требует дополнительных аппаратных затрат.

Программный контрольне требует дополнительных схем, но требует дополнительной памяти.

Смешанный - аппаратно - программный контроль.По характеру контроль бывает оперативный и тестовый, контроль на специализированных КИП.

Оперативный контрольосуществляется в ходе решения задач (контроль по модулю, контрольные коды).

Тестовый контрольосуществляется в специальное технологическое время за счет дополнительного процессорного времени, расходуемого на тесты.

Контроль на специализированных или универсальных средствах КИПпроизводится, чаще всего, для отдельных плат, блоков.

По объекту контроля различают: контроль аппаратуры (арифметическое, логическое устройство, УВВ, дешифраторы), контроль ПО, контроль работы оператора.

Программно-логический контроль применяется в специализированных ВС и включает контроль по длительности выполнения операций, последовательности выполнения,метод контрольных функций и контроля гладкости.

Метод контрольных функций основан на решении проверочных задач и контроля отсутствия резких отклонений гладких функций.

Производственный контроль элементов проводят на автоматизированных КИП.

Рассмотрим понятие технического контроля с точки зрения теории информации.

Пусть алфавит состоит из m букв, каждая из которых может служить элементом сообщения. Количество возможных сообщений длины n равно числу перестановок с неограниченными повторениями, т.е. всеNсообщений равновероятны и приm=2 соответствуют кодовому слову в n разрядов. Получение конкретного одного сообщения величина случайная и вероятность этого события равна1/N.

Итак, число Nмогло бы служить мерой информации, но в технике важно свойство аддитивности, т.е. сообщение обладает свойством длины (например, телеграмма). Тогда в качестве количества информации принялиI=1оg N=n lоg m, а количество информации на один элемент сообщения назвали энтропиейН=I/n=1оg m. При этом, единицу количества информации на один элемент сообщения называют двоичной единицей или битом, при десятичном логарифме -дитом

( 1 дит==3,32 бит).

Переходя к вероятностям и произвольным основаниям логарифмов, получаем формулу Шеннона

При равновероятности букв алфавита тогда

График энтропии приведен на рисунку 8.1 для m=2 (бинарное сообщение) т.к. положитьи тогда, Н = -р lоg р-(1-р)lоg(1-р).

Рисунок 8.1-Замещение энтропии информацией

Итак, технический контроль с точки зрения теории информации это замещение энтропии информацией об объекте, т.к.энтропия равна нулю, если сообщение известно в полной мере [5].

Для формального математического описания процесса контроля работоспособности и технической диагностики необходимо дать общие определения и ограничения.

1. Под вычислительной системой будем подразумевать произвольное соединение N элементов (), которое отображает пространство входных сигналов в пространство

выходных сигналов.

2. Система будет считаться исправной (работоспособной), если указанное отображение таково, что допусковой окрестности любого входного сигнала соответствует допусковая окрестность соответствующего выходного сигнала. В противном случае система будет считаться неисправной.

3. Каждой системе будет соответствовать определенное пространство всех возможных проверок , каждая из которых имеет свою стоимость за полученное количество информации о проверке совершенно определенного подмножества элементов и может иметь два исхода: положительный или отрицательный. В случае положительного исхода - система исправна и наоборот.

4. Допускаем, что в системе одновременно только один неисправный элемент, и он вызывает неисправность системы. Проверки не вносят в систему новых неисправностей.

5. Резервные элементы проверяются отдельной проверкой.

6. При неопределенном результате проверки (стирание информации), проверка повторяется, что приводит к стоимости, как случайной величины.

7. Стоимость проверки является некоторой линейной функцией.

8. Элемент имеет только один вид неисправности - "отказ".

9. Пространство проверок не является ограниченным, если включает все комбинации проверки элементов. Обычно число проверок превышает число проверяемых элементов.

10.Проверки и , kj, будем называть непересекающимися (независимыми), если подмножество проверяемых ими элементов не пересекаются.

11. .Для системы заданы априорные вероятности неисправной работы ее элементов - .

12. 3а критерий оптимизации процессов контроля работоспособности и технической диагностики принимается критерий минимизации средних потерь, затрачиваемых на решение задачи.

Тогда задачу контроля работоспособности и технической диагностики можно сформулировать так: пусть имеется вычислительная система из N элементов с априорным распределением вероятностей отказа. На начало проверок о системе неизвестно, что она исправна или неисправна, т.е. .

Считаем, что пространство возможных проверок достаточно для того, чтобы определить техническое состояние системы и, в случае неисправности, отыскать неисправный элемент.

Стирание информации, ошибки 1-го (ложная неисправность) и 2-го (пропуск неисправности) рода отсутствуют. Требуется найти оптимальную стратегию , которая бы минимизировала средние потери, т.е., где L- поглощающее состояние.

Здесь и далее контроль работоспособности рассматривается как частный случай технической диагностики, для которой требуется (в случае отыскания неисправности элемента) большая глубина проверок до уровней элементов, что увеличивает сложность, стоимость и продолжительность, почти всегда требует дополнительных аппаратно - программных средств, при массовом производстве.

Соседние файлы в папке [Надежность]