Автоматическое восстановление вычислительного процесса после отказов

В современных компьютерах все устройства строятся по модульному принципу, что позволяет в ряде случаев при отказе какого-либо модуля выполнить реконфигурацию технических средств и продолжить вычислительный процесс при ухудшенных характеристиках. Особенно данное свойство характерно применительно к памяти ЭВМ, которая имеет иерархическую структуру, а также к сопроцессорам, функции которых в случае необходимости может на себя взять центральный процессор, а также ПУ.

Выделим следующие способы восстановления работоспособности ЭВМ при отказах без ремонта:

методы логической перестановки адресов:

ручная перестановка (для СИС);
управляемая логическая перестановка адресов;
автоматическая логическая перестановка адресов;

исправление одиночных и некоторых двойных ошибок с помощью корректирующих кодов:

алгоритмические методы;
аппаратурные методы;

метод замещения неисправной БИС (блока) памяти резервной (см. 1 часть лекций МПС глава 5);
методы резервирования (см. выше);
реконфигурация ОП при отказе одного из модулей памяти;
исключение из работы отказавших ячеек памяти;
переадресация в исправный блок;
отключение части или всей буферной (кэш) памяти при ее отказе;
исправление отказов в ПЗУ;
альтернативные алгоритмы выполнения операций;
реконфигурация ПУ.

Реконфигурация ОП при отказе одного из модулей памяти. ОП и структурно и конструктивно строится по модульному принципу в виде байтных модулей, что позволяет наращивать ее емкость применительно к задачам пользователя. При выходе из строя одного из модулей (его ячеек) осуществляется логическое переключение модулей путем помещения неисправного модуля в конец адресного пространства и указания нового предела емкости ОП, доступной ОС.

Исключение модуля осуществляется при инициализации ОС, так как предварительно выполняются тесты самодиагностирования, определяющие неисправные модули и выполняющие реконфигурацию ОП. Использование метода недопустимо для памяти с расслоением обращений.

№ страницы	d
P0	1
P1	1
P2	1
P3	0
P4	1
P5	1
P6	0
P7	1
	1
	1
Pk	1

сключение из работы отказавших ячеек памяти.

При страничной организации памяти для каждой страницы в дескрипторе страницы можно предусмотреть бит недоступности страницы d. При обнаружении неисправных ячеек при диагностировании или от схем контроля ОС отмечает страницу в ее дескрипторе как недоступную и она не используется в процедуре свопинга страниц.

Переадресация в исправный блок.Автоматическая переадресация в исправный блок памяти выполняется с помощью инверсии, например старшего бита адреса. При этом объем доступной памяти модуля уменьшится вдвое и все запросы к неисправной области памяти переадресуются в другую половину модуля памяти.

Признак переадресации устанавливается ОС в зависимости от местоположения отказа.

Отключение части или всей буферной (кэш) памяти при ее отказе. Буферные ЗУ (или часто говорят кэш-память, уточняя ее назначение) включаются между ОП и другим медленно действующим устройством и служит для сокращения среднего времени выборки данных из ОП.

В большинстве случаев БЗУ строятся на основе стека типа FIFO, т.е. данные выбираются из последовательных ячеек памяти. Каждой ячейке (строке данных) ставится признак достоверности данныхdи бит признака исправности ячейкиsДля кэш-памяти каждой строке соответствует свой тег строки, что обеспечивает произвольный доступ к памяти. При обнаружении неисправной ячейки битsсбрасывается и информация не записывается в данную область памяти (ячейку) БЗУ.

При отказе множества ячеек или адресной части БЗУ в регистрах управления процессора предусмотрены специальные биты, позволяющие отключать буферную память полностью и ЭВМ продолжает работу с ухудшенными характеристиками (см. пример регистров управления ЦПintelx86 для задания режимов работы внутренней и внешней кэш-памяти).

Исправление отказов в ПЗУ. При работе с ПЗУ выход из строя хотя бы одной из ячеек делает ВС неработоспособной и требует замены неисправной БИС ПЗУ. Однако существует возможность работы и с неисправными ячейками ПЗУ, так как информация хранимая по каждому адресу известна (карта прошивки на каждую БИС ПЗУ должна поставляться в технической документации).

При обнаружении отказа в накопителе ПЗУ ОС записывает правильное значение информации в полностью ассоциативное ЗУ, в котором хранится в поле тегов адрес неисправной ячейки ПЗУ, а в СОЗУ данных требуемая информация. Адрес параллельно поступает на адресные входы ПЗУ и АЗУ. Если вырабатывается сигналА € Тег, то он блокирует доступ к ПЗУ, а в RgO поступают данные, считанные из блока СОЗУ данных АЗУ.

Так как информация хранимая в ПЗУ известна, то на практике существует большое число способов восстановления достоверности данных.

Альтернативные алгоритмы выполнения операций.Так как современные компьютеры в своем составе имеют множество сопроцессоров для увеличения производительности ВС, а также устройства обработки данных, которые строятся по алгоритмам сRISС архитектурой, то появляется возможность за счет алгоритмической избыточности на одном устройстве выполнять функции другого, но с ухудшенными характеристиками по быстродействию. Это позволяет при выходе из строя одного из устройств его функции переадресовать на другое устройство.

Реконфигурация ПУ. Для ВС, в состав которых входит большое число однотипных ПУ, имеется возможность при выходе из строя одного из ПУ выполнить переадресацию к другому ПУ. Данная процедура достаточно легко реализуется, если ПУ имеет сменный магнитный носитель (магнитная лента, ГМД, дискиCD-ROMи т.п.). Реконфигурация заключается в переадресации к портам ввода-вывода исправного ПУ.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 2021 / 2221 22 > Следующая >>>

Соседние файлы в папке Эксплуатация СВТ

#
02.06.2015203.78 Кб21Задания_л1.DOC
#
02.06.2015269.31 Кб23Задания_л2.DOC
#
02.06.2015886.78 Кб161ЛекЭСВТ_Ч1нов.doc
#
02.06.2015785.92 Кб99ЛекЭСВТ_Ч2нов.doc
#
02.06.20152.39 Mб41ЛекЭСВТ_Ч2нов.rtf
#
02.06.2015574.46 Кб36Мет_указ1.doc
#
02.06.20151.08 Mб27Мет_указ2.doc