Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Безопасность и методы резервирования АСУТП.doc
Скачиваний:
3
Добавлен:
01.04.2025
Размер:
1.18 Mб
Скачать

5.6. Обнаружение отказов узлов

Каждый узел периодически обменивается датаграммами с другими узлами кластера по частной сети кластера. Эти сооб­щения называются сигналами активности. Обмен сигналами ак­тивности позволяет каждому узлу проверить доступность дру­гих узлов и их приложений. Если на сервере происходит сбой при обмене сигналами активности, работающие серверы ини­циируют процессы восстановления после отказа, в том числе принятие решения о владении ресурсами и приложениями, ко­торые имел отказавший сервер. Решение принимается с исполь­зованием протокола отклика и отзыва.

Сбой при обмене сигналами активности может быть вы­зван различными событиями, такими как отказы компьютера, сетевого интерфейса или сети. Как правило, когда все узлы об­мениваются сообщениями, диспетчер БД настройки рассылает обновления глобальной БД настройки на каждый узел. Однако при нарушении обмена сигналами активности диспетчер журна­ла дополнительно записывает изменения БД настройки на ре­сурсе кворума. Этим гарантируется, что оставшиеся работоспо­собными серверы в процессе восстановления будут иметь дос­туп к самым последним данным настройки кластера и данным ключей реестра локального узла.

5.7. Обнаружение отказов ресурсов

Для обнаружения отказов ресурса и восстановления по­сле этих отказов совместно работают диспетчер восстановления и мониторы ресурсов. Мониторы ресурсов следят за состоянием ресурсов, периодически опрашивая ресурсы с использованием библиотек ресурсов. Опрос проводится в 2 этапа: коротким за­просом LooksAlive («с виду живой») и более долгим и деталь­ным запросом IsAlive («действительно живой»). Когда монитор ресурсов обнаруживает отказ ресурса, он извещает об этом дис­петчера восстановления и продолжает следить за ресурсом. Дис­петчер восстановления поддерживает ресурсы и состояние групп ресурсов. Он также отвечает за выполнение восстановле­ния, когда ресурс отказывает, и вызывает монитор ресурсов в ответ на действия пользователя или на отказы.

После обнаружения отказа ресурса диспетчер восстановления выполняет действия по восстановлению, которые включают либо перезапуск ресурса и зависящих от него ресур­сов либо перемещение целой группы ресурсов на другой узел. Какое из этих действий будет выполнено, определяется в зави­симости от свойств ресурса и группы ресурсов, а также доступ­ности узлов.

В процессе восстановления после отказа группа рас­сматривается как единое целое, чтобы зависимости ресурсов были правильно восстановлены. Когда ресурс восстановлен по­сле отказа, монитор ресурса извещает об этом диспетчера вос­становления, который может выполнить автоматический возврат группы ресурсов на основе настройки свойства возврата после отказа данной группы ресурсов.

5.8. Заключение

Традиционно резервирование осуществляется только на уровне дисковых систем или в лучшем случае еще и на уровне приложений. Но учитывая значимость технологического серве­ра, необходимо обеспечить максимальную надежность. Достиг­нуть этого удается, обеспечивая резервирование на всех уров­нях:

  • аппаратном (использование высокопроизводительных и на­дежных серверов и дисковых RAID-массивов фирмы Hew­lett-Packard);

  • ОС (Cluster Service Windows 2000 Server);

  • приложений (IndustrialSQL сервер).

В результате создается программно-технический ком­плекс системы сбора и хранения данных, удовлетворяющий тре­бованиям заказчика по надежности, гарантированному доступу к архивным данным и возможности дальнейшего расширения.