- •Содержание
- •Список сокращений
- •Резервирование и безопасность систем
- •Фирмы Siemens Moore Products
- •2.1. Общие сведения
- •2.2. Надежность работы контроллера
- •2.3. Комплекс средств для создания систем управления критическими процессами и противоаварийной защиты Quadlog
- •2.4. Архитектура резервирования комплекса Quadlog
- •2.5. Программное обеспечение контроллера
- •3. Контроллеры v9 Tricon фирмы Triconex
- •3.1. Общие сведения
- •3.2. Надежность работы контроллера
- •3.3. Модуль главного процессора
- •3.4. Системы шин и распределение питания
- •3.5. Цифровые входные модули
- •3.6. Цифровой выходной модуль
- •3.7. Аналоговый входной модуль
- •3.8. Аналоговый выходной модуль
- •3.9. Модуль подключения периферийных устройств
- •3.10. Коммуникационный модуль
- •3.11. Модуль источника питания
- •3.12. Программное обеспечение контроллера
- •4. Резервирование на уровне операторских станций
- •4.1. Общие сведения
- •4.2. Архитектура Клиент – Сервер
- •4.3. Дублирование Сервера Ввода-Вывода
- •4.4. Резервирование на уровне задач
- •4.5. Выделенный сервер файлов
- •4.6. Резервирование сети
- •4.7. Резервирование связи с контроллерами
- •5. Резервирование сервера технологических данных
- •5.1. Основные понятия
- •5.2. Описание raid-массива 5 уровня
- •5.3. Понятия кластера
- •5.4. Уровень аппаратных средств
- •5.5. Уровень системного программного обеспечения
- •5.6. Обнаружение отказов узлов
- •5.7. Обнаружение отказов ресурсов
- •5.8. Заключение
- •Библиографический список
5.5. Уровень системного программного обеспечения
В качестве ОС используется Windows 2000 Advanced Server. Эта ОС обеспечивает поддержку кластерной технологии на системном уровне. ПО Cluster Service Windows 2000 Advanced Server базируется на модели архитектуры кластера «с индивидуальным доступом». Эта модель характеризует способ, с помощью которого серверы в кластере управляют локальными и общими устройствами и ресурсами кластера и используют их.
Ресурсы, разделяемые кластером, такие как общий дисковый массив и сетевой адрес, в каждый конкретный момент находятся в собственности и под управлением только одного сервера. Второй сервер может находиться в горячем резерве или же выполнять свои собственные приложения. В нашем проекте резервный сервер не несет полезной нагрузки в момент нахождения в горячем резерве, так как основная его задача - обеспечить перевод ресурсов кластера с основного сервера в случае сбоя последнего.
Модель с индивидуальным доступом облегчает управление дисковыми устройствами и стандартными приложениями. Эта модель не требует специальных кабельных соединений или специальных приложений и создает Cluster Service возможность поддерживать стандартные приложения и дисковые ресурсы на базе Windows 2000.
Одним из преимуществ Cluster Service является то, что приложения и службы, работающие на кластере, могут быть представлены пользователем и рабочим станциям, как ресурсы виртуального сервера. Для пользователей и клиентов подключение к приложению и службе, работающей как кластерный виртуальный сервер, представляет собой тот же процесс, что и подключение к одиночному физическому серверу. Подключение к виртуальному серверу может выполняться через любой узел кластера. Пользователь или клиентское приложение не будут «знать», на каком узле фактически содержится виртуальный сервер.
Службы или приложения, к которым не обращаются пользователи или клиентские приложения, могут работать на узле кластера без организации их в виде виртуального сервера. ПО Cluster Service управляет виртуальным сервером как группой ресурсов, и группа ресурсов для каждого виртуального сервера содержит в том числе IP- адрес и сетевое имя, сопоставленное этому адресу.
Подключения клиента приложения к виртуальному серверу выполняются сеансом клиента, которому известен только адрес IP, опубликованный службой кластеров в качестве адреса виртуального сервера.
В случае сбоя приложения или отказа сервера Cluster Service перемещает всю группу ресурсов виртуального сервера на другой узел кластера (рис. 30).
Рис.30. Переключение ресурсов кластера
При возникновении подобного сбоя клиент обнаружит отказ в сеансе работы с приложением и попытается подключиться вновь тем же самым образом, каким был подключен. И будет возможность успешно это выполнить, поскольку Cluster Service просто перенесет опубликованный адрес IP виртуального сервера на один из работающих узлов в кластере в рамках действий по восстановлению. Сеанс клиента сможет заново установить подключение к приложению, при этом ему не нужно знать, что физически оно теперь помещается на другом узле кластера. Ниже дан перечень служб и приложений, подлежащих переносу с одного сервера кластера на другой в случае сбоя или отказа основного сервера (не указаны системные сервисы).
Службы, обеспечивающие работу MS SQL Server: MS SQLServer.
Службы приложений Wonderware: Wonderware Logger; InSQL Control (эта служба обеспечивает старт и останов всех служб InSQL-сервера).
Таким образом, перерыв в архивации может возникнуть по двум причинам:
поскольку данные, собираемые соответствующей подсистемой IndustrialSQL сервера, сначала поступают в специальный буфер в оперативной памяти, а затем, через 60 с, еще сохраняются на диске, то в случае аварийного останова сервера будет потеряна информация не более чем за последние 60 с;
в момент запуска вышеуказанных сервисов на резервном сервере сбор данных и архивация проводиться не будут. Длительность запуска сервисов не более 3 мин.
Суммарное время потери данных составляет не более 4 мин, что соответствует требованиям, предъявляемым при создании АСУТП.
Для хранения данных IndustrialSQL-сервера и таблиц MS SQL-сервера используется дисковый RAID-массив, являющийся общим ресурсом для обоих серверов, входящих в кластер. Благодаря использованию общего дискового массива обеспечивается:
целостность данных, независимо от того, какой из серверов кластера является активным в данный момент, так как в каждый момент времени только службы активного сервера имеют доступ к данным на RAID-массиве;
единая конфигурация MS SQL и IndustrialSQL обоих серверов кластера.
Обнаружение и предотвращение отказов - главные преимущества, предоставляемые ПО Cluster Service. Когда в кластере отказывает узел или приложение, Cluster Service может ответить на это перезапуском отказавшего приложения или перераспределением нагрузки отказавшей системы между работающими узлами кластера. Обнаружение и предотвращение отказов Cluster Service включает двустороннее восстановление после отказов и восстановление приложения после отказа. ПО Cluster Service динамически обнаруживает Отказы отдельных ресурсов или всего узла и перезапускает ресурсы приложений, ресурсы данных и файловые ресурсы на доступном работающем сервере кластера. Это позволяет сохранять высокую доступность для пользователей и клиентских приложений таких ресурсов, как БД, общие файлы и приложения.
В Cluster Service предусмотрены 2 различных механизма обнаружения отказов:
сигналы активности для обнаружения отказов узлов;
монитор ресурсов и библиотеки ресурсов для обнаружения отказов ресурсов.
