Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ГОСЫ / KIS_Romanova.doc
Скачиваний:
73
Добавлен:
15.02.2016
Размер:
533.5 Кб
Скачать

6.Распределенное размещение и доступ к данным в кис

РАЗМЕЩЕНИЕ и ДОСТУП к ДАННЫМ в РБД

При размещении хранимых данных в РБД неизбежно сегментированиеилифрагментациябазы. Допускается разбиение одного объекта на два или более фрагмента. Объектом может быть пользовательская база данных или таблица. Существуют два основных типа фрагментации –горизонтальная ивертикальная. В первом случае фрагменты представляют собой подмножества строк, во втором – подмножества столбцов. Допускается исмешанная фрагментация – комбинация вертикальной и горизонтальной, например, таблица разделяется на несколько горизонтальных множеств (строк), каждое из которых делится на вертикальные множества (столбцов). Каждый фрагмент размещается на узле, выбранном с учетом оптимальной схемы доступа. (Определение и размещение фрагментов должно проводиться с учетом особенностей использования базы данных, в частности, на основе анализа транзакций). Информация о фрагментации данных хранится в системном каталоге распределенных данных (Distributed Data Catalog-DDC), к которому процессор транзакций (TP) может получить доступ при обработке запросов пользователя. (Фрагментированную таблицу в любой момент можно объединить посредством комбинации операций объединения – union, и соединения – join).

РСУБД обеспечивает возможность поддержки актуальной копии некоторого фрагмента данных на нескольких различных узлах при помощи механизма репликации. Репликация фрагментов БД ставит своей целью улучшение сервиса доступности данных и уменьшение времени доступа к ним.

  1. Технология репликации распределенных баз данных

РЕПЛИКАЦИЯ

(тиражирование) replication

В РСУБД- механизм внесения изменений во вторичные БД непосредственно после завершения транзакции по мере доступности серверной или клиентской БД. Метод предполагает промежуточное хранение транзакций. Обеспечивает синхронизацию (согласованность) фрагментов распределенной базы данных.

Репликация – механизм распределения копий данных между серверами РБД, в том числе, территориально разделенных.

Задачи, решаемые при помощи репликации

Репликации используют для распределения нагрузки между серверами, когда в системе работает большое количество пользователей. В этом случае на несколько серверов устанавливаются копии одних и тех же данных, а пользователи, объединенные в группы, могут обращаться к выделенному серверу. Система с такой архитектурой легко масштабируется – по мере роста предприятия и увеличения количества пользователей добавляют новые серверы и реплицируют на них необходимые данные. Еще одной типичной задачей распределения и тиражирования данных является поддержка географически удаленных пользователей. Без репликации они вынуждены работать через глобальные сети (WAN–WideAreaNetwork), если установить в удаленных филиалах дополнительные серверы и создать на них реплики данных, это повысит скорость доступа к данным и разгрузит основной сервер предприятия.

В качестве примера использования репликации на уровне ОС Windows можно привести технологию обновления учетных записей в NT- доменах

Репликация использует интуитивно понятный принцип "публикации" изменяемых данных (на главном узле) и "подписки" на изменения (на локальных узлах). Процесс репликации выполняется автоматически, во время репликации в РБД сохраняется информация о состоянии репликации и реплицированных данных, что снижает опасность потери данных. Если процедура репликации прервана (например, из-за отказа источника питания), то она возобновится с точки отказа, как только системы снова будут работать в обычном режиме. Репликация автоматизирует задачу копирования и распространения данных.

Принцип публикации и подписки (часто его называют метафорой репликации) базируется на трех основных понятиях: издатели, дистрибьюторы и подписчики (см. рисунок на следующей странице).

Издатель (publisher) – это система (сервер) исходной базы данных, которая предоставляет данные (в виде подготовленных публикаций) для репликации. Публикация – это набор статей, сгруппированных как один блок. Например, можно создать публикацию, которая будет использоваться для репликации базы данных, состоящей из нескольких таблиц, каждая из которых определена как статья. Репликация базы данных в целом как одной публикации является более эффективной операцией, чем репликация таблиц по отдельности. Публикация может состоять из одной статьи, но почти всегда состоит из нескольких. Подписчик может подписываться только на публикации, но не статьи. Поэтому для подписки на одну статью нужно сконфигурировать соответствующую публикацию, содержащую только эту статью. Статья – это отдельный набор данных, который подлежит репликации. Статья может быть целой таблицей, подмножеством таблицы, состоящим из определенных столбцов или строк, или хранимой процедурой. Эти подмножества создаются с помощью фильтров. Фильтр, используемый для создания подмножества строк, называется горизонтальным. Фильтр, используемый для создания подмножества, состоящего из столбцов, называется вертикальным фильтром.

Дистрибьютор(distributor, распространитель) – это система (сервер), которая поддерживает специальную дистрибутивную базу данных (база данных распределения), используемую для поддержки и управления репликацией. В дистрибутивной БД хранится информация обо всех подписчиках и издателях.

Издатель и дистрибьюторне обязательно должны быть на одном сервере. На практике, чаще всего, для дистрибьютора используется выделенный сервер. Для каждого издателя при его создании должен быть задан дистрибьютор, и каждый издатель может иметь только одного дистрибьютора

Подписчик (subscriber) – это система (сервер), которая получает реплицированные данные и сохраняет их в реплицированной базе данных на узле. Подписчики также могут вносить изменения и являться издателями для других систем. Чтобы подписчик получал реплицированные данные, он должен подписаться на эти данные. Подписка на репликацию подразумевает конфигурирование подписчика для получения этих данных. Подписка – это информация базы данных, на которую вы подписываетесь

Среда репликации может содержать несколько подписчиков, но любой заданный набор данных, сконфигурированных для репликации, может иметь только одного издателя. Подписчик тоже может модифицировать и даже повторно публиковать данные.

Соседние файлы в папке ГОСЫ