- •Распределённые базы данных: основные понятия.
- •Аспекты сетевого взаимодействия (необходимые условия функционирования сурбд).
- •2.1. Прозрачность сети
- •2.2. Автоматическое преобразование форматов данных
- •2.3. Автоматическая трансляция кодов
- •2.4. Межоперабельность
- •4. Свойства ddb: обработка распределённых запросов, прозрачность расположения, прозрачная фрагментация, прозрачное тиражирование.
- •5. Свойства ddb: независимость от оборудования, независимость от операционных систем, прозрачность сети, независимость от баз данных.
- •6. Обработка и оптимизация запросов.
- •7. Управление одновременным доступом.
- •7.1. Централизованный протокол двухфазной блокировки
- •7.2. Двухфазная блокировка первичной копии
- •7.3. Распределённый протокол двухфазной блокировки
- •7.4. Протокол блокирования большинства
- •7.5 Альтернативные алгоритм
- •7.2.1. Централизованный метод
- •3. Сбой носителя (диска)
- •4. Коммуникационные сбои
- •9. Технология тиражирования данных.
- •10.Масштабируемость (расширяемость).
- •11. Производительность.
- •12. Смешанная загрузка субд (olcp).
- •13. Постоянная доступность данных.
- •14. Параллельные системы баз данных: общее понятие.
- •15. Цели и параметры параллелизма: ускорение и расширяемость.
- •16. Аппаратная архитектура.
- •17. Параллелизм внутри реляционных операторов.
9. Технология тиражирования данных.
Тиражирование данных (Data Replication – DR) – это асинхронный перенос изменений объектов исходной базы данных в БД, принадлежащие различным узлам распределённой системы. Функции тиражирования выполняет специальный модуль СУБД – сервер тиражирования данных, называемый репликатором. Его задача – поддержка идентичности данных в принимающей и исходной базах данных. Сигналом для запуска репликатора служит срабатывание некоторого правила.
Принципиальная характеристика тиражирования данных заключается в отказе от физического распределения данных. Суть тиражирования состоит в том, что любая база данных (как для СУБД, так и для работающих с ней пользователей) всегда является локальной; данные размещаются локально на том узле сети, где они обрабатываются; все транзакции в системе завершаются локально.
Основные понятия: 1) понятие согласованного распределённого набора данных (СРНД) - это набор данных, идентичность которого поддерживается репликатором во всех узлах, вовлечённых в процесс тиражирования. 2) путь переноса изменений (DPP) из каждой тиражируемой базы в другие БД.
Основные схемы тиражирования:
1) “центр–филиалы”, изменения в базах данных филиалов переносятся в центральную БД, и наоборот;
2) равноправное тиражирование, несколько БД разделяют общий набор изменяемых и тира-жируемых данных;
3) каскадное тиражирование, изменения в одной БД переносятся в другую БД, откуда в свою очередь в третью БД и т.д.;
4) изменения в БД могут переноситься через шлюзы в БД другой СУБД (для неоднородных БД);
5) различные комбинации всех вышеперечисленных схем.
Механизмы, регулирующие взаимоотношения между узлами (с точки зрения принимающего узла):
1) “равный с равными” (peer-to-peer или full peer): все изменения, произведённые в СРНД на первом узле, попадут на второй узел, и наоборот, при этом выполняется контроль возможных коллизий;
2) доступ с обнаружением и разрешением конфликтов (protected read): изменения с первого узла попадают во второй, производится контроль возможных конфликтов (например, если источников несколько); при этом изменения СРНД на втором узле игнорируются и на первый узел не передаются;
3) доступ по чтению без предотвращения конфликтов: то же, что и 2), но конфликты не обнаруживаются и не разрешаются;
4) доступ через шлюз: то же, что и 3), но второй узел содержит данные, получаемые через шлюз к БД другой СУБД.
Элементарным изменением, вызывающим реакцию репликатора, является транзакция. Стремясь быть максимально гибким, репликатор предоставляет следующие основные возможности:
1) тиражирование начинается после завершения определённого числа транзакций (в частном случае, после каждой транзакции);
2) тиражирование выполняется через равные промежутки времени или в определённый момент времени;
3) процесс тиражирования контролируется вручную администратором или созданным пользовем монитором тиражирования.
10.Масштабируемость (расширяемость).
Расширяемость – это свойство системы, допускающее предсказуемую поддержку дополнительных пользователей, более высокую производительность и пропускную способность путём добавления вычислительных ресурсов без изменения приложений и административного сопровождения.
Основными характеристиками расширяемости являются:
1) поддержка многопроцессорности;
Растяжимость означает, что архитектура СУБД не должна быть специфицирована некоторым заданным числом процессоров (с одинаковым успехом должна поддерживать и один, и 8 процессоров без дополнительных программных продуктов).
Прозрачность требует, чтобы архитектура СУБД позволяла скрывать изменения в платформе архитектуры от приложений и одно и то же приложение должно одинаково работать на различной платформе.
2) расширяемость архитектуры.
Динамическая расширяемая архитектура (DSA) обеспечивает способность на ходу определять потребность памяти, количество параллельных потоков выполнения заданий и т.п. без останова и перезапуска системы.
