
- •Распределённые базы данных: основные понятия.
- •Аспекты сетевого взаимодействия (необходимые условия функционирования сурбд).
- •2.1. Прозрачность сети
- •2.2. Автоматическое преобразование форматов данных
- •2.3. Автоматическая трансляция кодов
- •2.4. Межоперабельность
- •4. Свойства ddb: обработка распределённых запросов, прозрачность расположения, прозрачная фрагментация, прозрачное тиражирование.
- •5. Свойства ddb: независимость от оборудования, независимость от операционных систем, прозрачность сети, независимость от баз данных.
- •6. Обработка и оптимизация запросов.
- •7. Управление одновременным доступом.
- •7.1. Централизованный протокол двухфазной блокировки
- •7.2. Двухфазная блокировка первичной копии
- •7.3. Распределённый протокол двухфазной блокировки
- •7.4. Протокол блокирования большинства
- •7.5 Альтернативные алгоритм
- •7.2.1. Централизованный метод
- •3. Сбой носителя (диска)
- •4. Коммуникационные сбои
- •9. Технология тиражирования данных.
- •10.Масштабируемость (расширяемость).
- •11. Производительность.
- •12. Смешанная загрузка субд (olcp).
- •13. Постоянная доступность данных.
- •14. Параллельные системы баз данных: общее понятие.
- •15. Цели и параметры параллелизма: ускорение и расширяемость.
- •16. Аппаратная архитектура.
- •17. Параллелизм внутри реляционных операторов.
Распределённые базы данных: основные понятия.
Под распределённой базой данных (РБД, Distributed DataBase – DDB) обычно понимают множество взаимосвязанных баз данных, расположенных на различных узлах компьютерной сети, и, возможно, управляемых различными СУБД. С точки зрения пользователей и прикладных программ распределённая база данных выглядит как обычная локальная база данных.
Система управления распределённой базой данных (СУРБД) определяется как программная система, которая позволяет управлять базой данных таким образом, чтобы её распределённость была прозрачна для пользователей.
В этом определении следует уточнить два отличительных условия.
Первое заключается в том, что система состоит из (возможно, пустого) множества узлов приёма запросов и непустого множества узлов данных. Узлы данных обладают средствами для хранения данных, а узлы приёма запросов – нет: на них лишь выполняются программы, реализующие пользовательский интерфейс для доступа к данным, хранящимся в узлах данных.
Второе условие заключается в том, что узлы логически представляют собой независимые компьютеры, на которых установлены собственные операционные системы (может быть, одинаковые на всех узлах, а возможно, и разные) и могут выполняться независимые приложения. Т.е. узлы – это компьютеры, связанные сетью, а не процессоры, составляющие многопроцессорную конфигурацию. Важнейший отличительный признак – слабосвязанный характер среды, где каждый узел имеет собственную операционную систему и функционирует независимо.
Если мы говорим о распределённых СУБД, то нужно подчеркнуть 2 момента:
1. Распределённая база данных – это именно база данных, а не "коллекция" файлов, индивидуально хранимых на разных узлах сети. В этом заключается различие между РБД и распределённой файловой системой. Распределённые данные представляют собой РБД, только если они связаны в соответствии с некоторым структурным формализмом (таким как реляционная модель), а для доступа к ним имеется единый высокоуровневый интерфейс.
2. Система обладает полной функциональностью СУБД. Она не сводится по своим возможностям ни к распределённым файловым системам, ни к системам обработки транзакций. Обработка транзакций – только одна из функций, предоставляемых подобными системами. Наряду с этим они должны также обеспечивать функции запросов и структурной организации данных, которые необязательно поддерживаются системами обработки транзакций. База данных физически распределяется по узлам данных при помощи фрагментации и репликации (тиражирования) данных. Отношения, принадлежащие реляционной базе данных, могут быть фрагментированы на горизонтальные или вертикальные разделы.
Аспекты сетевого взаимодействия (необходимые условия функционирования сурбд).
(RDA-модель). Её суть заключается в том, что имеется локальный узел (local node) – компьютер, на котором запускаются программы переднего плана (клиент), реализующие как функции интерфейса с пользователем, так и прикладные функции. Он соединён в сеть с удалённым узлом (remote node) – компьютером, на котором выполняется сервер базы данных и находится сама база данных. Все проблемы, возникающие при взаимодействии клиента и сервера, должен решать специальный компонент СУБД, называемый коммуникационным сервером (Communication Server, DBMS Server Net). Для под-держки взаимодействия клиента и сервера он должен функционировать на удалённом узле; в то же время на локальном узле должна выполняться программа связи, взаимодействующая с коммуникационным сервером (DBMS Client Net). В основу взаимодействия прикладных программ-клиентов и сервера базы данных положен ряд фундаментальных принципов, определяющих функциональные возможности современных
СУБД в части сетевого взаимодействия и распределённой обработки данных, среди которых:4