- •8. Распределенные базы данных
- •8.1.Предпосылки возникновения рбд
- •8.2. Классификация систем по способам обработки данных
- •8.3. Однородные и неоднородные системы бд
- •8.4. Стратегия размещения данных в рбд по узлам сети
- •Функции сурбд
- •9. Удаленный доступ взаимодействия с базой данных
- •9.1. Режим работы с бд при удаленном доступе
- •9.2. Архитектура моделей удалённого доступа.
- •2.2.3. Двухуровневые модели. Модель файлового сервера (File Server, fs)
- •9.2.4. Модели удалённого доступа к данным (Remote Data Access, rda) в архитектуре «клиент-сервер»
- •9.2.5. Модель «сервера бд»
- •9.2.6. Хранимые процедуры (хп) и триггеры
- •9.3. Многоуровневые модели 9.3.1. Модель сервера приложений
- •9.3.2. Модель серверов баз данных.
- •9.4. Архитектура распределённых субд
- •10 .Параллельные процессы (или процесс транзакций)
- •10.1. Транзакции
- •10.2. Модели транзакций
- •3.3. Свойства транзакций
- •10.4. Восстановление системы.
- •10.5. Параллельные операции над бд
- •10.6. Проблемы параллелизма
- •10.7. Конфликт транзакций
- •10.8. Элементы блокировки.
- •10.8.1. Бесконечное ожидание и тупики
- •10.8.2. Способы предотвращения тупиков
- •10.9.1. Протоколы и расписания
- •10.9.2. Модель транзакции
- •10.9.3. Протокол, гарантирующий сериализуемость
- •10.10. Модели с блокировками для чтения и записи
- •10.11. Блокировки в Visual FoxPro
- •11. Безопасность бд
- •11.2. Система привилегий.
- •Факультативные возможности grant
- •11.3. Целостность данных
- •11.4. Шифрование данных
- •12. Хранилище данных
- •12.1. Концепция хранилища данных
- •12.2. Многомерная модель данных
- •12.3. Olap – системы
- •12.4. Интеллектуальный анализ данных
8. Распределенные базы данных
8.1.Предпосылки возникновения рбд
Возникновением РБД обусловлены двумя противоположными тенденциями обработки данных: интеграцией и децентрализацией. Интеграция обеспечивает единый взгляд на данные, централизацию управления и ведения баз данных. Децентрализация позволяет приблизить хранение данных к местам их возникновения или обработки, ускоряет и удешевляет обработку.
РБД представляет собой базу данных, отдельные части которой размещены (возможно с дублированием) на нескольких ЭВМ сети. 60-е - 70-е – 80-е гг. - появление и развитие централизованных вычислительных систем. 80-90 – появились распределённые системы. Широко используемые ранее в 60-70-х годах иерархические и сетевые модели данных плохо приспособлены для организации РБД. Так как там требуется использование явных адресных указателей связей между данными и, кроме того - использование процедурного языка манипулирования данными (ЯМД), что ведёт к увеличению периодических сообщений по ЛВС. 80-90г. - используются реляционные базы данных, которые не требуют поддержки явных адресных указателей, наличие непроцедурного языка даёт возможность упростить формулировку сложных запросов. При проектировании РБД обязательно выполняется фрагментация данных – разбиение исходного объекта глобального типа на отдельные части и размещение их на разных ЭВМ. Для получения информации о размещении данных по сети вводится специальный словарь-справочник данных (ССД). Фрагментация может быть горизонтальной (a, b) или вертикальной (1,2 - 3,4), см. рис.1.0.
Рис.1.0. Фрагментация данных
При проектировании РБД выдвигается ряд требований: быстрая обработка запросов, безопасность, секретность, логическая и физическая независимость данных, прозрачность.
Эти требования означают, что пользователи не замечают распределенность данных, что при одновременной модификации одних и тех же данных разными пользователями сохраняется целостность данных. А также понимается независимость пользователей и ПП от типа ЛВС и применяемого сетевого программного обеспечения. Пользователь не должен замечать, что его запрос обрабатывается, возможно, на нескольких ЭВМ.
Существуют понятия системы распределенных баз данных (СРБД) и системы распределения обработки данных (СРОД). В СРБД базы данных распределены между несколькими (возможно, территориально разобщенными) ЭВМ. В СРОД возможен параллельный доступ нескольких пользователей к централизованной базе данных. Основной целью СРБД является обеспечение управляемого доступа и независимого обращения к данным, распределённым в сети ЭВМ. Под управляемым доступом понимается степень безопасности, необходимая для защиты данных от неавторизованного доступа. Независимость обращения или разделимость, позволяет пользователям получить доступ к данным через различные, подчас значительно удалённые вычислительные средства. Сеть ЭВМ представляет совокупность неоднородных вычислительных средств, связанных между собой высокоскоростными каналами связи.
Технологические проблемы в РБД делят на 2 категории: 1. проблемы проектирования; 2. проблемы реализации, затрагивающие функционирование распределённой системы.
Факторы, стимулирующие развитие распределённой обработки данных. • Снижение стоимости процессора (мини ЭВМ); • Повышение квалификации конечного пользователя; • Неудовлетворённость пользователя работой централизованных групп; • Творчество пользователей; • Высокая стоимость телефонных каналов; • Теледоступ к базам данных; • Развитие сетевого программного обеспечения; • Секретность. В распределённых системах легче обеспечить секретность, поскольку в них не складываются, «все яйца в одну корзину»; • Перегрузка центральных процессоров.