Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Шпора ПРИС для Тани.docx
Скачиваний:
25
Добавлен:
09.12.2018
Размер:
183.51 Кб
Скачать
  1. Развитие инфраструктуры базы данных. Организация децентрализованного хранения данных.

В 70-х годах использовалась архитектура клиент-сервер на основе локальной сети с централизованной базой данных.

В этом случае данные обычно хранятся на выделенном компьютере – сервере, а доступ к ним и их представление организуется через клиентские программы.

Чтобы сделать запрос, клиент устанавливает соединение с сервером. Сервер анализирует инструкции, выполняет их, извлекает данные и возвращает результаты запроса.

В такой системе отражается, во-первых, удачное сочетание централизованного хранения, обслуживания и коллективного доступа к общей корпоративной информации. Во-вторых, реализуется многопользовательский доступ к данным, поскольку существует возможность предоставлять одни и те же данные нескольким клиентам одновременно, решая при этом проблемы совместного доступа.

В 80-е годы произошли серьезные изменения в социальной и технологической сферах, сильно повлиявшие на разработку баз данных:

  1. Рост конкуренции в глобальных масштабах;

  2. Возросшие потребности рынка и запросы пользователей на быстро меняющиеся события, требующие немедленного отклика и быстрого доступа к информации. Централизованный подход был хорош для структурирования информации корпорации, но плохо годился для оперативного получения информации, когда необходим был быстрый, незапланированный заранее доступ к базе данных с помощью нерегламентируемых запросов.

  3. Географическая децентрализация операций. Происходит территориальное развитие предприятий, использующих локальные сети в качестве основы компьютеризации бизнеса и связанная с этим необходимость распределенной обработки данных.

Все эти факторы приводят к возникновению ряда проблем, свойственных централизованной архитектуре:

  • большой объем обмена данных;

  • снижение надежности обмена данными; что связано с зависимостью от центрального узла;

  • ухудшение общей производительности; из-за возрастающего числа пользователей, удаленных на большие расстояния. По мере возрастания нагрузки производительность сервера снижается. Чтобы избежать этого, задействуют дополнительные ресурсы, например, наращивают память, ставят дополнительные процессоры и даже сетевые платы.

  • рост затрат на разработку базы данных. Высокая стоимость, связанная с обслуживанием и поддержкой центральной базы данных, размещенной на мэйнфрейме.

В 1990-е годы влияние этих факторов еще более усилилось.

На способы реализации новых подходов сильное влияние оказали и такие важные явления как:

  • возрастающее признание Интернет и использование WWW в качестве платформы для доступа к данным и их распределения. WWW фактически стала хранилищем распределенных данных;

  • повышенное внимание к анализу данных, что привело к появлению специфических технологий анализа информации в БД (data mining) и создание хранилищ данных.

Возможным решением перечисленных проблем является организация децентрализованного хранения данных – обеспечения хранения данных в местах их возникновения или обработки, что привело к созданию распределенных многопользовательских баз данных (РаБД), а, следовательно, информационные системы стали называться распределенными.

  1. Понятие распределенной информационной системы. Распределенные базы данных. Принципы создания и функционирования распределенных баз данных.

Распределенная база данных (Distributed Database – DDB) – это совокупность логически взаимосвязанных баз данных, распределенных в компьютерной сети.

В распределенных системах база данных состоит из нескольких частей, которые называются фрагментами базы данных.

Пример конфигурации распределенной базы данных представлен на рис.

Распределенная база данных предполагает физическое разделение на фрагменты и распределение их по локальным узлам сети данных.

Главный критерий распределения данных в сети состоит в следующем: данные должны находиться там, где существует наибольшая частота обращения к ним. Такой подход обеспечивает быстрый и эффективный доступ к данным.

Каждый фрагмент базы данных сохраняется на одном или нескольких узлах, соединенных между собой линиями связи, и каждый из них работает под управлением отдельной СУБД.

Будучи фрагментом общего пространства данных, часть базы данных функционирует как полноценная локальная база данных. Управление выполняется локально и независимо от других узлов системы.

Пользователи взаимодействуют с распределенной базой данных через приложения.

Принципы создания и функционирования распределенных баз данных

Принципы построения РБД.

  • Минимизация интенсивности обмена данными (сетевого трафика)

  • Оптимальное размещение серверных и клиентских приложений в сети

  • Декомпозиция данных на часто и редко используемые сегменты (для правильной настройки репликации - размещение наиболее часто используемых данных на АРМ конечных пользователей)

  • Периодическое сохранение копий данных и выполнение действий по поддержке целостности распределенной информационной системы.

К. Дейт сформулировал 12 требований к распределенной базе данных:

  1. Локальная автономия. Означает, что управление данными на каждом из узлов распределенной системы выполняется локально.

  2. Независимость узлов. Предполагает, что все узлы равноправны и независимы, а расположенные на них базы являются равноправными поставщиками данных в общее пространство данных. База данных на каждом из узлов включает полный собственный словарь данных и полностью защищена от несанкционированного доступа.

  3. Непрерывность операций. Это возможность непрерывного доступа к данным в рамках распределенной базы данных вне зависимости от их расположения и вне зависимости от операций, выполняемых на локальных узлах.

  4. Прозрачность расположения. Пользователь, обращающийся к базе данных, ничего не должен знать о реальном, физическом размещении данных в узлах информационной системы.

  5. Прозрачная фрагментация. Это требование определяется как возможность распределенного (то есть на различных узлах) размещения данных, логически представляющих собой единое целое.

  6. Независимое тиражирование. Предполагает перенос изменений объектов исходной базы данных в базы, расположенные на других узлах распределенной системы.

  7. Обработка распределенных запросов. Заключается в возможности выполнения операций выборки данных из распределенной базы данных, посредством запросов на языке SQL.

  8. Обработка распределенных транзакций. Предполагает выполнение операций обновления распределенной базы данных, не нарушающих целостность и согласованность данных.

  9. Независимость от оборудования. Означает, что в качестве узлов распределенной системы могут выступать компьютеры любых моделей и производителей. Система должна выполняться на любой аппаратной платформе.

  10. Независимость от операционных систем. Допускает многообразие операционных систем, управляющих узлами распределенной системы.

  11. Прозрачность сети. Трактуется как возможность использования в распределенной системе любых сетевых протоколов.