Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
КСР2_МнплзБД.doc
Скачиваний:
3
Добавлен:
16.11.2019
Размер:
113.15 Кб
Скачать

Распределенные базы данных классифицируют на:

  • гомогенные (однородные);

  • гетерогенные (неоднородные);

Гомогенной РаБД управляет один и тот же тип СУБД. Гетерогенной РаБД управляют различные типы СУБД, использующие разные модели данных – реляционные, сетевые, иерархические или объектно-ориентированные СУБД.

Гомогенные РаБД значительно проще проектировать и сопровождать. Кроме того, подобный подход позволяет поэтапно наращивать размеры РаБД, последовательно добавляя новые узлы к уже существующей РаБД. Гетерогенные РаБД обычно возникают в тех случаях, когда независимые узлы, управляемые своей собственной СУБД, интегрируются во вновь создаваемую РаБД.

РаСУБД могут работать как в глобальных, так и в локальных сетях. Они предполагают возможности, расширяющие преимущества технологии баз данных. Так, позволяя каждому узлу поддерживать собственную базу данных, добиваются быстрого и эффективного доступа к наиболее часто используемым данным. РаСУБД могут повысить надежность работы в сети. Если компьютер некоторого узла вышел из строя, то нужные данные (ранее скопированные на два и более узлов) РаСУБД предоставит с узла, продолжающего функционировать.

В настоящее время наиболее развитыми в теоретическом и практическом отношении являются реляционные распределенные СУБД. К РаСУБД, наиболее изученным относятся:

  • система SDD-1, созданная в конце 70-х-начале 80-х годов в научно-исследовательском отделении фирмы Computer Corporation of America;

  • система R*, которая является распределенной версией системы System R и создана в начале 80-х годов фирмой IBM;

  • система Distributed INGRES, которая является распределенной версией системы INGRES и создана в начале 80-х годов в Калифорнийском университете в Беркли.

В настоящее время в большинстве коммерческих реляционных серверных СУБД предусмотрены разные виды поддержки использования распределенных баз данных. Наиболее полно функции распределенной СУБД реализованы в системах:

  • Ingres/star, разработанная отделением Ingres Division фирмы The ask Group Inc.;

  • ORACLE 7 фирмы ORACLE Corp.;

  • модуле распределенной системы DB2 фирмы IBM.

Наиболее близко подошли к реализации функций распределенных СУБД такие как: Informix On-line фирмы Informix Software; Sybase System 10 фирмы Sybase Inc.

Системы с распределенными БД имеют дополнительные преимущества перед традиционными централизованными системами баз данных.

Преимущества РаСУБД:

  • Отражение структуры организации.

  • Разделяемость и локальная автономность.

  • Повышение доступности данных.

  • Повышение надежности.

  • Повышение производительности.

  • Экономические выгоды.

  • Модульность системы.

Недостатки РаСУБД:

  • Повышение сложности.

  • Увеличение стоимости.

  • Проблемы защиты.

  • Усложнение контроля за целостностью данных.

  • Отсутствие стандартов.

  • Недостаток опыта.

  • Усложнение процедуры разработки БД.

  • Сложность управления и обусловленная этим потенциальная опасность потери целостности данных.

4

Хранилища данных

Информация, накапливаемая в базе данных информационной системы, чаще всего неструктурированна, несогласованна, разрозненна, ее практически невозможно найти и получить, чтобы принять быстрое управленческое решение. Поэтому в настоящее время требуются новые технологии построения и реализации информационных систем, ориентированных на анализ данных.

Для проведения такого анализа была предложена и разработана концепция хранилища данных.

Хранилище содержит сведения, поступающие от разных источников, а также интегрированные данные, получаемые в результате анализа первичных данных.

Хранилище данных (Data Warehouse) – это предметно-ориентированное, интегрированное, привязанное ко времени и неизменяемое собрание данных для поддержки процесса принятия управленческих решений.

Предметно-ориентированность означает, что данные в хранилище организованы вокруг существенных аспектов деятельности предприятия: товар, покупатель, продажа и т.д. (а не узких атрибутов: счет, накладная, прайс-лист). Для сравнения, операционные БД – функционально ориентированы, т.е. хранится информация о сделках, переводах.

Интегрированность означает, что данные очищены от ошибок и избыточности и предоставлены в виде, необходимом пользователю.

Привязка ко времени означает, что данные расположены в порядке их поступления.

Неизменность означает, что данные, попав в хранилище, не удаляются, а пополняются новыми данными из оперативных систем.

Для данных из различных областей существуют свои хранилища данных:

  • финансовые хранилища данных;

  • хранилища данных в области страхования;

  • для управления людскими ресурсами;

  • в области телекоммуникаций;

  • глобальные хранилища данных;

  • хранилища с возможностями DATA Mining – технологии интеллектуальной обработки данных, ориентированные на область закономерностей.

Использование хранилищ данных имеет ряд преимуществ: скорость доступа к данным; надежность хранения данных.

Для поддержки предложенной концепции потребовались специальные средства управления процессом хранения и обработки информации, к которым относятся инструментальные средства OLAP-технологии.

Технологии OLAP (On-line Analytical Processing – интерактивная аналитическая обработка данных), ориентированны на область агрегированных показателей. Технологии OLAP представляют собой инструмент для анализа больших объемов данных (нерегламентируемые запросы) в режиме реального времени.

В основе концепции OLAP лежит принцип многомерного представления данных. Данные представляются в виде многомерного куба. Хранилища данных представляют собой многомерную базу данных, отделенную от оперативной БД.

Однако организация и управление хранилищами данных требуют много времени и усилий. Поэтому некоторые компании останавливаются на организации «витрин данных», представляющие собой небольшие совокупности данных, предназначенных для ограниченной группы пользователей. При этом выполнение запросов существенно ускоряется. Например, витрины данных могут быть организованы для нескольких подразделений, объем передаваемых данных между которыми несущественен.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]