
- •Хранилища данных
- •Содержание
- •Введение
- •Гипотеза — модель — решение.
- •Эволюция корпоративных информационных систем
- •Что такое olap
- •Общие свойства хранилищ
- •Ориентированность на предметную область
- •Интегрированность
- •Зависимость от времени
- •Постоянство
- •Данные хранилища
- •Источники данных
- •Хранилище данных (в узком смысле)
- •Оперативный склад данных (Operational Data Store - ods)
- •Витрины данных (Data mart)
- •Метаданные
- •С точки зрения пользователей:
- •С точки зрения предметных областей:
- •С точки зрения функциональности системы:
- •Компоненты хранилища
- •Подсистема загрузки данных
- •Подсистема обработки запросов и представления данных
- •Подсистема администрирования хранилища
- •Методика (методология) построения хранилищ данных
- •Постановка задачи Системно-аналитическое обследование
- •Техническое задание
- •Проектирование
- •Автоматизируемые процессы и функции
- •Информационное обеспечение
- •Компонентная архитектура
- •Техническая архитектура
- •Реализация
- •Внедрение
- •Выбор метода реализации Хранилищ данных
- •Продукция Microsoft
- •Продукция Sybase
- •Продукция Oracle
- •Oracle bi Suite ee - самая «интеллектуальная» из аналитических платформ
- •Архитектура
- •Клиентские приложения
- •Метаданные
- •Выбор продукта
- •Многомерные кубы
- •Некоторые термины и понятия
- •Типичная структура хранилищ данных
- •Olap на клиенте и на сервере
- •Технические аспекты многомерного хранения данных
- •Условные сокращения и обозначения
- •Словарь
- •Список использованных источников
Продукция Microsoft
Фирма Microsoft твердо
убеждена, что ее продукты позволяют
значительно усовершенствовать процесс
создания хранилища данных. Она разработала
продукт DataWarehousing
Framework, в котором
объединены различные технологии (доступ
к данным, метаданные, преобразования,
запрос конечного пользователя и т.д.)
во всех
В СУБД MicrosoftSQLServer 7.0 предусмотрено много средств, которые могут помочь в построении хранилища данных. Поддержка больших баз данных, оптимизация запросов и репликация — все эти функции делают SQLServer мощным инструментом для создания хранилища или витрины данных (рис. 5). Гетерогенные запросы позволяют объединить результирующие наборы из нескольких источников данных OLEDB или ODBC. Кроме того, к вашим услугам службы преобразования данных (DTS), склад (Repository) для хранения метаданных, OLAP-средства для принятия решений (DecisionSupportServices) и MicrosoftEnglishQuery (выполнение запросов на английском языке) [10].
Рис. 5. Схема работы с хранилищем данных при помощи продукции Microsoft
Службы преобразования данных (DataTransformationServices – DTS) – это универсальный набор инструментов, встроенный в SQLServer 7.0. Он позволяет легко импортировать, экспортировать и преобразовывать данные, перемещая их между любыми двумя источниками, которые поддерживают OLEDB. В каком-то смысле DTS — это своего рода насос данных, с помощью которого можно перемещать исходные записи с одного места на другое с помощью простого интерфейса мастера.
В DTS предусмотрены службы импорта и экспорта данных из различных источников:
источников данных, поддерживающих OLEDB: Oracle, SQLServer 4.2, 6.5 и др.;
источников данных, поддерживающих ODBC: DB2 на MVS, данных AS400, Informix, MicrosoftAccess, MicrosoftExcel и др.;
текстовых ASCII-файлов, содержащих поля фиксированной длины или разделенных символами-ограничителями.
Приложение MicrosoftRepository — это инфраструктура для хранения и совместного использования метаданных. Оно позволяет простым способом описывать данные, находящиеся в хранилище. С помощью склада информационные структуры данных можно хранить отдельно от самих данных; к этим структурам также можно обращаться из других компонентов архитектуры хранилища данных. Склад хранилища данных обладает следующими возможностями:
сохраняет модели данных со звездообразной структурой;
заносит в каталог связи между элементами данных и исходными СУБД;
регистрирует преобразования данных и родословные данных:
сохраняет правила выборки данных и репликации;
поддерживает работу команды разработчиков.
Службы поддержки принятия решений фирмы Microsoft (MicrosoftDecisionSupportServices) — это инструменты, позволяющие сделать общедоступными возможности OLAP и информацию, находящуюся в хранилище. С их помощью можно представить информацию из хранилища в виде многомерных кубов, что способствует проведению анализа данных.
Главные особенности и преимущества MicrosoftDSS:
доступ к любому поддерживающему OLEDB источнику данных;
поддержка MOLAP (многомерной интерактивной аналитической обработки), ROLAP (реляционной OLAP) и HOLAP(гибрида первых двух);
объединение возможностей хранения данных SQLServer и анализа данных Excel путем поддержки средств создания свободных таблиц;
возможность проведения анализа данных в автономном режиме, например во время передвижения в автомобиле, самолете и т.д.
возможность перехода от настольной системы к общей модели для всего предприятия.