Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
1-12_i_25-40_IT.docx
Скачиваний:
20
Добавлен:
21.05.2015
Размер:
56.32 Кб
Скачать

32.Информационные хранилища.

Хранилище данных – предметно-ориентированная, интегрированная, содержащая данные, накопленные за большой интервал времени, автоматизированная система, предназначенная для поддержки принятия управленческих решений.

Построение хранилищ данных для интеграции неоднородных источников данных принципиально отличается от построения БД.

2. Свойства информационных хранилищ

Уильям Инман, считающийся основателем нового направления развития технологии БД дал классическое определение информационного хранилища в 1990 году. Он охарактеризовал его как специальным образом администрируемую базу данных, содержимое которой имеет следующие свойства:

1) предметная ориентация (в отличие от БД в традиционных OLTP-системах, где данные подобраны в соответствие с конкретными приложениями, информация в ИХ ориентирована на задачи поддержки принятия решений. Для системы поддержки принятия решений требуются источники);

2) интегрированность данных (данные в ИХ поступают из различных источников, где они могут иметь различные типы, атрибуты, единичные измерения и способы кодирования. После загрузки в ИХ данные очищаются от индивидуальных признаков, то есть как бы приводятся к общему знаменателю);

3) инвариантность во времени (В OLTP-системах истинность данных гарантирована только в момент чтения, поскольку уже в следующее мгновение они могут измениться в результате очередной транзакции. Важным отличием ИХ от БД является то, что данные в них сохраняются свою истинность в любой момент процесса чтения);

4) неразрушимость - стабильность информации (В OLTP-системах записи могут регулярно добавляться, удаляться и редактироваться. В ИХ как следует из требования временной инвариантности, однажды загруженные данные теоретически никогда не меняются. По отношению к ним возможны только две операции: начальная загрузка и чтение (доступ));

5) минимализация избыточности информации;

3. Основные компоненты ИХ

1) ПО промежуточного слоя

Обеспечивает сетевой доступ и доступ к БД. Сюда относятся сетевые и коммуникационные протоколы, драйверы, системы обмена сообщениями и пр.

2) Транзакционные БД и внешние источники информации

Базы данных OLTP-систем

3) Уровень доступа к данным

Относящееся сюда ПО обеспечивает общение конечных пользователей с ИХ и загрузку требуемых данных из транзакционных систем. В настоящее время универсальным языком общения служит язык структурированных запросов (SQL)

4) Загрузка и предварительная обработка

Этот уровень включает в себя набор средств для загрузки данных из OLTP-систем и внешних источников. Выполняется, как правило, в сочетании с дополнительной обработкой: проверку данных на чистоты, консолидация, форматированием, фильтрацией и пр.

5) Информационное хранилище

Представляет собой ядро всей системы – один или несколько серверов БД

6) Метаданные

Метаданные (репозиторий “данных о данных”). Играют роль справочника, содержащего сведения об источних первичных данных, алгоритмах обработки, которым исходные данные подверглись и т.п.

7) Уровень информационного доступа

Обеспечивает непосредственное общение пользователя с данными посредством стандартных систем манипулирования, анализа и предоставления данных типа MS Exel, MS Access, Lotus Notes и др.

8) Уровень управления (администрирования)

Отслеживает выполнение процедур, необходимых для обновления информационного хранилища или поддержания его состояния. Здесь программируются процедуры подкачки данных, перестройки индексов, выполнение итоговых расчетов, репликации данных, построение отчетов, формирование сообщений пользователей, контроля целостности и др.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]