Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ИТ ответы на зачет.docx
Скачиваний:
359
Добавлен:
22.05.2015
Размер:
115.99 Кб
Скачать

33.Понятие, особенности и назначение технологии информационных хранилищ.

Одно из направлений интеграции информационных технологий связано с использованием хранилищ данных. ^ Хранилище данных (Data warehouse) — это предметно-ориентированное, интегрированное, привязанное ко времени и неизменяемое собрание данных для поддержки процесса принятия управляющих решений.

Технологии организации данных в хранилище отличаются следующими свойствами: 􀂃 данные в хранилище организованы вокруг существенных аспектов прикладной деятельности организации, например, товар, покупатель, продажа и т.д. (свойство предметно ориентированности);

􀂃 информация в хранилище должна интегрироваться в целостную структуру, обеспечивающую возможности анализа данных (свойство интегрированности);

􀂃 хранилище можно рассматривать как набор моментальных снимков состояния данных так, что атрибут времени всегда явно присутствует в структурах данных хранилища (свойство привязки ко времени);

􀂃 данные, попав однажды в хранилище, никогда не изменяются, а только пополняются новыми данными из оперативных систем, где данные постоянно меняются (свойство неизменяемости).

Оперативные данные могут собираться из различных источников:

􀂃 иерархические и сетевые базы данных первого поколения, хранящие корпоративные данные;

􀂃 реляционные базы данных, хранящие оперативные данные различных подразделений;

􀂃 закрытые сервера;

􀂃 внешние системы (Интернет, базы данных поставщиков и т. д.).

Важнейшим элементом хранилища являются так называемые метаданные. Метаданные описывают структуру, размещение, трансформацию данных, используемых любыми процессами хранилища.

Метаданные могут быть востребованы для различных целей, например: извлечения и загрузки данных; обслуживания хранилища и запросов.

Метаданные для различных процессов могут иметь различную структуру, т. е. для одного и того же элемента данных может существовать несколько вариантов метаданных.

В технологии хранилищ данных можно выделить пять основных информационных потоков данных.

Входной поток представляет процессы извлечения, очистки и загрузки исходных данных в хранилище. Поступающие данные в хранилище подвергаются перестройке в соответствии с определенными требованиями. Восходящий поток связан повышением ценности сохраняемых в хранилище данных Нисходящий поток определяет архивирование и резервное копирование данных. Выходной поток — предоставление данных пользователям.

Метапоток определяет управление метаданными. Он связан с перемещением самих метаданных. Поскольку метаданные содержат описание информации хранилища данных, которое со временем меняется, то и сам метапоток должен соответственно обновляться во времени.

Глобальные хранилища данных предназначены для глобального информационного представления корпорации. Различают три типа таких хранилищ: 􀂃 географически преобладающая обработка данных (например, необходимо интегрировать бизнес в Москве с бизнесом в Ростове и так далее);

􀂃 функционально преобладающая обработка данных (производственная деятельность должна быть интегрирована с поставками, которые необходимо интегрировать с продажами, а те - с исследованиями и так далее); 􀂃 отраслевая преобладающая обработка данных (например, требуется интегрировать печатное дело с консалтингом, который подлежит интеграции с бизнесом в сфере медицинского оборудования, а тот - со специализацией в области программного обеспечения).