3.10. Структура корпоративной информационной системы

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Национальный минерально-сырьевой университет «Горный»

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Базы_данных_29.09.05.doc

Скачиваний:

Добавлен:

01.04.2025

Размер:

3.29 Mб

Скачать

☆

<<< < Предыдущая 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 1920 / 2720 21 22 23 24 25 26 27 > Следующая >>>

3.10. Структура корпоративной информационной системы

Хранилище данных (data warehouse)

Центральное место в КИС занимает хранилище данных. Идею хранилища данных предложил Б. Инмон (Willian H. Inmon), определяя его как предметно-ориентированные интегрированные, неизменчивые, поддерживающие хронологию наборы данных, организованные в целях поддержки корпоративного управления, призванные выступать в роли единого и единственного источника истины, обеспечивающие менеджеров и аналитиков достоверной информацией, необходимой для оперативного анализа и поддержки принятия решений.

В основу концепции положена идея интеграции ранее разъединенных детализированных данных из транзакционных систем оперативной обработки данных (СОД/OLTP), а также из внешних источников в целях информационной поддержки управления. Характерными чертами хранилищ являются историчность хранимых данных, наличие метаданных и ориентация на аналитическую обработку накопленной информации.

Для организации ретроспективы сведений в хранилищах поддерживается два варианта истории.

Хронологический набор событий – событийная история, которая поддерживается с помощью характеристических сущностей, в каждой записи которых существует дата, связанная с конкретным событием. В большинстве случаев транзакционные системы регистрируют именно события – отгрузку товара, выпуск продукции и т.д.
Хронологический набор изменений сущности – история информационных объектов. В этом случае хранятся все состояния объекта с датой начала и датой конца (например, история регистрационных сведений юридического лица). Обычно история объектов поддерживается с помощью дополнительной сущности – архива, куда записываются все предыдущие состояния объекта.

Ключевым понятием в концепции хранилищ являются метаданные – это электронная документация о системных и бизнес-процессах. Метаданные необходимы в связи с тем, что огромные объемы информации в хранилище создают сложности при их обработке. Посредством метаданных организуется работа инструментов поддержки принятия решений, выполняется сопровождение АИС в процессе ее жизненного цикла. Метаданные делятся на системные (генерируются и используются СУБД), операционные (отвечают за процессы загрузки информации и обработку информации посредством заданной бизнес-логики), навигационные (поддерживают возможность нерегламентированных запросов), аналитические (обеспечивают многомерный анализ данных). Метаданные часто размещаются в репозитории, который позволяет совместно использовать метаданные различными инструментами и процессами при проектировании, установке, использовании, эксплуатации и администрировании хранилища данных.

Процесс создания хранилища данных начинается с функционального моделирования бизнес-процессов, имеющих место в корпорации. При этом используется методология структурного анализа (Structured Analysis and Design – SADT). Выполняется исследование существующих информационных потоков, включая ведомственную и статистическую отчетность, структуры баз данных систем оперативной обработки информации, общесистемные справочники. Выделяются основные бизнес-понятия и бизнес-события, имеющие место в предметной области.

Хранилище организуется в виде совокупности информационных объектов, каждый из которых на метауровне СУБД представлен рядом взаимосвязанных сущностей, а на уровне метаданных хранилища – соответствующими моделями анализа накопленной информации. Событийная информация и информация, связанная с фиксацией состояний объектов, представляются структурами типа «звезда» (см. ниже), ориентированными на последующую многомерную аналитическую обработку данных. Детализированная информация, соответствующая экземплярам основных бизнес-понятий, представляется в виде многоуровневых иерархических структур (ведомственных реестров) или автономных справочников.

Основу корпоративного хранилища составляет определенная совокупность звездообразных информационных объектов. При этом консолидация информации осуществляется на основе общесистемных справочников, играющих роль измерений в многомерных аналитических моделях. Доступ к некоторым измерениям, соответствующим базовым реестрам конкретного предметного приложения, осуществляется посредством навигационных моделей.

Создание хранилища данных из независимых источников данных – многоэтапный процесс, который предусматривает извлечение данных из каждого источника, преобразование их в соответствии со схемой хранилища, очистку, возможно, агрегацию, а затем загрузку в хранилище. Для этого применяются средства ETL (Extracting, Transformating and Loading), выполняющие перечисленную последовательность операций. К представителям средств ETL можно отнести SAS Institute Multiple Engine Architecture (MEA), Microsoft Data Transformation Services (DTS), Oracle Warehouse Builder и др.

Предусмотрено несколько вариантов загрузки информации в хранилище данных. В случае использования информации систем оперативной обработки данных применяются регламентированные сценарии загрузки насосов данных (pump). Возможна также загрузка на основе подготовленных форм в формате электронных таблиц Excel или XML-документов. В ряде случаев организуются специализированные клиентские места, согласованные с метауровнем хранилища данных.

Предпочтительной является трехуровневая структура КИС:

корпоративное хранилище данных;
витрины данных для соответствующих подразделений (множество тематических баз, содержащих информацию, относящуюся либо к конкретному подразделению организации, либо к отдельному аспекту ее деятельности);
рабочие места конечных пользователей, на которых установлен аналитический инструментарий.

Витрина данных (Data Mart) – это облегченный вариант корпоративного хранилища. Развитие КИС обычно начинается с создания согласованных витрин данных по отдельным аспектам деятельности корпорации.

С учетом сложности КИС и длительности их жизненного цикла используются специализированные средства автоматизированного проектирования информационных систем (CASE-средства). Так для ведения хранилищ данных могут быть использованы, в частности, системы SAS System (SAS Institute), ERWin (Logic Works), Designer/2000 (Oracle Corp), Power Designer (Powersoft Corp) и др.

Оперативная аналитическая обработка данных (OLAP)

Структура базы данных хранилища обычно разрабатывается таким образом, чтобы максимально облегчить анализ информации. Данные должно быть удобно «раскладывать» по разным направлениям (называемым измерениями). Например, сегодня пользователь хочет посмотреть сводку поставок деталей по поставщикам, чтобы сравнить их деятельность. Завтра этому же пользователю понадобится картина изменения объема поставок деталей по месяцам, чтобы проследить динамику поставок. Структура базы данных должна обеспечивать проведение подобных типов анализа, позволяя выделять данные, соответствующие заданному набору измерений.

В основе оперативной аналитической обработки данных лежит принцип организации информации в гиперкубическую модель. Простейший трехмерный куб данных по поставкам деталей для ранее рассмотренной тестовой базы данных приведен на рис. 3.11. Каждая его ячейка соответствует «факту» – например, объему поставки детали. Вдоль одной грани куба (одного измерения) располагаются месяцы, в течение которых выполнялись отражаемые кубом поставки. Второе измерение составляют виды деталей, а третье – соответствует поставщикам. В каждой ячейке содержится объем поставки для соответствующей комбинации значений по всем трем измерениям. Следует отметить, что при заполнении куба выполнена агрегация значений по поставкам каждого месяца из тестовой базы данных.

<<< < Предыдущая 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 1920 / 2720 21 22 23 24 25 26 27 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
15.08.20196.61 Mб17Арчегов-лаб геол задачник.doc
#
01.05.2025605.18 Кб1АрчКонспект _Горное дело-2сем.doc
#
02.04.20151.42 Mб60Атомная спектроскопия.pdf
#
23.11.2019241.15 Кб72Ацэнка вынікаў Беларуская мова.doc
#
09.11.20186.58 Mб10б.у..doc
#
01.04.20253.29 Mб0Базы_данных_29.09.05.doc
#
21.08.2019266.75 Кб16БАНКОВСКИЙ КРЕДИТ.doc
#
14.03.2016736.91 Кб16БАРАБАН.pdf
#
02.04.20154.15 Mб168Баракова. Первый Курс.doc
#
01.05.2025406.53 Кб0Баталов АА курсовая БА-10-2 Организация произво...doc
#
14.03.201620.9 Кб139Батыево нашествие на Русь.docx