
Архитектуры хранилищ данных
Несмотря на все разнообразие подходов к практической реализации систем поддержки принятия решений, основных видов хранилищ данных всего три: виртуальное хранилище данных, киоски (или витрины) данных (data mart) и общекорпоративные хранилища данных (enterprise data warehouse). Данные типы хранилищ имеют своих сторонников, а также свои сильные и слабые стороны.
Виртуальное хранилище данных - это система, предоставляющая доступ к обычной регистрирующей системе, которая эмулирует работу с хранилищем данных. Виртуальное хранилище можно организовать двумя способами. Можно создать ряд "представлений" (view) в базе данных или использовать специальные средства доступа к базе данных (например, продукты класса desktop OLAP).
Теперь рассмотрим основные преимущества и недостатки виртуальных хранилищ.
Преимущества:
простота и малая стоимость реализации;
единая платформа с источником информации;
отсутствие сетевых соединений между источником информации и хранилищем данных.
Недостатки:
работа осуществляется лишь с иллюзией хранилища данных;
остаются проблемы с производительностью, трансформацией данных, интеграцией данных с другими источниками, отсутствием истории, чистотой данных;
зависимость от доступности и структуры основной базы данных.
Двухуровневая архитектура хранилища данных подразумевает построение витрин данных без создания центрального хранилища, при этом информация поступает из регистрирующих систем и ограничена конкретной предметной областью. Киоски данных содержат некоторое подмножество всех данных корпорации, которое создается для использования его отдельными подразделениями или отделами организации. Киоски данных содержат агрегированные, а также часто и детализированные, данные о предметной области. Хранимая в киоске данных информация может быть подмножеством корпоративного хранилища (такой киоск называется зависимым), или же, что встречается чаще, она поступает непосредственно из оперативных источников данных (независимый киоск данных).
Преимущества:
простота и малая стоимость реализации;
высокая производительность за счет физического разделения регистрирующих и аналитических систем, выделения загрузки и трансформации данных в отдельный процесс, оптимизированной под анализ структурой хранения данных;
поддержка истории;
возможность добавления метаданных.
Главный недостаток киоска данных состоит в том, что без хранилища данных, которое охватывало бы информацию всего предприятия, невозможно сравнивать и анализировать данные по всем отделам и процессам.
Корпоративное хранилище данных содержит информацию обо всех сторонах деятельности организации, интегрированную из множества оперативных источников данных и предназначенную для решения на ее базе задач консолидированного анализа данных. Корпоративное хранилище содержит наряду с детализированными данными, относящимися к каждому моменту времени, также и агрегированную информацию, а общий объем его данных варьируется от 50 Гбайт до более чем 1 Тбайт. Корпоративные хранилища данных могут потребовать больших затрат денег и времени на разработку и администрирование. Построение полноценного корпоративного хранилища данных обычно выполняется в трехуровневой архитектуре.