- •Тема 10. Методы обработки и анализа данных для поддержки принятия решений
- •10.1. Оперативная аналитическая обработка данных (olap)
- •1. Molap (Multidimensional olap) работают только с собственными многомерными бд.
- •2. Relational olap (rolap) преобразуют данные, хранимые в классической реляционной базе, в многомерную форму.
1. Molap (Multidimensional olap) работают только с собственными многомерными бд.
MOLAP — это классическая форма OLAP, так что её часто называют просто OLAP. Она использует суммирующую БД, специальный вариант процессора пространственных БД и создаёт требуемую пространственную схему данных с сохранением как базовых данных, так и агрегатов.
-
Системы основаны на патентованных технологиях для многомерных СУБД и являются наиболее дорогими. Они обеспечивают полный цикл OLAP-обработки.
-
Наиболее яркий пример: Oracle Hyperion Essbase - полномасштабный многомерный сервер баз данных для углубленного анализа данных, прогнозирования, моделирования
Oracle Hyperion Essbase 11 is an OLAP (Online Analytical Processing) Server that provides an environment for deploying pre-packaged applications or developing custom analytic and enterprise performance management applications. Oracle Essbase, along with Oracle BI Suite Enterprise Edition Plus, is part of the Oracle BI Foundation.

2. Relational olap (rolap) преобразуют данные, хранимые в классической реляционной базе, в многомерную форму.
ROLAP работает напрямую с реляционным хранилищем, факты и таблицы с измерениями хранятся в реляционных таблицах, и для хранения агрегатов создаются дополнительные реляционные таблицы.
Особым случаем ROLAP является ROLAP реального времени (Real-time ROLAP — R-ROLAP). В отличие от ROLAP в R-ROLAP для хранения агрегатов не создаются дополнительные реляционные таблицы, а агрегаты рассчитываются в момент запроса. При этом многомерный запрос к OLAP-системе автоматически преобразуется в SQL-запрос к реляционным данным.
-
ROLAP-системы хорошо приспособлены для работы с крупными ХД.
-
Наиболее яркий пример: Microsoft OLAP Analysis Server 2008 (2009b1).

3. Гибридные системы (Hybrid OLAP, HOLAP) разработаны с целью совмещения достоинств и минимизации недостатков, присущих предыдущим классам.
HOLAP использует реляционные таблицы для хранения базовых данных и многомерные таблицы для агрегатов.
-
Media/MR компании Speedware. По утверждению разработчиков, он объединяет аналитическую гибкость и скорость ответа MOLAP с постоянным доступом к реальным данным, свойственным ROLAP.
Многомерный OLAP (MOLAP)
СУБД, основанные на многомерном представлении, данные организованы не в форме реляционных таблиц, а в виде упорядоченных многомерных массивов:
-
гиперкубов (все хранимые в БД ячейки должны иметь одинаковую мерность, то есть находиться в максимально полном базисе измерений)
-
поликубов (каждая переменная хранится с собственным набором измерений, и все связанные с этим сложности обработки перекладываются на внутренние механизмы системы).
Преимущества:
1. В случае использования многомерных СУБД поиск и выборка данных осуществляется значительно быстрее, чем при многомерном концептуальном взгляде на реляционную базу данных. Среднее время ответа на нерегламентированный запрос при использовании многомерной СУБД обычно на один-два порядка меньше, чем в случае реляционной СУБД.
2. Из-за объективно существующих ограничений SQL в реляционных СУБД невозможно (или, по крайней мере, достаточно сложно) реализовать многие встроенные функции, легко обеспечиваемые в системах, основанных на многомерном представлении данных.
С другой стороны, имеются существенные ограничения.
1. Многомерные СУБД не позволяют работать с большими базами данных. На сегодняшний день их реальный предел – 200-300 гигабайт.
2. Многомерные СУБД, по сравнению с реляционными БД, очень неэффективно используют внешнюю память. Таким образом, при проектировании многомерной БД часто приходится жертвовать либо быстродействием (а это одно из первых достоинств и главная причина выбора именно многомерной СУБД), либо внешней памятью (хотя, как отмечалось, максимальный размер многомерных БД ограничен).
3. В настоящее время для многомерных СУБД отсутствуют единые стандарты на интерфейс, языки описания и манипулирования данными.
4. Многомерные СУБД не поддерживают репликацию данных, часто используемую в качестве механизма загрузки.
Следовательно, использование многомерных СУБД оправдано только при следующих условиях.
1. Объем исходных данных для анализа не слишком велик, (десятки гигабайт), то есть уровень агрегации данных достаточно высок.
2. Набор информационных измерений стабилен (поскольку любое изменение в их структуре почти всегда требует полной перестройки гиперкуба).
3. Время ответа на нерегламентированные запросы является наиболее критичным параметром.
4. Требуется широкое использование сложных встроенных функций для выполнения кроссмерных вычислений над ячейками гиперкуба, в том числе использование пользовательских функций.

Реляционный OLAP (ROLAP)
Непосредственное использование реляционных БД в качестве исходных данных в системах оперативной аналитической обработки.
Преимущества:
1. При оперативной аналитической обработке содержимого ХД инструменты ROLAP позволяют производить анализ непосредственно над хранилищем (потому что в подавляющем большинстве случаев корпоративные хранилища данных реализуются средствами реляционных СУБД).
2. В случае переменной размерности задачи, когда изменения в структуру измерений приходится вносить достаточно часто, ROLAP системы с динамическим представлением размерности являются оптимальным решением, так как в них такие модификации не требуют реорганизации БД.
3. Системы ROLAP могут функционировать на гораздо менее мощных клиентских станциях, чем системы MOLAP, поскольку основная вычислительная нагрузка в них ложится на сервер, где выполняются сложные аналитические SQL-запросы формируемые системой.
4. Реляционные СУБД обеспечивают значительно более высокие уровень защиты данных и разграничение прав доступа.
5. Реляционные СУБД имеют реальный опыт работы с очень большими базами данных и развитые средства администрирования.
Недостатки:
1. Это, во-первых, ограниченные возможности с точки зрения расчета значений функционального типа,
2. Во-вторых - меньшая производительность. Для обеспечения сравнимой с MOLAP производительности реляционные системы требуют тщательной проработки схемы БД и специальной настройки индексов.

