Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Раздаточный материал по информатике / 10 - Обработка и анализ данных (1-OLAP).doc
Скачиваний:
87
Добавлен:
23.05.2015
Размер:
863.23 Кб
Скачать

1. Molap (Multidimensional olap) работают толь­ко с собственными многомерными бд.

MOLAP — это классическая форма OLAP, так что её часто называют просто OLAP. Она использует суммирующую БД, специальный вариант процессора пространственных БД и создаёт требуемую пространственную схему данных с сохранением как базовых данных, так и агрегатов.

  • Системы основаны на патентованных технологиях для мно­гомерных СУБД и являются наиболее дорогими. Они обеспечивают полный цикл OLAP-обработки.

  • Наиболее яркий пример: Oracle Hyperion Essbase - полномасштабный многомерный сервер баз данных для углубленного анализа данных, прогнозирования, моделирования

Oracle Hyperion Essbase 11 is an OLAP (Online Analytical Processing) Server that provides an environment for deploying pre-packaged applications or developing custom analytic and enterprise performance management applications. Oracle Essbase, along with Oracle BI Suite Enterprise Edition Plus, is part of the Oracle BI Foundation.

2. Relational olap (rolap) преобразуют данные, хранимые в классической реляционной базе, в многомерную форму.

ROLAP работает напрямую с реляционным хранилищем, факты и таблицы с измерениями хранятся в реляционных таблицах, и для хранения агрегатов создаются дополнительные реляционные таблицы.

Особым случаем ROLAP является ROLAP реального времени (Real-time ROLAP — R-ROLAP). В отличие от ROLAP в R-ROLAP для хранения агрегатов не создаются дополнительные реляционные таблицы, а агрегаты рассчитываются в момент запроса. При этом многомерный запрос к OLAP-системе автоматически преобразуется в SQL-запрос к реляционным данным.

  • ROLAP-системы хорошо приспособлены для работы с крупными ХД.

  • Наиболее яркий пример: Microsoft OLAP Analysis Server 2008 (2009b1).

3. Гибридные системы (Hybrid OLAP, HOLAP) разработаны с целью совмеще­ния достоинств и минимизации недостатков, присущих пре­дыдущим классам.

HOLAP использует реляционные таблицы для хранения базовых данных и многомерные таблицы для агрегатов.

  • Media/MR компании Speedware. По утверждению разработчиков, он объединяет аналитическую гибкость и скорость ответа MOLAP с постоянным доступом к реальным данным, свойственным ROLAP.

Многомерный OLAP (MOLAP)

СУБД, основанные на многомерном представлении, данные организованы не в форме реляционных таблиц, а в виде упорядоченных многомерных массивов:

  • гиперкубов (все хранимые в БД ячейки должны иметь одина­ковую мерность, то есть находиться в максимально полном базисе измерений)

  • поликубов (каждая переменная хранится с собственным на­бором измерений, и все связанные с этим сложности обра­ботки перекладываются на внутренние механизмы системы).

Преимущества:

1. В случае использования многомерных СУБД поиск и выборка данных осуществляется значительно быстрее, чем при мно­гомерном концептуальном взгляде на реляционную базу данных. Среднее время ответа на нерегламентированный запрос при использовании многомерной СУБД обычно на один-два по­рядка меньше, чем в случае реляционной СУБД.

2. Из-за объективно существующих ограничений SQL в реляци­онных СУБД невозможно (или, по крайней мере, достаточно сложно) реализовать многие встроенные функции, легко обеспечиваемые в системах, основанных на многомерном представлении данных.

С другой стороны, имеются существенные ограничения.

1. Многомерные СУБД не позволяют работать с большими базами данных. На сегодняшний день их реальный предел – 200-300 ги­габайт.

2. Многомерные СУБД, по сравнению с реляционными БД, очень не­эффективно используют внешнюю память. Таким образом, при проектировании многомерной БД часто приходится жертвовать либо быстродействием (а это одно из первых достоинств и главная причина выбора именно мно­гомерной СУБД), либо внешней памятью (хотя, как отмеча­лось, максимальный размер многомерных БД ограничен).

3. В настоящее время для многомерных СУБД отсутствуют еди­ные стандарты на интерфейс, языки описания и манипулиро­вания данными.

4. Многомерные СУБД не поддерживают репликацию данных, часто используемую в качестве механизма загрузки.

Следовательно, использование многомерных СУБД оправ­дано только при следующих условиях.

1. Объем исходных данных для анализа не слишком велик, (десятки гигабайт), то есть уровень агрегации дан­ных достаточно высок.

2. Набор информационных измерений стабилен (поскольку лю­бое изменение в их структуре почти всегда требует полной перестройки гиперкуба).

3. Время ответа на нерегламентированные запросы является наиболее критичным параметром.

4. Требуется широкое использование сложных встроенных функций для выполнения кроссмерных вычислений над ячейками гиперкуба, в том числе использование пользовательских функций.

Реляционный OLAP (ROLAP)

Непосредственное использование реляционных БД в ка­честве исходных данных в системах оперативной аналитиче­ской обработки.

Преимущества:

1. При оперативной аналитической обработке содержимого ХД инструменты ROLAP позволяют произво­дить анализ непосредственно над хранилищем (потому что в подавляющем большинстве случаев корпоративные хранили­ща данных реализуются средствами реляционных СУБД).

2. В случае переменной размерности задачи, когда изменения в структуру измерений приходится вносить достаточно часто, ROLAP системы с динамическим представлением размерности являются оптимальным решением, так как в них такие моди­фикации не требуют реорганизации БД.

3. Системы ROLAP могут функционировать на гораздо менее мощных клиентских станциях, чем системы MOLAP, поскольку основная вычислительная нагрузка в них ложится на сервер, где выполняются сложные аналитические SQL-запросы формируемые системой.

4. Реляционные СУБД обеспечивают значительно более высокие уровень защиты данных и разграничение прав доступа.

5. Реляционные СУБД имеют реальный опыт работы с очень большими базами данных и развитые средства администрирования.

Недостатки:

1. Это, во-первых, ограниченные возможности с точки зрения расчета значений функционального типа,

2. Во-вторых - мень­шая производительность. Для обеспечения сравнимой с MOLAP производительности реляционные системы требуют тщательной проработки схемы БД и специальной настройки индексов.