Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
с прошлых лет.doc
Скачиваний:
22
Добавлен:
31.03.2015
Размер:
321.54 Кб
Скачать

7. Основные способы хранения данных в olap-системах: molap, rolap, holap.

MOLAP (Multidimensional OLAP) –— исходные и агрегатные данные хранятся в многомерной базе данных. Хранение данных в многомерных структурах позволяет манипулировать данными как многомерным массивом, благодаря чему скорость вычисления агрегатных значений одинакова для любого из измерений. Однако в этом случае многомерная база данных оказывается избыточной, так как многомерные данные полностью содержат исходные реляционные данные.

Преимущества:

1) высока производительность.

2) структура и интерфейс наилучший образом соответствуют анатомии запросов.

3) в многомерной СУБД легко включать разнообразные встроенные функции.

Недостатки:

1) могут работать только под своими СУБД и явл дорогими.

2) по сравнению с реляц неэффективно использует память.

3) имеет менее эффективный механизм обработки транзакций.

4) отсутствует единый стандарт на интерфейс, языки описания и манипуляции данными.

5) не поддерживают репликацию данных

ROLAP (Relational OLAP) — исходные данные остаются в той же реляционной базе данных, где они изначально и находились. Агрегатные же данные помещают в специально созданные для их хранения служебные таблицы в той же базе данных.

Преимущества:

1) реляц СУБД имеют опыт раб с большими БД, развиты ср-ва администрирования.

2) идеальна в случае изменения размерности задачи, т.к. физическая реорганизация данных не трубуется.

3) обладает более высоким уровнем защиты данных и развитой системой привилегий пользователей.

4) производительность этих систем сравнима с многомерными, если тщательно разработать структуру.

Недостатки:

1) ограничены возможно с точки зрения проведения анализа.

2) производительность ниже

HOLAP (Hybrid OLAP) — исходные данные остаются в той же реляционной базе данных, где они изначально находились, а агрегатные данные хранятся в многомерной базе данных.

8. Реализация хранилища данных по схеме «звезда». Достоинства и недостатки

1.Таблица фактов, находится в сильно денормированной форме. Содержит суммированные данные, с помощью которых проводится анализ

2 Таблицы измерений находятся в денормированной форме и содержат описательную информацию.

Это позволяет пользователю быстро переход от таблицы фактов к доп инф. Таблица фактов и таблица измерений связаны идентиф связями.

Преимущества:

1) благодаря денормализованной таблице измерений упрощается восприятие структуры данных и формул запросов.

2) ускоряется время выполнения запросов за счет уменьшения операция соединения.

3) в нек. СУБД уменьшается время выборки за счет сокращения времени выполнения запросов.

Недостатки:

1) высокая избыточность данных -> дополнительные объемы памяти.

2) если агрегат хранится совместно с исходными данными, необходимо использовать дополнительный параметр - уровни иерархии

9 Реализация хранилища данных по схеме «снежинка». Достоинства и недостатки.

таблица фактов

тов

измер. 1

измер. 3

Прямая соединительная линия 70Прямая соединительная линия 68Прямоугольник 71Прямоугольник 72Прямоугольник 73Прямая соединительная линия 74Прямая соединительная линия 75Прямая соединительная линия 76

*

1

Прямая соединительная линия 65

*

измер. 2

1

Схема снежинки получила свое название за свою форму, в виде которой отображается логическая схема таблиц в многомерной базе данных. Схема снежинки представлена централизованной таблицей фактов, соединенной с таблицами измерений. Здесь таблицы измерений нормализованы с рядом других связанных измерительных таблиц, — в то время как в схеме звезды таблицы измерений полностью денормализованы, и каждое измерение представлено в виде единой таблицы, без соединений на связанные таблицы в схеме снежинки. Чем больше степень нормализации таблиц измерений, тем сложнее выглядит структура схемы снежинки. Создаваемый «эффект снежинки» затрагивает только таблицы измерений, и не применим к таблицам фактов.

Достоинства:

1) Экономит ресурсы памяти за счет нормализации таблицы измерений.

2) Т.к. табл нормализована, быстро выполняются запросы, связанные со структурой значений измерений.

Недостаток: большое время выполнения запросов, связанных с аналитической обработкой.