- •5 Назначение AllFusion Data Model Validator. Основные типы обнаруживаемых ошибок (дать примеры ошибок).
- •6. Концепция и назначение хранилища данных, типовая обобщенная схема. Основные отличия от oltp-систем
- •7. Основные способы хранения данных в olap-системах: molap, rolap, holap.
- •8. Реализация хранилища данных по схеме «звезда». Достоинства и недостатки
- •9 Реализация хранилища данных по схеме «снежинка». Достоинства и недостатки.
- •10 Концепция и характеристика распределенных баз данных. Правила Дейта.
- •11 Неоднородные базы данных, проблемы эксплуатации неоднородных баз данных.
- •12 Распределенные базы данных: способы распределения данных между узлами.
- •13 Механизм выполнения транзакций в распределенных базах данных.
7. Основные способы хранения данных в olap-системах: molap, rolap, holap.
MOLAP (Multidimensional OLAP) –— исходные и агрегатные данные хранятся в многомерной базе данных. Хранение данных в многомерных структурах позволяет манипулировать данными как многомерным массивом, благодаря чему скорость вычисления агрегатных значений одинакова для любого из измерений. Однако в этом случае многомерная база данных оказывается избыточной, так как многомерные данные полностью содержат исходные реляционные данные.
Преимущества:
1) высока производительность.
2) структура и интерфейс наилучший образом соответствуют анатомии запросов.
3) в многомерной СУБД легко включать разнообразные встроенные функции.
Недостатки:
1) могут работать только под своими СУБД и явл дорогими.
2) по сравнению с реляц неэффективно использует память.
3) имеет менее эффективный механизм обработки транзакций.
4) отсутствует единый стандарт на интерфейс, языки описания и манипуляции данными.
5) не поддерживают репликацию данных
ROLAP (Relational OLAP) — исходные данные остаются в той же реляционной базе данных, где они изначально и находились. Агрегатные же данные помещают в специально созданные для их хранения служебные таблицы в той же базе данных.
Преимущества:
1) реляц СУБД имеют опыт раб с большими БД, развиты ср-ва администрирования.
2) идеальна в случае изменения размерности задачи, т.к. физическая реорганизация данных не трубуется.
3) обладает более высоким уровнем защиты данных и развитой системой привилегий пользователей.
4) производительность этих систем сравнима с многомерными, если тщательно разработать структуру.
Недостатки:
1) ограничены возможно с точки зрения проведения анализа.
2) производительность ниже
HOLAP (Hybrid OLAP) — исходные данные остаются в той же реляционной базе данных, где они изначально находились, а агрегатные данные хранятся в многомерной базе данных.
8. Реализация хранилища данных по схеме «звезда». Достоинства и недостатки
1.Таблица фактов, находится в сильно денормированной форме. Содержит суммированные данные, с помощью которых проводится анализ
2 Таблицы измерений находятся в денормированной форме и содержат описательную информацию.
Это позволяет пользователю быстро переход от таблицы фактов к доп инф. Таблица фактов и таблица измерений связаны идентиф связями.
Преимущества:
1) благодаря денормализованной таблице измерений упрощается восприятие структуры данных и формул запросов.
2) ускоряется время выполнения запросов за счет уменьшения операция соединения.
3) в нек. СУБД уменьшается время выборки за счет сокращения времени выполнения запросов.
Недостатки:
1) высокая избыточность данных -> дополнительные объемы памяти.
2) если агрегат хранится совместно с исходными данными, необходимо использовать дополнительный параметр - уровни иерархии
9 Реализация хранилища данных по схеме «снежинка». Достоинства и недостатки.
таблица фактов
тов
измер. 1
измер. 3
*
1
*
измер. 2
Схема снежинки получила свое название за свою форму, в виде которой отображается логическая схема таблиц в многомерной базе данных. Схема снежинки представлена централизованной таблицей фактов, соединенной с таблицами измерений. Здесь таблицы измерений нормализованы с рядом других связанных измерительных таблиц, — в то время как в схеме звезды таблицы измерений полностью денормализованы, и каждое измерение представлено в виде единой таблицы, без соединений на связанные таблицы в схеме снежинки. Чем больше степень нормализации таблиц измерений, тем сложнее выглядит структура схемы снежинки. Создаваемый «эффект снежинки» затрагивает только таблицы измерений, и не применим к таблицам фактов.
Достоинства:
1) Экономит ресурсы памяти за счет нормализации таблицы измерений.
2) Т.к. табл нормализована, быстро выполняются запросы, связанные со структурой значений измерений.
Недостаток: большое время выполнения запросов, связанных с аналитической обработкой.