Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
STBDiIS шпоры1.doc
Скачиваний:
16
Добавлен:
26.09.2019
Размер:
275.46 Кб
Скачать

17. Суть многомерного анализа данных, основные понятия. Возможные операции над гиперкубом. Понятие olap.

OLAP  — технология обработки информации, включающая составление и динамическую публикацию отчётов и документов. Используется аналитиками для быстрой обработки сложных запросов к базе данных. Служит для подготовки бизнес-отчётов по продажам, маркетингу, в целях управления, т. н. data mining — добыча данных (способ анализа информации в базе данных с целью отыскания аномалий и трендов без выяснения смыслового значения записей).

По Кодду одновременный анализ по нескольким измерениям определяется как многомерный анализ. Каждое измерение включает направления консолидации данных, состоящие из серии последовательных уровней обобщения, где каждый вышестоящий уровень соответствует большей степени агрегации данных по соответствующему измерению.

В специализированных СУБД, основанных на многомерном представлении данных, данные организованы не в форме реляционных таблиц, а в виде упорядоченных многомерных массивов:

1) гиперкубов (все хранимые в БД ячейки должны иметь одинаковую мерность, то есть находиться в максимально полном базисе измерений) или

2) поликубов (каждая переменная хранится с собственным набором измерений, и все связанные с этим сложности обработки перекладываются на внутренние механизмы системы)

Операции над гиперкубом:1.срез.2вращение.

OLAP-куб содержит в себе базовые данные и информацию об измерениях. Куб потенциально содержит всю информацию, которая может потребоваться для ответов на любые запросы.

Вместе с базовой концепцией существуют три типа OLAP — OLAP со многими измерениями (Multidimensional OLAP — MOLAP), реляционный OLAP (Relational OLAP — ROLAP) и гибридный OLAP (Hybrid OLAP — HOLAP). MOLAP — это классическая форма OLAP, так что её часто называют просто OLAP. Она использует суммирующую БД, специальный вариант процессора пространственных БД и создаёт требуемую пространственную схему данных с сохранением как базовых данных, так и агрегатов. ROLAP работает напрямую с реляционным хранилищем, факты и таблицы с измерениями хранятся в реляционных таблицах, и для хранения агрегатов создаются дополнительные реляционные таблицы. HOLAP использует реляционные таблицы для хранения базовых данных и многомерные таблицы для агрегатов. Особым случаем ROLAP является ROLAP реального времени (Real-time ROLAP — R-ROLAP). В отличие от ROLAP в R-ROLAP для хранения агрегатов не создаются дополнительные реляционные таблицы, а агрегаты рассчитываются в момент запроса. При этом многомерный запрос к OLAP-системе автоматически преобразуется в SQL-запрос к реляционным данным.

18. 12 Правил Кодда.

1.Многомерность

2.Прозрачность.

3.Доступность.

4.Постоянная производительность при разработке отчета

5.клиент- серверная архитектура

6.равноправие измерений.

7.динамическое управление разряженными матрицами

8.поддержка многопользовательского режима.

9.неограниченные перекрестные операции

10.интуитивная модуляция данными

11.гибкая возможность получения отчета

12.неограниченная размерность и число уровней агрегации

+6

13.пакетное извлечение против интерпретации

14.поддержка всех моделей OLAP анализа

15.обработка ненормализованных данных

16.Сохранение результатов OLAP

17.исключение отсутствующих значений.

18.обработка отсутствующих значений

4 особенности на основе 18 правил

1.группа основных особенностей, к ней относят правило 1,3,10,14,13,,5,2,8

2.специальные особенности:15,16,17,18

3.особенности предст. Отчетов:11,4,7

4.управление измерений:6,12,9

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]