Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекц-мд-схов.doc
Скачиваний:
44
Добавлен:
20.08.2019
Размер:
72.7 Кб
Скачать

1. Багатовимірна модель

Найбільш вдалою формою сховищ даних, що надає можливість багатовимірної їх параметризаций є представлення даних у вигляді не плоскої реляційної моделі, а багатовимірної моделі даних. Системи на основі багатовимірних моделей дістали назву MOLAP-систем (Multidimensional OLAP).

В основі багатовимірної моделі лежить поняття багатовимірного куба даних, у комірках якого зберігаються показники (змінні), що аналізуються, (наприклад обсяги продаж), а вимірювання характеризують якісь ознаки цих показників (скажімо регіони, де виконувались продажі; календарні періоди, за які ведеться облік продаж). У найпростішому варіанті двовимірної моделі маємо таблицю, що показує значення обсягів продажу по товарах і календарних періодах. Додавши третій вимір — регіон, отримуємо представлення моделі у вигляді куба

Подальше ускладнення моделі даних може виконуватись у кількох напрямах:

• збільшення числа вимірювань — дані про продаж не тільки по місяцях, товарах і клієнтах, а й по регіонах дає чотиривимірну модель. Збільшення кількості вимірювань дасть ІV-вимірну модель;

• ускладнення вмісту комірки — наприклад, у комірці розташовуються не лише обсяги продаж, а й чистий прибуток і залишок на складі. У такому разі в комірці буде кілька значень змінних, що аналізуватимуться.

Приклад куба, який призначений для аналізу прибутку від реалізації продукції, наведено на рис. 10.2.

Таким чином, основними поняттями багатовимірної моделі є: вимір (Dіmensions), відношення вимірів та комірки (Cell), в якій зберігаються певні дані, що аналізуються. Іноді замість терміну «комірка» вживається термін «показник» чи «змінна» (Measure).

Показник, або змінна, — це поле, значення якого однозначно визначаються фіксованим набором вимірів, що характеризують певний факт.

Показники, або змінні, складають, як правило, основний вміст сховища даних і можуть бути представленими:

• числовими характеристиками факту чи події, що відбувалися на об'єкті управління, для якого створюється сховище (наприклад, обсяги чи дохід від продажів);

* формулами, що, як правило, являють собою прості функції агрегування показників (змінних) для отримання узагальнених даних (наприклад, сума, яка консолідує значення змінної за кілька календарних періодів в одне підсумкове значення).

Вимір — це множина однотипних даних, що утворюють одну з граней куба і характеризують якусь ознаку показників, котрі знаходяться в комірці багатовимірного куба.

Наприклад, день, місяць, квартал, рік — це виміри часу; район, область, країна — це географічні виміри. За виміром виконується індексація даних у багатовимірній базі даних (ББД). Виміри бувають колективними (shared dimensional) та приватні (private dimensional).

Колективні виміри — це виміри, які можуть використовуватись одночасно в декількох кубах. Колективними вимірами можуть бути якісь ознаки, які використовуються при бізнес-аналізі різних предметних областей. Приватні виміри — це виміри, які належать конкретному кубу і створюються разом з ним. Інакше кажучи, це специфічні ознаки, що характеризують лише певну конкретну предметну область.

Сукупність вимірів визначають параметри простору, в якому можна буде виконувати бізнес-аналіз.

Відношення — це зв'язки між різними вимірами моделі та між окремими значеннями всередині певного виміру.

Між окремими значення всередині певного виміру повинна бути певна ієрархія, котра, як правило, характеризує тип відношення «один до багатьох», наприклад населений пункт, район, область. Відношення можуть також визначати зв'язки між двома різними вимірами. Наприклад, вимір ТОВАР може бути зв'язаним з виміром КАТЕГОРІЯ, яка, може, в свою чергу, набувати таких значень: «Побутові товари», «Спортивні товари», «Канцелярські товари» та ін. В переважній більшості випадків ці зв'язки характеризують тип відношення «один до одного» Відношення між вимірами визначають порядок агрегування показників (змінних) багатовимірної моделі.

У багатовимірних СУДБ (БСКДБ) використовуються два основних варіанти організації даних: гіперкубічна модель, полікубічна модель.

Гіперкубічна модель — це модель, показники якої визначаються однаковими наборами вимірювань.

Полікубічна модель — це модель, що підтримує кілька гіперкубів різної розмірності з різними вимірами їх граней.

При виконанні запитів у багатовимірній моделі можуть здійснюватись такі операції:

Операція перетину (slice-and-dice) виконує вибірку, яка зменшує розмірність куба. При виконанні операції перетину формується підмножина гіперкуба, в якому значення одного чи кількох вимірів фіксовано. Наприклад, зафіксувавши вимір «Період» і надавши йому якесь конкретне значення, отримуємо двовимірну таблицю з даними про обсяги продажів за вказаний період. Фіксація значення виміру при виконанні операції перетину зменшує розмірність куба.

Операції розгортання та згортання (drill-down і roll-up) — взаємно протилежні операції, які використовують ієрархію вимірів і змінних для деталізації чи агрегування показників. Для виконання операцій згортання і деталізації повинна існувати ієрархія значень вимірів, тобто підпорядкованість одних значень іншим. Наприклад, у межах виміру «Період» може виводитись певна ієрархія значень, наприклад, рік, квартал, місяць і т.д. При виконанні операції згортання одне із значень виміру замінюється іншим значенням більш високого рівня ієрархії. Виконання цієї операції забезпечує перехід від деталізованих до узагальнених даних. Операція деталізації — це операція, яка є зворотною щодо операції згортання. Вона забезпечує перехід від узагальнених до деталізованих даних.

Операція об'єднання (drill-across) комбінує куби, які мають одне чи кілька спільних вимірювань. З позицій реляційної алгебри така операція виконує з'єднання кубів (join).

Операція обертання (rotating) куба надає користувачеві можливості побачити дані, сгруповані за іншими вимірами. Операції обертання змінюють порядок представлення вимірів. Як правило, вони використовуються для більш зручного погляду сприйняття представлення двовимірних таблиць. Після виконання цієї операції міняються місцями рядки і стовпчики таблиці.

Показники, що перебувають у комірках багатовимірної моделі можна відшукати за будь-яким вимірюванням чи їх комбінацією. Тобто, при аналізі обсягів продажів можна підрахувати число виробів, проданих протягом останнього року, підсумувавши дані про обсяги продажів за кожен місяць. Якщо необхідно з'ясувати, який з регіональних відділів продажів показав кращі результати, можна виконати пошук по регіонах і знайти максимальну величину обсягу продажів у межах регіону.

MOLAP-системи досить чутливі до обсягів даних, що зберігаються.

Проте багатовимірна модель має серйозні недоліки, які гальмують її широке застосування. У багатовимірній моделі заздалегідь резервується місце для всіх значень, навіть якщо частина з них відсутня. Тобто не всі комірки багатовимірного куба можуть бути заповнені конкретними даними. Другий недолік полягає в тому, що вибір високого рівня деталізації при реалізації гіперкуба може дуже збільшити розмір у багатовимірного сховища. Через це поширені на ринку багатовимірні СКБД не в змозі оперувати даними великого обсягу. Вони, як правило, обмежуються 10—20 гігабайтами. Багатовимірну модель доцільно використовувати тоді, коли обсяги інформації, яку потрібно зберігати, невеликі, і гіперкуб має стабільний набір вимірів.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]