Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ОБЩИЙ_файл_ПОСОБИЕ.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
22.69 Mб
Скачать

11.2. Багатовимірний аналіз даних Принципи побудови olap-системи

OLAP (англ. On-Line Analysis Processing) – це система, заснована на технології аналітичної обробки даних в режимі реального часу. На попередніх етапах проводиться передпроектне обстеження з метою виявлення потреб в автоматизації бізнес-процесів аналізу за допомогою технологій OLAP, вибір, установлення і налаштування програмного забезпечення для організації "центру інформації". Далі проводиться проектування OLAP-кубів, що пропонують інструменти аналізу СД за різними напрямами.

Принципи побудови аналітичної системи :

витяг інформації з початкової бази даних (бази облікової системи);

структуризація і додаткова обробка даних, з метою підвищення якості інформації (очищення, фільтрація, узгодження);

завантаження підготовлених даних в сховищі;

оновлення OLAP-кубів, побудованих на основі отриманого СХ.

Ця технологія забезпечує багатовимірність моделі даних (можливість побудови різних проекцій і розрізів моделі), інтуїтивні механізми маніпулювання даними, гнучку побудову звітів. Різні виміри повинні вибудовуватися будь-яким способом відповідно до потреб користувача.

Приклад OLAP-куба, що зберігає об'єми продаж, представлений на рис. 11.4.

Рис. 11.4. Приклад OLAP-куба

Двовимірне представлення куба можна отримати, "розрізавши" його упоперек однієї або декількох осей (вимірів). Виходить звичайна двовимірна таблиця. У горизонтальній осі таблиці (заголовки стовпців) представлений одно вимір, у вертикальній (заголовки рядків) – інший, а в елементах таблиці – значення мір.

Двовимірні "зрізи" куба представлені в таблиці. 11.1 – 11.2.

Таблиця 11.1

"Зріз" куба за вимірами: час та країна

2009

2010

2011

Україна

105

117

122

Росія

313

342

337

Білорусь

94

96

102

Таблиця 11.2

"Зріз" куба за вимірами: категорія товару та рік по Україні

2009

2010

2011

Автомобільна електроніка

215

318

189

Побутова техніка

105

117

122

Багатовимірний аналіз даних може бути проведений за допомогою різних засобів, які умовно можна розділити на клієнтські і серверні OLAP-засоби.

Клієнтські OLAP-засоби є застосуваннями, що здійснюють обчислення агрегатних даних (сум, середніх величин, максимальних або мінімальних значень) і їх відображення, при цьому самі агрегатні дані містяться в кеші усередині адресного простору такого OLAP-засоба.

Якщо початкові дані містяться в настільній СУБД, обчислення агрегатних даних проводиться самим OLAP-засобом. Якщо ж джерело початкових даних – серверна СУБД, багато з клієнтських OLAP-засобів посилають на сервер SQL-запити, що містять оператор GROUP BY, і в результаті отримують агрегатні дані, вичислені на сервері.

Звичайно, OLAP -функциональность реалізована в засобах статистичної обробки даних і в деяких електронних таблицях. Зокрема, засоби багатовимірного аналізу має Microsoft Excel. За допомогою цього продукту можна створити і зберегти у вигляді файлу невеликий локальний багатовимірний OLAP-куб і відобразити його двох- чи тривимірні зрізи.

Багато засобів розробки містять бібліотеки класів або компонентів, що дозволяють створювати додатки, що реалізують просту OLAP-функциональність (такі, наприклад, як компоненти DecisionCube в Borland Delphi і Borland C++Builder). Окрім цього, багато компаній пропонують елементи управління ActiveX та інші бібліотеки, що реалізовують подібну функціональність.

Клієнтські OLAP-засоби застосовуються при малому числі вимірів (зазвичай рекомендується не більше шести) і невеликій різноманітності значень цих параметрів, – адже отримані агрегатні дані повинні уміщатися в адресному просторі подібного засобу, а їх кількість росте експоненціально при збільшенні числа вимірів. Тому навіть найпримітивніші клієнтські OLAP-засоби дозволяють зробити попередній підрахунок об'єму необхідної оперативної пам'яті для створення в ній багатовимірного куба.

Багато клієнтських OLAP-засобів дозволяють зберегти вміст кеша з агрегатними даними у вигляді файлу, що, у свою чергу, дозволяє не проводити їх повторне обчислення. Нерідко така можливість використовується для відчуження агрегатних даних з метою передачі їх іншим організаціям або для публікації.

Типовим прикладом таких відчужуваних агрегатних даних є статистика захворюваності в різних регіонах і в різних вікових групах, яка є відкритою інформацією, що публікується міністерствами охорони здоров'я різних країн і Всесвітньою організацією охорони здоров'я. При цьому власне початкові дані, що є відомостями про конкретні випадки захворювань, є конфіденційними даними медичних установ, які ні в якому разі не повинні потрапляти до рук страхових компаній і тим більше ставати надбанням гласності.

Ідея збереження кеша з агрегатними даними у файлі отримала свій подальший розвиток в серверних OLAP-засобах, в яких збереження і зміна агрегатних даних, а також підтримка сховища, що утримує їх, здійснюються окремим застосуванням або процесом, що називається OLAP-сервером. Клієнтські додатки можуть звертатися до подібного багатовимірного сховища і у відповідь отримувати ті або інші дані. Деякі клієнтські додатки можуть також створювати такі сховища або оновлювати їх відповідно до початкових даних, що змінилися.

Переваги застосування серверних OLAP-засобів в порівнянні з клієнтськими OLAP-засобами схожі з перевагами застосування серверних СУБД у порівнянні з настільними: у разі застосування серверних засобів обчислення і зберігання агрегатних даних відбуваються на сервері, а клієнтський додаток отримує лише результати запитів до них, що дозволяє в загальному випадку понизити мережевий трафік, час виконання запитів і вимоги до ресурсів, споживаним клієнтським додатком. Засоби аналізу і обробки даних масштабу підприємства, зазвичай, базуються саме на серверних OLAP -засобах, наприклад, таких як Oracle Express Server, Microsoft SQL Server 2000 Analysis Services, Hyperion Essbase, продуктах компаній Crystal Decisions, BusinessObjects, Cognos, SAS Institute. Оскільки усі провідні виробники серверних СУБД проводять (або ліцензували у інших компаній) ті або інші серверні OLAP-засоби, вибір їх досить широкий і майже в усіх випадках можна придбати OLAP-сервер того ж виробника, що і у самого сервера баз даних.

Багато клієнтських OLAP-засобів (зокрема, Microsoft Excel, Seagate Analysis тощо) дозволяють звертатися до серверних OLAP-сховищ, виступаючи в цьому випадку в ролі клієнтських додатків, що виконують подібні запити. Окрім цього є немало продуктів, що є клієнтськими додатками до OLAP-засобів різних виробників.