Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ІСІТ Модульна 1.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
72.99 Кб
Скачать

16.​ Особливості технології olap (групи правил Кодда).

Технологія оперативного аналітичного оброблення даних OLAP (OnLine Analytical Processing) була виокремлена як особливий підхід до обробки даних у зв’язку з появою спеціальних засобів для збереження та аналізу накопичених облікових даних - сховищ даних. OLAP-програми являють собою сукупність засобів багатовимірного аналізу даних, накопичених у сховищі даних. Користувачу OLAP надається інтуїтивно зрозуміла модель даних, організована у вигляді багатовимірних кубів (Cubes). Осями - вимірами (Dimensions) багатовимірної системи координат слугують основні атрибути аналізованого бізнес-процесу (наприклад, для процесу продажів - товар, регіон, тип покупця). Значення, що відкладаються на осях кубу, називаються членами виміру, або мітками (members). Члени виміру можуть утворювати ієрархії, що складаються з декількох рівнів. Наприклад, для виміру «Час» ієрархією може бути «Роки  квартали  місяці  тижні  дні». У комірках кубу на перетинаннях вимірів знаходяться дані, що кількісно характеризують процес - міри, або показники (Measures) (наприклад, обсяги продажів, витрати).

Системи на основі OLAP дають змогу аналітикам і менеджерам, які потребують оперативного прийняття рішень, досягти розуміння процесів, що відбуваються на підприємстві, шляхом швидкого інтерактивного доступу до даних у сховищі і виконання над ними різноманітних аналітичних операцій: перетину, обертання, згортання, розгортання, проекції, агрегування, розрахункових операцій тощо. OLAP-операції над даними організовані так, щоб відобразити різні аспекти діяльності підприємства, надаючи:

  • базовий рівень або зведення даних, наприклад, загальну суму продажів по регіону за певний період;

  • зрізи даних, що відносяться до певного періоду в минулому і в поточний час;

  • агрегування даних за певною ознакою (наприклад, за видами товарів) і можливість у режимі діалогу пересуватись по рівнях агрегації;

  • похідні дані, що підраховуються на базі збережуваних даних, наприклад, різниця між фактичним і запланованим показником тощо.

Термін OLAP був вперше запропонований у 1993 р. Е.Ф.Коддом, відомим дослідником в області баз даних, коли він разом із партнерами опублікували статтю «Забезпечення OLAP (оперативного аналітичного оброблення) для користувачів-аналітиків», у якій виклали основні положення нової OLAP-технології. Ця стаття включала 12 правил, що визначали принципи технології OLAP. У 1995 році до них були додані ще шість. Доктор Кодд розбив всі правила на чотири групи:

  1. Базові особливості (багатовимірне подання даних, інтуїтивне маніпулювання даними, доступність, пакетне отримання даних, моделі аналізу OLAP, архітектура клієнт-сервер, прозорість, багатокористувацька підтримка).

  2. Спеціальні особливості (обробка ненормалізованих даних, зберігання результатів OLAP, виокремлення відсутніх значень, ігнорування відсутніх значень при аналізі).

  3. Особливості подання звітів (гнучкість формування звітів, стандартна продуктивність, автоматичне налаштовування фізичного рівня).

  4. Управління вимірами (універсальність вимірів, необмежена кількість вимірів і рівнів агрегації, необмежені операції між даними вимірів).

Пізніше вчені Н.Пендс і Р.Кріт запропонували власне визначення OLAP - так званий тест FASMI (Fast Analysis of Shared Multidimensional Information - швидкий аналіз розділюваної багатовимірної інформації), який вимагає, щоб OLAP-додаток надавав такі можливості:

Висока швидкість. Аналіз має виконуватись однаково швидко по всіх аспектах інформації за умови допустимого часу відгуку не більше 5 секунд. При цьому найпростіші запити опрацьовуються протягом однієї секунди і дуже небагато запитів - понад 20 секунд. Для досягнення цієї мети розробники OLAP-продуктів застосовують широкий спектр методів, включаючи спеціалізовані форми збереження даних, великі попередні обчислення або підсилені апаратні вимоги.

Аналіз. Забезпечення можливості проводити основні типи числового і статистичного аналізу, який може бути завчасно визначений розробником додатку або довільно визначатися користувачем. Засоби аналізу можуть включати процедури аналізу часових рядів, розподілу витрат, валютних переведень, пошуку цілей, зміни багатовимірних структур, непроцедурного моделювання, виявлення виняткових ситуацій, витягів даних та інші операції.

Розділення доступу. Доступ до даних має бути багатокористувацьким, при цьому має контролюватись доступ до конфіденційної інформації. Система має забезпечувати усі вимоги захисту конфіденційності (можливо, до рівня комірки) і, у разі необхідності множинного доступу до запису, здійснювати блокування модифікацій на відповідному рівні.

Багатовимірність. Забезпечення багатовимірного концептуального подання даних, включаючи повну підтримку ієрархії, оскільки таке представлення є найбільш логічним для аналізу бізнесу.

Робота з інформацією. OLAP-додаток повинен мати можливість звертатися до будь-якої потрібної інформації, незалежно від її обсягу і місця зберігання. Потужність різноманітних OLAP-продуктів слід вимірювати не тільки тим, скільки гігабайт вони можуть зберігати, а й тим, скільки вхідних даних вони можуть опрацьовувати. При цьому варто враховувати багато чинників, включаючи дублювання даних, необхідну оперативну пам’ять, використання дискового простору, експлуатаційні показники, інтеграцію з сховищами даних і т. ін.