
- •Задачі систем підтримки прийняття рішень.
- •Узагальнена архітектура системи підтримки прийняття рішень.
- •Дванадцять правил е.Кодда для реляційних бд.
- •Неефективність використання oltp систем для аналізу даних: необхідність надлишковості даних.
- •Властивості сховища даних: предметна орієнтація.
- •Сппр з віртуальним сд. Переваги і недоліки.
- •Поняття вітрини даних (вд).
- •Структура сппр з самостійними вд.
- •Структура сппр з сд і вд.
- •Категорії даних в сд.
- •Структура etl процесу і його етапи.
- •Очистка даних. Основні проблеми.
Поняття вітрини даних (вд).
Вітрина даних (ВД) - це спрощений варіант СД, який містить тільки тематично об'єднані дані.
Структура сппр з самостійними вд.
Самостійні ВД (рис. 2.3) часто з'являються в організації історично і зустрічаються у великих організаціях з великою кількістю незалежних підрозділів, які вирішують власні аналітичні завдання.
Переваги:
проектування ВД для відповідей на певне коло питань;
швидке впровадження автономних ВД та отримання віддачі;
спрощення процедур заповнення ВД і підвищення їх продуктивності за рахунок урахування потреб певного кола користувачів.
Недоліки:
багаторазове зберігання даних в різних ВД, що призводить до збільшення витрат на їх зберігання і потенційних проблем, пов'язаним з необхідністю підтримки несуперечності даних;
відсутність консолідованих даних на рівні предметної області, а отже - відсутність єдиної картини.
Структура сппр з сд і вд.
Останнім часом все більш популярною стає ідея поєднати СД та ВД в одній системі. У цьому випадку СД використовується як єдине джерела інтегрованих даних для всіх ВД.
СД являє собою єдине централізоване джерело інформації для всієї предметної області, а ВД є підмножинами даних з сховища, яке організоване для подання інформації за тематичними розділами даної області. Кінцеві користувачі мають можливість доступу до детальних даних сховища.
ПЕРЕВАГИ:
простота створення та наповнення ВД;
простота розширення СППР за рахунок додавання нових ВД;
зниження навантаження на основне СД.
До недоліків відносяться:
надмірність (дані зберігаються як в СД, так і в ВД);
додаткові витрати на розробку СППР з СД та ВД.
Категорії даних в сд.
Всі дані в СД діляться на три основні категорії (рис. 2.5):
детальні дані- переносяться безпосередньо з ОДД. Вони відповідають елементарним подіям, які фіксують OLTP-системи (наприклад, продажу, експерименти та ін.)
агреговані дані- можуть зберігатися в архівах у стислому вигляді на більш ємних накопичувачах з більш повільним доступом (наприклад, на магнітних стрічках)
метадані- (дані про дані), повинні відповідати на наступні питання - що, хто, де, як, коли і чому:
що (опис об'єктів) - метадані описують об'єкти предметної області, інформація про яких зберігається в СД.;
хто (опис користувачів) - метадані описують категорії користувачів, що використовують дані;
де (опис місця зберігання) - метадані описують місце розташування серверів, робочих станцій, ОДД, розміщені на них програмні середовища і розподіл між ними даних;
як (опис дій) - метадані описують дії, які виконуються над даними.;
коли (опис часу) - метадані описують час виконання різних операцій над даними (наприклад, завантаження, агрегування, архівування, добування і т. п.);
чому (опис причин) - метадані описують причини, які спричинили виконання над даними тих чи інших операцій.
Структура etl процесу і його етапи.
Процес перенесення, що включає в себе етапи витягу, перетворення і завантаження, називають ETL-процесом. Програмні засоби, що забезпечують його виконання, називаються ETL-системами. Традиційно ETL-системи використовувалися для переносу інформації з застарілих версій інформаційних систем в нові.
Витяг даних-щоб почати ETL-процес, необхідно витягти дані з одного або кількох джерел і підготувати їх до етапу претворення.
Перетворення даних - після того як збір даних завершений, необхідно перетворити їх для розміщення на новому місці.
Завантаження даних - після того як дані перетворені для розміщення в СД, здійснюється етап їх завантаження. При завантаженні виконується запис перетворених детальних і агрегованих даних. Крім того, при записі нових детальних даних частина старих може переноситися в архів.