- •Задачі систем підтримки прийняття рішень.
- •Узагальнена архітектура системи підтримки прийняття рішень.
- •Дванадцять правил е.Кодда для реляційних бд.
- •Неефективність використання oltp систем для аналізу даних: необхідність надлишковості даних.
- •Властивості сховища даних: предметна орієнтація.
- •Сппр з віртуальним сд. Переваги і недоліки.
- •Поняття вітрини даних (вд).
- •Структура сппр з самостійними вд.
- •Структура сппр з сд і вд.
- •Категорії даних в сд.
- •Структура etl процесу і його етапи.
- •Очистка даних. Основні проблеми.
Неефективність використання oltp систем для аналізу даних: необхідність надлишковості даних.
Допущення надлишкових даних - структура бази даних, яка обслуговує OLTP-систему, зазвичай досить складна. Вона може містити багато десятків і навіть сотень таблиць, які посилаються одна на одну. При проектуванні систем аналізу намагаються максимально спростити схему БД і зменшити кількість таблиць, які використовуються в запиті. З цією метою часто допускають денормалізацію (надлишковість даних) БД.
Неефективність використання OLTP систем для аналізу даних: управління даними.
Управління даними - основна вимога до OLTP-систем - забезпечити виконання операцій модифікації над БД. При цьому передбачається, що вони повинні виконуватися в реальному режимі, і часто дуже інтенсивно.
Неефективність використання OLTP систем для аналізу даних: кількість даних, які зберігаються.
Кількість збережених даних-як правило, OLTP-системи мають справу з поточними значеннями параметрів. З цієї причини в OLTP-системах допускається зберігання даних за невеликий період часу (наприклад, за останній квартал).
Неефективність використання OLTP систем для аналізу даних: характер запитів до даних.
Характер запитів до даних - в OLTP-системах через нормалізацію БД складання запитів є досить складною роботою і вимагає необхідної кваліфікації. Тому для таких систем заздалегідь складається певний обмежений набір запитів до БД, необхідний для роботи з системою.
Неефективність використання OLTP систем для аналізу даних: час обробки звертань до даних.
Час обробки звернень до даних - OLTP-системи, як правило, працюють в режимі реального часу, тому до них пред'являються жорсткі вимоги по обробці даних. У системах аналізу, в порівнянні з OLTP, зазвичай ставлять значно менш жорсткі вимоги до часу виконання запиту.
Неефективність використання OLTP систем для аналізу даних: характер обчислювального навантаження на систему.
Характер обчислювального навантаження на систему - як вже зазначалося, робота з OLTP-системами, як правило, виконується в режимі реального часу. У зв'язку з цим такі системи навантажені рівномірно протягом всього інтервалу часу роботи з ними.
Неефективність використання OLTP систем для аналізу даних: пріоритетність характеристик системи.
Пріоритетність характеристик системи - для OLTP-систем пріоритетними є висока продуктивність і доступність даних, тому що робота з ними ведеться в режимі реального часу. Для систем аналізу більш пріоритетним є завдання забезпечення гнучкості системи та незалежності роботи користувачів, іншими словами те, що необхідно аналітикам для аналізу даних.
Концепція сховища даних.
Прагнення об'єднати в одній архітектурі СППР можливості OLTP-систем та систем аналізу, вимоги до яких багато в чому суперечливі, призвело до появи концепції сховищ данних (СД). В основі концепції СД лежить ідея поділу даних, використовуваних для оперативної обробки і для вирішення завдань аналізу. Це дозволяє застосовувати структури даних, які задовольняють вимогам їх зберігання з урахуванням використання в OLTP-системах і системах аналізу. Такий поділ дозволяє оптимізувати як структури даних оперативного зберігання (оперативні БД, файли, електронні таблиці і т. п.) для виконання операцій введення, модифікації, видалення та пошуку, так і структури даних, які використовуються для аналізу (для виконання аналітичних запитів). У СППР ці два типи даних називаються відповідно оперативними джерелами даних (ОДД) та сховищем даних.
