Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Harakteristika_osnovnih_instrumentiv_SQL.docx
Скачиваний:
3
Добавлен:
04.08.2019
Размер:
45.22 Кб
Скачать

Сховища даних

Передумови розробки концепції СД.

Однією з основних передумов є потреба в вирішенні аналітичних задач. Вирішувати задачі типу OLAP на основі традиційних БД недоречно, оскільки це може призвести до конфліктів повязаних з одночасним доступом в БД задач OLAP. Крім того в БД зберігається деталізована інформація, а для OLAP-задач потрібна узагальнена (агрегована) інформація.

Сховища даних – предметно орієнтований, інтегрований, незмінний і підтримуючий хронологію набір даних організованих для підтримки прийняття рішень.

Основні ознаки сховища даних – предметно орієнтованість,інтегрованість – дані відфільтровуються з бд і вибираються лише ті, що необхідні для аналізу – потім агрегуються, підтримка хонології, незмінність, мінімальна надлишковість.

Архітектура сд – всі дані в сховищах зберігаються в вигляді певних історичних пластів, кожен з яких характеризує відповідний календарний період(5- 10 р)

Корпоративні сховища даних – вміщують інтегровану інформацію, зібрану з певної множини оперативних БД, яка характеризує всю корпорацію і необхідна для консолідованого аналізу діяльності корпорації в цілому.

Кіоски – це певна підмножина корпоративних даних, які характеризують конкретний аспект діяльності корпорації, нп роботу конкретного підрозділу.

Багатовимірна модель побудови сд.

Моделі сховищ даних – найбільш вдалою формою представлення даних є представлення сховищ у вигляді багатовимірних моделей, в основі яких якої лежить поняття багатовимірного кубу.

Укладання багатовимірної моделі виконується в таких напрямах:

  • Збільшення числа вимірів. Необмежена к-сть вимірів.

  • Збільшення вмісту комірки, тобто не один показник, а декілька. Необмежена к-сть. Крім показників в комірках можуть зберігатися формули, к-сть показників та формул визначаються потребами бізнес аналізу. Таким чином, основними складовими багатовимірної моделі є такі поняття :

    • Показник

    • Вимір

Показник – це поле, значення якого однозначно визначається певним набором вимірів, поле характеризує певний факт чи подію.

Вимір – це множинна однотипних даних, які утв одну з граней куба і характеризують якусь ознаку. Виміри бувають колективні і приватні.

Колективний вимір – вимір, що може використовуватись в декількох кубах.

Приватний вимір – лише в одному кубі.

Між вимірами багатовимірної моделі та всередині певного виміру, можуть бути співвідношення 1:Б.

Гіперкубічна багатовимірна модель – модель, показники якої визначаються однаковими наборами вимірів.

Полікубічна – підтримує декілька гіперкубів різної розмірності.

Операції: Перетину, згортання та розгортання, об’єднання та обертання.

MOLAPсистеми, побудовані на основі багатовимірних сховищ. Вони є досить чутливі до обсягів даних, що зберігають. Вона є гібридною аналітичною системою.

ROLAP - це системи, що побудовані на основі реляційної моделі. Дані в сховищах представляються у вигляді моделі, що дістала назву зірка. Ця модель складається з таблиць двох типів: однієї таблиці досліджуваних даних, тобто фактів – це центр зірки; і кількох таблиць,. Які характеризують певні виміри цих фактів.

Таблиця фактів містить складовий ключ, який об’єднує всі ключі таблиць вимірів, а також значення показників, що аналізуються. За допомогою цих ключів таблиця фактів з’єднується з таблицею вимірів. На схемі зв’язків таблиця фактів розташовується в центрі, а таблиці вимірів на вихідних з центру променях, створюючи малюнок зірка.

Якщо ж таблиці вимірів нормалізовані, то така модель називається сніжинкою. Тобто в моделі типу сніжинка може бути певна ієрархічна підпорядкованість між окремими таблицями вимірів. Таблиці, що приєднуються до таблиць вимірів називаються консольними. А таблиці до яких вони приєднуються – таблицями нащадками.

HOLAP – гібридні системи, комбінований варіант зберігання даних, який використовує обидва типи СКБД.

Відмінності проектування СД від БД.

  • СД не обов’язково повинне бути нормалізованим.

  • При проектування СД обов’язково враховуються процедури подальшого їх оброблення, тому в самих моделях чи в репозитарії метаданих не лише картки даних, а й формули обчислення аналітичних показників.

Способи проектування СД

  • Нисхідний – спочатку велике корпоративне сховище, що характеризує свою предметну область, а потім воно стає джерелом інформації кіоском чи вітриною даних.

  • Висхідний – спочатку проектуються окремі кіоски чи вітрини даних, а потім їх об’єднання утворюють корпоративне СД.

Підходи:

  • Метод реконструкції, використовує існуючі OLAP-системи і на їх основі конструюється СД. Називається від джерела.

  • За шаблоном – беруться шаблони – готові моделі СД.

  • За замовленням – з чистого лиса або від запиту; ігноруються існуючі моделі і проектуються орієнтовано на вивчення потреб бізнес-аналітиків.

Основні елементи, що зберігаються:

  • Показники або змінні.

  • Виміри та їх ієрархія.

  • Факти.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]