Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Тема 4 Сучас зас.doc
Скачиваний:
0
Добавлен:
23.08.2019
Размер:
113.66 Кб
Скачать

4. Сховища даних

Сховище даних (Data Warehouse) являє собою предметно-орієнтоване, прив'язане до часу і незмінне зібрання даних для підтримки процесу прийняття керуючих рішень. Дані у сховище надходять з баз даних оперативних систем, призначених для автоматизації бізнес-процесів, а також із зовнішніх джерел, наприклад, із статистичних звітів.

Головне призначення сховища - надати інформацію для аналізу в одному місці і у простій, зрозумілій структурі.

Необхідність розробки сховищ даних обумовлена факторами:

  • виникнення технології оперативного аналітичного оброблення даних OLAP і на її основі СППР. Призначенням OLAP-технології є реалізація аналітичних запитів;

  • СППР на базі OLAP погано сполучаються з транзакційними системами оперативного оброблення даних (OLTP-системами). Одночасне вирішення оперативних і аналітичних запитів на одній базі даних часто призводить до нестачі ресурсів;

  • досить часто на підприємстві чи в організації функціонує декілька OLTP-систем, кожна з яких має свою окрему базу даних, у яких використовуються різні структури даних, способи кодування, одиниці вимірювання. Побудова зведеного аналітичного запиту на основі декількох баз даних є складною проблемою, яка спочатку потребує вирішення проблеми узгодженості даних з різних баз даних.

Винахідник сховищ даних Білл Інмон у 1992 році визначив їх особливості:

  • предметна орієнтація: дані у сховищі організовані відповідно до основних напрямів діяльності підприємства (замовники, продажі, склад), а не до процесів, як в оперативних БД;

  • інтегрованість: первинні дані оперативних БД перед введенням у сховище даних перевіряються, вибираються, приводяться до одного вигляду, необхідною мірою агрегуються;

  • підтримка хронології: дані у сховищі нагромаджуються у вигляді історичних пластів, що дає змогу аналізувати зміну показників у часі;

  • незмінність: дані, завантажені у сховище, не підлягають змінам. З ними можливі лише операції їх первинного завантаження, пошуку, читання, агрегації;

  • мінімальна надлишковість: забезпечується фільтрацією та очищенням даних OLTP-систем перед їх завантаженням у сховище.

Архітектура сховищ даних

Сховища даних можуть включати такі компоненти:

  • віртуальне сховище даних - репозиторій метаданих, які описують джерела надходження інформації, структуру даних сховища, методи агрегації та завантаження даних, відомості про структуру бізнес-понять та інші дані про дані, що зберігаються у сховищі;

  • корпоративні сховища даних - вміщують інформацію, зібрану із певної множини оперативних БД, яка характеризує всю корпорацію і необхідна для виконання консолідованого аналізу діяльності корпорації в цілому;

  • кіоски або вітрини даних (data marts) - це певна підмножина корпоративних даних, які характеризують конкретний аспект діяльності корпорації, наприклад, облік запасів чи маркетинг. У вітрини даних інформація надходить або зі сховища (залежні вітрини), або безпосередньо із джерел даних, проходячи попередні узгодження та перетворення (незалежні вітрини).

В останні часи з’явилось поняття глобального сховища даних, яке розглядається як єдине джерело інтегрованих даних для всіх вітрин даних.

Моделі сховищ даних

Сховища даних слугують місцем збереження та джерелом інформації для засобів оперативного аналітичного оброблення даних OLAP і можуть мати різну модель побудови - MOLAP (багатовимірну), ROLAP (реляційну) або HOLAP (гібридну).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]