Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Відповіді на іспит ІСіТ.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
685.57 Кб
Скачать
  1. Особливості сховищ даних.

Винахідник сховищ даних Б. Інмон у 1992 році визначив їх особливості:

  • предметна орієнтація: дані у сховищі організовані відповідно до основних напрямів діяльності підприємства (замовники, продажі, склад), а не до процесів, як в оперативних базах даних;

  • інтегрованість: первинні дані оперативних баз даних перед введенням у сховище даних перевіряються, вибираються, приводяться до одного вигляду, необхідною мірою агрегуються;

  • підтримка хронології: дані у сховищі нагромаджуються у вигляді історичних пластів, що дає змогу аналізувати зміну показників у часі;

  • незмінність: дані, завантажені у сховище, не підлягають змінам. З ними можливі лише операції їх первинного завантаження, пошуку, читання, агрегації;

  • мінімальна надлишковість: забезпечується фільтрацією та очищенням даних OLTP-систем перед їх завантаженням у сховище.

  1. Компоненти сховища даних

Сховища даних включають до свого складу набір компонентів, серед яких можна виділити змістовні, що відповідають наборам даних, і управлінські, що виконують спеціальні функції керування (рис. 5.1). Розглянемо їх особливості.

Менеджер завантаження виконує диспетчерські функції щодо занесення нових даних до сховища за встановленим регламентом, згідно з яким дані екстрагуються з різноманітних джерел, перевіряються, певним чином відбираються, зазнають трансформації (приводяться до єдиного способу кодування, виду і формату) та завантажуються у сховище.

Менеджер сховища виконує операції аналізу й управління даними. Ці операції включають: аналіз узгодженості та несуперечності даних; перетворення та переміщення даних з тимчасового сховища в основні таблиці сховища даних; створення індексів; денормалізація даних у разі її необхідності; агрегація (узагальнення) даних; резервне копіювання та архівування даних.

Детальні (оперативні) дані - включають всі детальні дані, визначені схемою сховища даних. Це можуть бути первинні дані найнижчого рівня деталізації або узагальнені до певного рівня деталізації.

Агреговані дані - ця складова містить дані, попередньо оброблені під керівництвом менеджера сховища з метою їх часткового чи повного узагальнення. Дані у цій частині сховища призначені для прискорення виконання запитів і тому можуть змінюватись відповідно до змін їх змісту. Крім того, агреговані дані оновлюються по мірі надходження нових детальних даних до сховища.

Репозиторій метаданих - містить інформацію про дані, що зберігаються у сховищі. Структура і зміст метаданих залежать від їх призначення і можуть бути визначені в розрізі цілей їх використання:

Вибірка й завантаження даних. Метадані містять інформацію про джерела даних, способи та періодичність їх вибірки і завантаження.

Обслуговування сховища. Метадані використовуються для автоматизації процедур узагальнення даних.

Обслуговування запитів. Метадані використовуються для визначення переліку таблиць для виконання запитів.

Менеджер запитів - виконує операції, пов’язані з управлінням запитами користувачів. Компонент функціонує на базі СУБД, що підтримує сховище даних, а також спеціально розроблених програм.

Користувачі сховища отримують до нього доступ за допомогою спеціальних засобів, до яких можуть бути віднесені OLAP-інструменти, засоби добування даних Data Mining, та різні засоби доступу кінцевого користувача: створення запитів і звітів, виконавські системи та ін