Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ОБЩИЙ_файл_ПОСОБИЕ.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
22.69 Mб
Скачать

Розділ 11. Робота зі сховищами даних

Фахівцям з економіки в межах професійної діяльності нерідко доводиться проводити статистичний аналіз даних й прийняття управлінських рішень. Для реалізації цих функцій існує інструментарій сховищ даних, що забезпечує високу швидкість отримання даних, можливість отримання і порівняння так званих "зрізів" даних, а також несуперечність, повноту і достовірність даних.

Розділ містить 3 теми:

1. Проектування сховищ даних

2. Багатовимірний аналіз даних

3. XML як засіб організації сховища даних

Професійні компетенції, що формуються за розділом:

знання концепції та архітектури сховищ даних, функціональних можливостей, принципів моделювання сховищ даних;

здатність проектувати сховища даних економічного характеру;

знання можливостей та інструментарію багатовимірного аналізу даних;

здатність проводити аналіз даних за допомогою OLAP-кубів;

здатність застосовувати мову XML для організації сховища даних та передачі інформації.

11.1. Проектування сховищ даних Відмінність сховищ даних від баз даних

На початку восьмидесятих років двадцятого століття, в період бурхливого розвитку інформаційних систем, виникло розуміння обмеженості можливості їх застосування для цілей аналізу даних і побудови систем підтримки та прийняття рішень. Інформаційні системи створювалися для автоматизації рутинних операцій по веденню бізнесу – виписка рахунків, оформлення договорів, перевірка стану складу і тощо. Переважно, користувачами таких систем був лінійний персонал. Основними вимогами до систем були максимальна швидкість виконання транзакцій. Саме ці вимоги визначили вибір реляційних СУБД (систем управління базами даних) і моделі представлення даних "сутність-зв'язок" в якості основних технічних рішень при побудові систем кінцевого користувача.

Для менеджерів і аналітиків у свою чергу були потрібні системи, які б дозволяли:

проводити аналіз інформації в часовому аспекті;

формувати довільні запити до системи;

обробляти великі об'єми даних;

інтегрувати дані з різних інформаційних систем.

Існуючі інформаційні системи не задовольняли жодній з вищезгаданих вимог. У такій системі інформація актуальна тільки на момент звернення до бази даних, в наступний момент часу за тим запитом можна отримати абсолютно інший результат. Інтерфейс інформаційних систем розрахований на проведення певних операцій і можливості отримання результатів на нерегламентований запит сильно обмежені. Можливість обробки великих масивів даних також мала через налаштування СУБД на виконання коротких транзакцій і неминучого уповільнення роботи інших користувачів.

Відповіддю на потребу, що виникла, стала поява нової технології організації баз даних – технології сховищ даних (СД).

В основі концепції СД лежать дві основні ідеї – інтеграція роз'єднаних деталізованих даних (дані описують деякі конкретні факти, властивості, події тощо) в єдиному сховищі і розподіл наборів даних і застосувань, що використовуються для оперативної обробки і вирішення завдань аналізу.

Визначення поняття "Сховище даних" першим дав Уильям Г. Інмон у своїй монографії. В роботі він визначив СД як "предметно-орієнтовану, інтегровану, таку, що містить історичні дані, не руйновану сукупність даних, призначену для підтримки прийняття управлінських рішень".