
- •6.1. Поняття машинного інформаційного забезпечення
- •6.2. Передумови створення та основні переваги бд
- •6.3. Поняття і класифікація абд
- •6.4. Склад абд
- •6.5. Характеристика інфологічної та даталогічної моделі баз даних
- •6.6. Методи створення оптимальної моделі баз даних
- •6.7. Теорія нормалізації відношень
- •6.8. Побудова логічної моделі даних
- •6.9. Поняття сховищ даних та основи їх створення
- •6.9.1. Архітектура сховищ даних
- •6.9.2. Моделі сховищ даних
- •З апитання для самоперевірки
6.8. Побудова логічної моделі даних
Наступним кроком, який виконується після нормалізації відношень є побудова логічної моделі БД.
Логічна модель є основою бази даних, вона повинна відображати взаємозв’язки між реляційними таблицями. Між реляційними таблицями можуть бути наступні типи зв’язків 1:1, 1:Б та Б:Б. Найбільш поширеним зв’язком є зв’язок 1:Б. Зв’язок 1:1 зустрічається рідше, тому що дані між якими існує такий тип зв’язку в переважній більшості випадків входять до складу однієї реляційної таблиці. Зв’язок Б:Б безпосередньо не підтримується в реляційних СУБД. Для реалізації такого зв’язку необхідно створювати додаткову реляційну таблицю, яка буде відігравати роль зв’язкової. Зв’язкова таблиця має обов’язково містити первинні ключі таблиць, між якими встановлюється зв’язок.
Деякі сучасні СУБД мають інструментальні засоби побудови логічної моделі даних. Розглянемо побудову такої моделі засобами СУБД Mіcrosoft Access. Логічна модель в середовищі СУБД Mіcrosoft Access називається схемою. Для побудови схеми даних попередньо необхідно створити таблиці, визначивши в них первинні ключі. Приклад схеми, побудованої засобами Access наведено на рис. 6.5.
Рис. 6.5. Схема бази даних
На цій схемі відображені зв’язки між таблицями реляційної БД. Між усіма таблицями встановлений зв’язок типу 1:Б (знак ∞ позначає в Access багато).
Зв’язок встановлюється між полем первинного ключа об’єктного відношення та полем вторинного ключа зв’язкового відношення. Зв’язок між полем первинного та полем вторинного ключа встановлюється, якщо поля задані одним типом і подані в одному форматі.
Схема в Access забезпечує за змовчування посилкову цілісність та узгодженість даних, які зберігаються в різних таблицях. Так, наприклад, Access не дозволить дозаписати в таблицю «Реалізація» дані про реалізацію виробу якомусь споживачу, якщо дані про цей виріб та відповідного споживача відсутні в таблицях «Виріб» та «Довідник споживачів». Крім того, якщо користувач системи зробить спробу вилучити дані про якісь вироби чи про певних споживачів з таблиць довідкової інформації «Виріб» та «Довідник споживачів» тоді, коли дані про ці вироби та про споживачів занесені до таблиць «Реалізація» та «Договір», то Access повідомить користувача про те, що вилучення відповідних рядків, що пропонується до вилучення, головної таблиці неможливе, так як йому є відповідні записи у підпорядкованих таблицях.
6.9. Поняття сховищ даних та основи їх створення
Різновидом баз даних є сховище даних (Data WarenHouse). Поняття сховищ даних виникло зовсім недавно. Необхідність розробки нової концепції сховищ даних обумовлена такими факторами:
Розвиток інформаційних технологій привів до систем нового типу, які дістали назву систем підтримки прийняття рішень. Ці системи основані на новій технологіі, яка дістала назву OLAP-технології. Основою OLAP-технології є реалізація аналітичних запитів.
Системи підтримки прийняття рішень, основані на формуванні аналітичних запитів, почали конфліктувати з транзакційними системами оперативної обробки даних (OLTP- системами). Одночасне вирішення оперативних і аналітичних запитів на одній базі даних часто призводить до нестачі ресурсів.
Формування аналітичних звітів на основі традиційних баз даних, які вміщують оперативну інформацію, займає дуже багато часу. Причому витрати часу, необхідні для формування аналітичних звітів, невпинно зростають зі зростанням обсягів оперативної інформації в базі даних. Це призводить до того, що менеджери не встигають готувати відповідні рішення на основі отриманих аналітичних звітів.
Дуже часто на підприємстві чи в організації функціонує декілька OLTP-систем, кожна з яких має свою окрему базу даних, в яких використовуються різні структури даних, способи кодування, одиниці вимірювання. Побудова зведеного аналітичного запиту на основі декількох баз даних є дуже складною проблемою, яка спочатку потребує вирішення проблеми узгодженності даних, що зберігаються в різних базах даних.
Вирішення перерахованих вище проблем було знайдено в розробці концепції сховища даних. Сховище даних має виконувати функції попереднього добору, агрегації та підготовки оперативних даних OLTP-системам. Тобто в сховищі даних зберігаються не первинні дані, а певним чином інтегровані дані, які створюють основу для вирішення аналітичних задач і функціонування систем підтримки прийняття рішень. Взаємозв’язок між системами відбиває рис. 6.6.
Рис. 6.6. Схема взаємозв’язку OLTP та OLAP систем
Таким чином сховище даних (Data WarenHouse) це особлива форма організації бази даних, котра призначена для зберігання в погодженому вигляді агрегованої інформації, що отримується на основі баз даних різних OLTP-систем та зовнішніх джерел.
Сховища даних характеризуються предметною орієнтацією, інтегрованістю, підримкою хронології, незмінністю і мінімальною надлишковістю. Ці основні особливості сховищ даних були визначені в 1992 році їх винахідником Біллом Інмоном (Bіll Іnmon). Вони незалежно від реалізації притаманні всім сховищам даних і полягають ось у чому.
Предметна орієнтація. Дані в сховищі даних організовані у відповідності до основних напрямків діяльності підприємства чи фірми (замовники, продажі, склад і т.п.). У цьому полягає відмінність сховищ даних від організації оперативної БД, в якій дані подаються у відповідно до процесів (відвантаження товару, виписка рахунків і т.п.) Предметна організація даних не лише спрощує аналіз, а й значно прискорює проведення аналітичних розрахунків. Тобто сховища орієнтовані на бізнес-поняття, а не на бізнес процеси.
Інтегрованість. Первинні дані оперативних баз даних перевіряються, певним чином добираються, приводяться до одного виду, необхідною мірою агрегуються ( тобто обраховуються сумарні показники) і завантажуються у сховище даних. Такі інтегровані дані набагато простіше аналізувати.
Підтримка хронології. Дані, які вибираються з оперативних баз даних нагромаджуються в сховищі даних у вигляді «історичних пластів», кожен із яких характеризує певний період часу. Це дозволяє проводити аналіз зміни показників у часі.
Незмінність. Дані сховища даних, що характеризують кожен «історичний пласт», ні в якому разі не підлягають змінам. Це теж є суттєвою відмінністю даних, що зберігаються у сховища даних, від оперативних даних. Оперативні дані можуть дуже часто змінюватись, з даними сховища можливі лише операції їх первинного завантаження, пошуку та їх читання.
Мінімальна надлишковість. Незважаючи на те, що інформація до сховищ даних завантажується з БД OLTP-систем, це не призводить надлишковості даних. Зведення до мінімуму надлишковості даних забезпечується тим, що перш ніж завантажувати дані до сховищ, їх фільтрують і певним чином очищають від таких даних, які не потрібні і не можуть бути використані в OLAP-системах.