
- •Основи шформаційних систем Навчальний посібник
- •03680, М. Київ, просп. Перемоги, 54/1
- •1.2. Системи, системи управління, системний підхід в організаційному управлінні: основні терміни та визначення
- •1.3. Створення комп'ютерної технології управління народним господарством — органічна складова об'єктивного процесу інформатизації сучасного суспільства
- •Запитання для самоперевірки
- •Розділ 2. Характеристика інформаційних систем в управлінні народним господарством
- •2.1. Основні етапи розвитку інформаційних систем
- •2.2. Класифікація інформаційних систем
- •2.3. Структура інформаційних систем
- •2.4. Перспективні засоби і напрямки розвитку інформаційних систем
- •Запитання для самоперевірки
- •Розділ 3. Економічна інформація як об'єкт автоматизованої обробки
- •3.1. Поняття економічної інформації, її види та властивості
- •3.2. Структура, форми подання та відображення економічної інформації
- •3.3. Оцінювання економічної інформації
- •3.4. Інформаційні процедури
- •Запитання для самоперевірки
- •4.1. Характеристика засобів формалізованого описання економічної інформації
- •Основні національні статистичні класифікації україни
- •4.2. Методи класифікації економічної інформації
- •Утворення класифікаційних угруповань
- •4.3. Методи кодування економічної інформації
- •4.4. Єдина система класифікації та кодування техніко-економічної інформації
- •4.5. Категорії класифікаторів, порядок їх розробки, упровадження та ведення
- •4.6. Штрихове кодування інформації
- •4.7. Моделювання елементів економічної інформації
- •Запитання для самоперевірки
- •Розділ 5. Органзація позамашинної інформаційної бази
- •5.1. Поняття позамашинної інформаційної бази, склад робіт з її організації
- •5.2. Носії інформації, їхній склад та характеристика
- •5.3. Уніфікована система первинної документації, поняття, склад та вимоги
- •5.4. Вихідні документи. Розробка форм та вибір засобів виводу
- •Запитання для самоперевірки
- •Розділ 6. Організація машинної інформаційної бази
- •6.1. Поняття машинного інформаційного забезпечення
- •6.2. Передумови створення та основні переваги бд
- •6.3. Поняття і класифікація абд
- •6.4. Склад абд
- •6.5. Характеристика інфологічної та дат алогічної моделі баз даних
- •6.6. Методи створення оптимальної моделі баз даних
- •6.7. Теорія нормалізації відношень
- •6.8. Побудова логічної моделі даних
- •6.9. Поняття сховищ даних та основи їх створення
- •6.9.1. Архітектура сховищ даних
- •6.9.2. Моделі сховищ даних
- •Запитання для самоперевірки
- •Розділ 7. Основи створення комп'ютерних технологій
- •7.1. Характеристика та класифікація технологічних операцій
- •7.2. Технологічні процеси автоматизованої обробки економічної інформації
- •7.3. Типові технологічні операції та їх виконання в інформаційних системах обробки даних
- •Запитання для самоперевірки
- •Розділ 8. Режими роботи еом та їх особливості
- •8.1. Загальна характеристика режимів роботи еом
- •8.2. Організація пакетного режиму обробки інформації
- •8.3. Організація діалогового режиму обробки інформації
- •Запитання для самоперевірки
- •Розділ 9. Організаційно-методичні основи створення та функціонування інформаційних систем
- •9.1. Стадії та етапи розробки
- •9.2. Організація робіт, спрямованих на створення та впровадження інформаційних систем
- •9.3. Документація на розробку інформаційних систем
- •Запитання для самоперевірки
- •Розділ 10. Інформаційні системи організаційного управління
- •10.1. Концепція розподільної обробки інформації в управлінських інформаційних системах
- •10.2. Характеристика і призначення інтегрованих інформаційних систем
- •10.3. Банківські інформаційні системи
- •10.3.1. Структура автоматизованої банківської системи
- •10.3.2. Функціональна структура абс
- •10.3.3. Модульний підхід до структуризації абс
- •10.3.4. Програмно-технічна платформа абс
- •10.4. Інформаційні системи в фінансах
- •10.4.1. Автоматизована система фінансових розрахунків (асфр)
- •10.4.2. Аіс у податкових органах України
- •10.4.3. Аіс в страхуванні
- •10.5. Інформаційні системи у статистиці
- •Запитання для самоперевірки
- •Розділ 11. Системи підтримки прийняття рішень
- •11.1. Розвиток і впровадження систем підтримки прийняття рішень
- •11.1.1. Сутність і загальна характеристика сппр
- •11.1.2. Сфери застосування та приклади використання сппр
- •11.2. Компоненти систем підтримки прийняття рішень
- •11.2.1. Інтерфейс користувач—система
- •11.2.2. База даних і система управління базою даних
- •11.2.3. Бази моделей і системи управління базами моделей
- •11.2.4. Управління поштою (повідомленнями) в сппр
- •11.3. Групові системи підтримки прийняття рішень
- •11.3.1. Групові рішення
- •11.3.2. Групове забезпечення
- •Функціональні можливості (призначення) продукції гсп
- •11.3.3. Визначення та призначення гсппр
- •11.3.4. Підтримувальні засоби гсппр
- •11.4. Виконавчі інформаційні системи
- •11.4.1. Визначення і призначення віс
- •Інформаційні потреби опр, реалізовані засобами віс
- •Вимоги щодо моделювання в віс
- •11.4.2. Використання віс
- •11.4.3. Доступне програмне забезпечення віс
- •Запитання для самоперевірки
- •Розділ 12. Інтелектуальні інформаційні системи в економіці
- •12.1. Загальні аспекти розробки систем зі штучним інтелектом
- •12.2. Експертні системи та їх характеристика
- •12.3. Поняття знань та відмінності їх від даних
- •12.4. Модель продукції
- •Запитання для самоперевірки
- •Розділ 13. Інформаційно-пошукові системи в економіці
- •13.1. Поняття інформаційно-пошукової системи
- •13.2. Інформаційно-пошукова мова та її використання в аіпс
- •13.4. Інформаційно-пошуковий тезаурус
- •13.5. Шформаційно-пошукові системи internet
- •13.5.1. Подання інформаційних ресурсів у internet
- •13.5.2. Механізми пошуку в Internet
- •13.5.3. Інформаційно-пошукова мова системи
- •13.5.4. Інтерфейс системи
- •13.5.5. Інструментальні засоби пошуку в Internet
- •Російські та російськомовні пошукові системи Каталоги і пошукові системи
- •Пошук інформації в системі телеконференцій Usenet
- •Метапошукові системи
- •Списки російськомовних пошукових ресурсів
- •Міжнародний пошук
- •Метапошукові системи
- •Спеціалізований пошук
- •Списки пошукових ресурсів
- •Пошук людей
- •Запитання для самоперевірки
- •Розділ 14. Корпоративні шформащйш системи
- •14.1. Загальна характеристика корпоративних інформаційних систем
- •14.2. Корпоративна інформаційна система r/3
- •14. 3. Система управління бізнесом і фінансами scala 5
- •14. 4. Система управління ресурсами підприємства oracle application
- •14.5. Інформаційна система управління ресурсами підприємств baan—IV
- •14.6. Комплексна система управління діяльністю підприємства галактика
- •Запитання для самоперевірки
- •Література
6.6. Методи створення оптимальної моделі баз даних
Під оптимальною логічною моделлю баз даних розуміють модель, яка не має аномалій, пов'язаних з модифікацією БД, тобто проблем, що можуть виникнути у зв'язку із замінами, вставками і вилученнями даних із БД.
Для створення такої моделі баз даних незалежно від того, яка СУБД використовується — ієрархічна, сіткова чи реляційна — застосовується теорія нормалізації реляційних баз даних. Використання реляційного підходу дає змогу спроектувати оптимальну логічну модель БД, яка потім досить просто трансформується в ієрархічну чи сіткову модель.
В основу реляційних моделей покладено поняття відношення, яке подають у вигляді двовимірної таблиці.
Реляційна БД — це набір взаємопов'язаних відношень. Кожне відношення (таблиця) в ЕОМ подається як файл. Відношення можна поділити на два класи: об'єктні і зв'язкові.
Об'єктні відношення зберігають дані про інформаційні об'єкти предметної області. Наприклад: КЛІЄНТ (код клієнта, назва клієнта, адреса, телефон) є об'єктним відношенням.
В об'єктному відношенні один з атрибутів однозначно ідентифікує окремий об'єкт. Такий атрибут називається первинним ключем відношення. У наведеному відношенні роль ключа виконує атрибут «код клієнта».
Ключ може вміщувати кілька атрибутів, тобто бути складеним. В об'єктному відношенні не повинно бути рядків з однаковим ключем, тобто не допускається дублювання об'єктів. Це основне обмеження реляційної моделі для забезпечення цілісності даних.
Зв'язкове відношення зберігає первинні ключі двох або більше об'єктних відношень. Ключі зв'язкового відношення мають на меті встановлення зв'язків між об'єктними відношеннями.
Розглянемо, наприклад, ще одне об'єктне відношення БАНК (код банку, назва банку, адреса банку).
Тоді зв'язкове відношення БАНК-КЛІЄНТ (код банку, код клієнта) буде сполучним між двома об'єктними відношеннями БАНК і КЛІЄНТ. У зв'язковому відношенні можуть дублюватися ключові атрибути. Крім ключів, за якими встановлюють зв'язок у зв'язковому відношенні, можуть бути ще й інші атрибути, які функціонально залежать від цього складового ключа.
Ключі в зв'язкових відношеннях називаються вторинними або зовнішніми ключами, оскільки вони є первинними ключами об'єктів інших відношень. Реляційна модель накладає на зовнішні ключі обмеження, яке називають посилковою цілісністю. Воно необхідне для забезпечення цілісності даних.
Посилкова цілісність — це відповідність між об'єктними та зв'язковими відношеннями, яка полягає в тому, що кожному зовнішньому ключеві зв'язкового відношення має відповідати рядок якогось об'єктного відношення. Без такого обмеження може статися так, що зовнішній ключ посилається на об'єкт, про який нічого не відомо.
У реляційній БД накладається ще одне обмеження — відношення мають бути нормалізовані.
6.7. Теорія нормалізації відношень
Нормалізація відношень — це ітераційний зворотний процес декомпозиції початкового відношення на кілька простіших відношень меншої розмірності. Під зворотністю процесу розуміють те, що операція об'єднання відношень, здобутих у результаті декомпозиції, має дати початкове відношення. У результаті нормалізації склад атрибутів відношень БД має відповідати таким вимогам:
-
між атрибутами мають виключатися небажані функціональні залежності;
-
групування атрибутів не повинно мати збиткового дублювання даних;
-
забезпечувати обробку і поновлення атрибутів без ускладнень.
Апарат нормалізації був розроблений американським вченим Е.Ф. Коддом. Кожна нормальна форма обмежує тип допустимих залежностей між атрибутами. Кодд виділив три нормальні форми (скорочена назва 1НФ, 2НФ і ЗНФ). Найдосконаліша з них — це ЗНФ. Тепер уже відомі і визначені 4НФ, 5НФ.
Нормалізація відношень виконується за кілька кроків (рис. 6.4).
Рис. 6.4. Схема етапів нормалізації відношень
1-й крок (1-ша ітерація) — зведення відношень до першої нормальної форми (1НФ).
Відношення в 1НФ мають відповідати таким вимогам:
-
усі атрибути відношення мають бути атомарними, тобто неподільними;
-
усі рядки таблиці мають бути однакової структури, тобто мати одну й ту саму кількість атрибутів з іменами, що відповідно збігаються;
-
імена стовпців мають бути різними, а значення однорідними (мати однаковий формат);
-
порядок рядків у таблиці неістотний.
Кожне відношення БД містить як структурну, так і семантичну інформацію. Структурна інформація задається схемою відношення, а семантична виражає функціональні зв'язки між атрибутами.
На 2-му кроці (2-га ітерація) нормалізації виявляються ключі атрибути та аналізуються відповідні залежності з метою вилучення неповних функціональних залежностей.
Означення 1. Атрибут Б функціонально залежить від А у відношенні R тоді, коли в кожний момент часу одному й тому самому значенню А відповідає не більш як одне значення Б. Функціональній залежності відповідає відношення 1:1 між атрибутами.
Означення 2. Атрибут перебуває у повній функціональній залежності, якщо він залежить від усього ключа і не залежить від його складових.
Якщо відношення має неповні функціональні залежності, то виконують його декомпозиції на два чи більше інших відношень, які не мають неповних функціональних залежностей і об'єднання яких дасть початкове відношення.
Нехай у відношенні R (А*, В*, С, D) атрибут С залежить від усього ключа , який складається з атрибутів А*, 5* , а атрибут D залежить лише від В*, то тоді D знаходиться у неповній функціональній залежності, яку необхідно усунути шляхом декомпозиції. В результаті декомпозиції отримаємо два відношення:
R1 (А*, В*, C) і R2(B*,D).
3-й крок (3-тя ітерація) нормалізації — це вилучення транзитивних залежностей. Відношення в 2НФ має аналізуватися на присутність транзитивних залежностей.
Транзитивна залежність — це залежність між неключовими атрибутами.
Наприклад, дано відношення R (А *, В, С), в якому атрибут В не залежить безпосередньо від ключа, а С залежить від неключо-вого атрибута В, який залежить від А, то тоді С транзитивно залежить від А.
Транзитивні залежності вилучаються також за допомогою декомпозиції відношення на інші два чи більше відношень, які не містять транзитивних відношень і об'єднання яких дасть початкове відношення. У результаті декомпозиції отримаємо два нових відношення R1 (А*, В) та R2 (В*, С).
На 4-му кроці (4-та ітерація) нормалізації виконується аналіз на присутність незалежних багатозначних залежностей у відношенні. Якщо вони є, то виконується декомпозиція відношення.
Багатозначна залежність — це різновид функціональної залежності. Атрибут В знаходиться у багатозначній залежності від атрибута А, тоді коди одному значення атрибута А відповідає багато значень атрибута В. Наприклад, між атрибутами код структурного підрозділу : табельний номер = 1 : Б, так як в одному підрозділі може працювати багато співробітників. Тобто багатозначній залежності відповідає відношення 1 :Б між атрибутами.
Існують поняття тривіальної і нетривіальної багатозначної залежності.
Залежність
типу X
—»Y
і Y—»Х
є тривіальною, а залежність X
—»Y
і Y
-//-»
X
— нетривіальною. Присутність
нетривіальних багатозначних
залежностей у схемі відношення і
незалежність їх правих частин зумовлюють
комбінаторику правих частин відношення.
Означення 3. Відношення R міститься в 4НФ, коли в структурі багатозначної залежності, яка визначена на множині атрибутів, є лише тривіальні чи такі нетривіальні багатозначні залежності, що ліва частина будь-якої з них є ключем.
Атрибут А багатозначно визначає атрибут В у відношенні R (А*, В, С), якщо В залежить лише від А при будь-яких його комбінаціях з іншими атрибутами відношення.
Якщо у відношенні R(A*,B,C) наявні багатозначні залежності, тобто А—»В і А—»С, то воно має бути розкладене на два інших відношення R1 (А, В) і R2 (А, С). Поняття багатозначної залежності складніше, ніж поняття функціональної залежності. Для її виявлення потрібний значно глибший семантичний аналіз атрибутів.
Декомпозиція початкового відношення на кілька інших має гарантувати його оборотність, тобто забезпечувати отримання початкового відношення об'єднанням відношень, знайдених у результаті декомпозиції.
Проте не завжди декомпозиція гарантує оборотність. Відношення, яке містить більш як три багатозначні залежності, потребує спеціальних заходів щодо забезпечення оборотності декомпозиції. Для цього існує 5НФ. При декомпозиції з 4НФ дістають такі проекції, щоб кожна з них містила не менш як один можливий ключ і щонайменше один неключовий атрибут початкового відношення.
5НФ усуває надлишковість і водночас аномалії поповнення БД. Насамкінець наголосимо, що нормалізація відношень усуває між атрибутами такі залежності: неповні функціональні, транзитивні, нетривіальні (незалежні) багатозначні. Усуваючи ці залежності, виключаємо дублювання даних і можливість виникнення аномалій при виконанні операцій поповнення, заміни та вилучення даних з БД. Крім того, нормалізована база даних вимагає значно менше пам'яті для її зберігання, ніж ненормалізована база даних.