
- •Тема 1. Підприємство як цілеспрямована система. Інформаційні системи та їх роль в управлінні підприємством та економікою
- •Технічне забезпечення об’єднує комплекс технічних засобів, які реалізують одержання, реєстрацію, підготовку, введення, оброблення, виведення, зберігання та передавання даних.
- •Перелік та опис структурних одиниць інформації вихідних (вхідних) повідомлень Табл.3
- •Тема 2. Економічна інформація, засоби її форма-лізованого опису та технології оброблення інформації. План
- •Вироблення управлінських рішень – це є безперервний процес перетворення інформації.
- •Тема 3. Організація інформаційної бази системи оброблення інформації. План
- •Моделі даних машинною іб розглядається на
- •Тема 4. Інформаційні системи в економіці. План
- •Рекомендована література Основна
- •Додаткова
Моделі даних машинною іб розглядається на
двох рівнях: логічному та фізичному.
Логічний рівень - це абстрактний погляд на дані , на ньому вони представляються у такому вигляді і мають таку назву, як у реальному світі. Наприклад, “Постійний клієнт”, “Відділ”, “Прізвище співробітника”. Об’єкти моделі логічного рівня називаються сутностями та атрибутами.
Сутність – це множина подібних індивідуальних об’єктів, кожен з яких називається екземпляром.
Атрибут – виражає визначену властивість об’єкта.
Сутність можна визначити як об’єкт, подію або концепцію, інформація про яких повинна зберігатися.
Фізична модель даних відображає інформацію про всі об’єкти БД, яка в цілому і кожний її об’єкт визначаються в форматі вибраної СКБД.
Розділення моделей даних на логічні та фізичні дозволяє розв’язати задачі документування моделі та масштабування.
Підготовлена фізична модель за обмеженнями СКБД є непонятою фахівцям предметної області, оскільки в ній використовується позначення сутності, атрибутів і зв’язків в скороченій формі за допомогою латинських літер, цифр та спеціальних символів, а не тих познчень, які використовуються в житті. Наявність логічної моделі знімає цю проблему, тобто розв’язує задачу документування моделі.
CASE – системи дозволяють при наявності логічної моделі автоматично побудувати за вибраною СКБД фізичну модель, системний каталог та відповідний SQL – скрипт, тобто виконати пряме проектування. Але CASE – системи дозволяють виконати і зворотне проектування – при наявності системного каталогу та SQL – скрипту згенерувати фізичну та логічну моделі для первісної та інших СКБД, а це означає що є можливість розв’язувати задачу масштабування – задачу по переносу структури даних з одного сервера на інші.
В логічній моделі даних не надається інформація по її об’єктах, в фізичній – надається. Наприклад, в фізичній моделі визначається тип для кожного атрибута, а в логічній не визначається. Логічна модель може мати зв’язки між об’єктами типу “багато до багатьох”, а фізична – ні (вони повинні бути перетворені на зв’язки типу “один до багатьох”.
Приклади логічної та фізичної моделей БД кінофільмів, які беруться у прокат наведені на рис. 2 та 3.
Ефективність роботи БД залежить від якості реалізованої в неї моделі. У зв’язку з цим методам створення оптимальних моделей приділяється велика увага зі сторони проектувальників.
Під оптимальною логічною моделлю баз даних розуміють модель, яка не має аномалій, пов’язаних з модифікацією БД, тобто проблем, що можуть виникнути у зв’язку з замінами, вставками і вилученнями даних із БД. Для створення оптимальної моделі БД застосовується теорія нормалізації реляційних БД.
Нормалізація відношень – це процес декомпозиції відношення на дві (або більше) проекції з метою вилучення аномалій, які пов'язані з її модіфікацією, це ітераційний зворотний процес.
В табл. 1 наведено тлумачення основних термінів реляційної моделі.
Терміни реляційної моделі Табл. 1
Реляційний термін |
Пояснення |
Відношення |
Таблиця |
Кортеж |
Рядок або запис |
Карденальне число |
Кількість рядків |
Атрибут |
Стовпчик або поле |
Ступінь |
Кількість стовпчиків |
Первинний ключ |
Унікальний ідентифікатор |
Домен |
Загальна сукупність допустимих даних |
Потенційний ключ- це підмножина множини атрибутів відношення, яка має властивості унікальності та ненадлишковості.
Властивість унікальності означає, що у відношенні не має кортежів з однаковим значенням визначеного ключа.
Властивість ненадлишковості означає, що не яка підмножина визначеного ключа не має властивості унікальності.
Визначемо поняття „Функціональна залежність”: R-відношення, Х та Y – вільні підмножини множини атрибутів відношення R, тоді множина Y функціонально залежна від Х (позначається Х Y) тоді і тільки тоді, коли кожне значення множини Х відношення R зв’язано у точністі з одним значенням множини Y відношення R.
Детермінант- це ліва частина (X) символьного запису функціональної залежності (Х Y).
Залежна частина – це права частина (Y) символьного запису функціональної залежності (Х Y).
Існує п’ять нормальних форм. При цьому третя нормальна форма уточнюється додатковою нормальною формою Бойса-Кодда (НФБК).
Рис.2.
Повна атрибутивна логічна схема моделі
даних кінофільмів, які беруться на
прокат
Наприклад, нормалізоване відношення не може мати атрибут "Адреса", оскільки він є агрегатом даних і складається з чотирьох атрибутів: "Місто","Вулиця", "Номер дому", "Номер квартири". Останні атрибути є скалярними (неподільними) і можуть бути включені у нормалізоване відношення.
Рис.
3. Фізична схема моделі БД кінофільмів,
які
беруться на прокат
Наприклад,
відношення "Постачання товарів",
наведене на рис. 4, не є нормалізованим
за 2НФ, оскільки атрибути НП, МП, С
функціонально зв’язані з атрибутом П#
; атрибути НТ, В, МТ з атрибутом Т# і тільки
атрибут К має залежність від всьго ключа
П#,Т#.
ПОСТ(П#, Т#, НП, НТ, В, МП, МТ, С, К)
Позначення:
П#, Т# - відповідно номер постачальника та товару;
НП,НТ- відповідно назва постачальника та товару;
МП,МТ - відповідно місто розташування постачальника та виробництва товару;
В- вартість товару, С- статус, К- кількість товару;
П#,Т# - первинний ключ
Рис.4. Відношення "Постачання товарів"
Для нормалізації відношення ПОСТ за 2НФ необхідно його розділити на три відношення: Т- товар, П- постачальник та ПТ- постачання:
Т(Т#, НТ, В, МТ),
П(П#, НМ, С, МП),
ПТ(П#, Т#, К),
де Т# ;П# ;П#,Т# - первинні ключи.
Так,
відношення Т та ПТ нормалізовані за
3НФ, а відношення П - ні, оскільки атрибути
НП та МП мають функціональну залежність
від первинного ключа П#, а атрибут С -
від неключового атрибута МП. В зв’язку
з наведеним, відношення П необхідно
розділити на два відношення М та ПТ:
ПТ(П#, НП, МП),
М(МП, С),
де П#, МП- первинні ключи.
Третя
нормальна форма не зовсім підходить
для відношень з двома (або більше)
потенційними складними ключами, які
перекриваються (тобто мають, принаймі
, один спільний атрибут).
.
Наприклад, відношення "Постачання
товарів" (ПТОВ) наведене на рис. 5
знаходиться у 3НФ, але не знаходиться в
НФБК. Така ситуація виникла оскільки
атрибути П#,
НП
є детермінантами(вони
визначають один одного),
але не є
потенційними ключами.
ПТОВ(П#, НП, Т#, К),
де П#,Т# - потенційний складний ключ,
НП,Т# - потенційний складний ключ (НП однозначно ідентифікує постачальника)
Рис. 5. Відношення "Постачання товарів" доповнене атрибутом НП
Для нормалізації відношення за НФБК неохідно його розділити на два відношення П та ДП:
П(П#, Т#, К),
де П#,Т# - первинний ключ;
ДП(П#,НП),
де П#- первинний ключ.
Наприклад,
відношення "Навчання" (НАВ) наведене
на рис. 6, яке має інформацію про курси,
викладачів та підручники не знаходиться
у 4НФ. В цьому відношенні, кожний курс
може викладатися одним викладачем
відповідної групи та використовувати
один із підручників відповідної групи.
Крім того, викладачі та рекомендовані
підручники є зовсім незалежні один від
одного (припустимо). В зв’язку з цим
відношення має багатозначну не
функціональну залежність Курс-->>
Викл|
Підручн.
НАВ(Курс, Викл, Підручн)
Рис. 6. Відношення НАВ з багатозначною залежністю Курс-->> Викл| Підручн
Для нормалізації відношення НАВ за 4НФ необхідно її поділити на два відношення КВ та КП:
КВ(Курс, Викл),
КП(Курс, Підруч),
де Курс, Викл ;Курс, Підруч - потенційні ключи.
Відношення, які знаходяться у 4НФ формуються за допомогою декомпозиції початкового відношення на дві проекції без втрат даних при їх з'єднанні. Але є відношення, які неможливо піддати декомпозиції на дві проекції без втрат , але які можна піддати декомпозиції на три( або більш ) проекції без втрат .
Наприклад,
відношення ПТЕ , яке відображає дані
пов’язані з постачальниками, товарами
та проектами
(див. рис.7), не знаходиться у 5НФ, оскільки
його можна декопозитувати на три
проекції: ПТ, ТЕ та ЕП без втрат даних
при їх з'єднанні.
Останні
відношення знаходяться у 5НФ. Відношення
ПТЕ є повністю ключовим.
Рис.
7. Декомпозиція відношення ПТЕ на проекції
ПТ,ТЕ, ЕП (які мають багатозначні
функціональні залежності) та їх з’єднання
без втрат даних.
Контрольні запитання
1.Дайте визначення наступних термінів: інформаційна база, позамашинна та машинна ІБ.
2. Які задачі необхідно вирішувати під час проектуван-ня первинних документів?
3. Що визначає поняття "Уніфікована система первин-ної документації" ?
4. Навести визначення термінів : СКБД, база даних, модель даних.
5. Які компоненти входять до складу АБД?
6. Дайте порівняльну характеристику логічної та фізич-ної моделей.
7. Що таке нормалізоване відношення?
8. Які властивості притаманні відношенню нормалізо-ваному за 1НФ, 2НФ, 3НФ, НФБК, 4НФ,5НФ?