- •З дисципліни технологія проектування та адміністрування баз даних і сховищ даних
- •1. Визначення і класифікація бд як інформаційної системи
- •2. Автоматизовані банки даних
- •2.1. Основні поняття й визначення бази і банків даних
- •2.2. Загальна побудова і характеристики бази даних.
- •2.3. Вимоги до банків даних
- •2.5. Принципи побудови банків даних
- •3. Технологія проектування бд
- •3.1. Трирівнева модель системи керування базою даних. Фізична і логічна незалежність.
- •3.2. Інфологічна модель даних. Основні поняття.
- •3.3. Класифікація моделей даних.
- •3.4. Вимоги й підходи до інфологічного проектування
- •3.5. Аналіз предметної області
- •3.4. Основні моменти аналізу предметної області
- •4. Модель «сутність – зв’язок» (er-модель) предметної області
- •4.1. Основні елементи моделі «сутність-зв'язок»
- •4.2. Основні риси моделі "сутність-зв'язок" (er-моделі).
- •6. Мови інфологічного моделювання
- •6.1. Мова er-діаграм
- •6.2. Технологія побудови ілм на прикладі er-моделі
- •1. Лобіо по грузинськи:
- •5. Класифікація сутностей і зв'язків
- •5.1. Класи сутностей
- •5.2. Характеристика зв'язків
- •7. Моделі даних, підтримувані субд.
- •7.1. Організація даних
- •3.1. Файлова модель.
- •3.2. Структури даних.
- •12.1. Моделі даних - основні визначення.
- •12.2. Ієрархічна модель даних
- •12.3. Мережна модель даних
- •12.4. Переваги і відмінності мережної моделі.
- •13. Реляційна модель даних
- •5.1. Реляційна модель даних: основні поняття.
- •Студент
- •5.2. Характеристики відношення
- •Студент (Прізвище _ та _ ініціали, Курс, Група, Спеціальність)
- •5.2. Загальна структура реляційної моделі.
- •5.5. Основи реляційної алгебри Операції з даними в реляційній моделі
- •5.4. Поняття ключа. Основні типи ключів
- •8. Нормалізація схем баз даних
- •Кожна наступна нормальна форма в деякому змісті краще попередньої;
- •При переході до наступної нормальної форми властивості попередніх нормальних властивостей зберігаються.
- •9. Адміністрування баз даних
- •9.1. Завдання адміністрування даних.
- •9.2. Користувачі банків даних
- •9.3. Основні функції групи адміністратора бд
9.3. Основні функції групи адміністратора бд
1. Аналіз предметної області: опис предметної області, виявлення обмежень цілісності, визначення статусу (приступності, таємності) інформації, визначення потреб користувачів, визначення відповідності "дані - користувач", визначення об'ємно-тимчасових характеристик обробки даних.
2. Проектування структури БД: визначення складу і структури файлів БД і зв'язків між ними, вибір методів упорядкування даних і методів доступу до інформації, опис БД мовою опису даних (МОД).
3. Завдання обмежень цілісності при описі структури БД і процедур обробки БД:
- завдання декларативних обмежень цілісності, властивих предметної області;
- визначення динамічних обмежень цілісності, властивих предметної області в процесі зміни інформації, що зберігається в БД;
- визначення обмежень цілісності, викликаних структурою БД;
- розробка процедур забезпечення цілісності БД при введенні і коректуванні даних;
- визначення обмежень цілісності при рівнобіжній роботі користувачів у багато - користувацькому режимі.
4. Первісне завантаження і ведення БД:
- розробка технології первісного завантаження БД, що буде відрізнятися від процедури модифікації і доповнення даними при штатному використанні бази даних;
- розробка технології перевірки відповідності введених даних реальному станові предметної області. База даних моделює реальні об'єкти деякої предметної області і взаємозв'язку між ними, і на момент початку штатної експлуатації ця модель повинна цілком відповідати станові об'єктів предметної області на даний момент часу;
- відповідно до розробленої технології первісного завантаження може знадобитися проектування системи первісного введення даних.
5. Захист даних:
- визначення системи паролів, принципів реєстрації користувачів, створення груп користувачів, що володіють однаковими правами доступу до даних;
- розробка принципів захисту конкретних даних і об'єктів проектування;
- розробка спеціалізованих методів кодування інформації при її циркуляції в локальній і глобальної інформаційних мережах;
- розробка засобів фіксації доступу до даних і спроб порушення системи зашиті;
- тестування системи захисту;
- дослідження випадків порушення системи захисту і розвиток динамічних методів захисту інформації в БД.
6. Забезпечення відновлення БД:
- розробка організаційних засобів архивирования і принципів відновлення БД;
- розробка додаткових програмних засобів і технологічних процесів відновлення БД після збоїв.
7. Аналіз звертань користувачів БД: збір статистики по характері запитів, за часом їхнього виконання, по необхідних вихідних документах.
8. Аналіз ефективності функціонування БД:
- аналіз показників функціонування БД;
- планування реструктуризації (зміна структури) БД і реорганізації БнД.
9. Робота з кінцевими користувачами:
- збір інформації про зміну предметної області;
- збір інформації про оцінку роботи БД;
- навчання користувачів, консультування користувачів;
- розробка необхідної методичної і навчальної документації по роботі кінцевих користувачів.
10. Підготовка і підтримка системних засобів:
- аналіз існуючих на ринку програмних засобів і аналіз можливості і необхідності їхнього використання в рамках БД;
- розробка необхідних організаційних і програмно-технічних заходів щодо розвитку БД;
- перевірка працездатності закуповуваних програмних засобів перед підключенням їх до БД;
- курирування підключення нових програмних засобів до БД.
11. Організаційно-методична робота з проектування БД:
- вибір або створення методики проектування БД;
- визначення цілей і напрямку розвитку системи в цілому;
- планування етапів розвитку БД;
- розробка загальних словників-довідників проекту БД і концептуальної моделі;
- стикування зовнішніх моделей розроблювальних додатків;
- курирование підключення нового додатка до діючої БД;
- забезпечення можливості комплексного налагодження безлічі додатків,
взаємодіючих з однієї БД.
Контрольні запитання.
1. В чому полягає відмінність функцій прикладного програміста і аналітика?
Мовні засоби банку даних
Язикові засоби СУБД, необхідні для опису даних, організації спілкування й виконання процедур пошуку й різних перетворень даних. Класифікація язикових засобів Бнд, показана на мал. 2.2, розроблена американським комітетом CODASYL по проектуванню й створенню БД.
Рис.2.2. Схема класифікації мовних засобів БнД
Схема має загальний характер й орієнтована на різні СУБД. Однак не кожна СУБД, що зараз використається на практиці й поширена на ринку програмних продуктів, має весь набір зазначених язикових засобів.
Мова опису даних (DDL - Data Defіnіtіon Language), призначена для опису даних на різних рівнях абстракції: зовнішньому, логічному й внутрішньому.
Виходячи із пропозицій CODASYL, мови опису даних на логічному (концептуальному) і внутрішньому рівнях незалежні й різні. Однак у більшості промислових СУБД мов не ділиться на дві окремі мови опису логічної й фізичної організації даних, а існує єдина мова, що ще називається мовою опису схем.
У відомих й широко використовуваних на практиці СУБД родини dBASE застосовується єдина мова опису даних. Вона призначена для подання даних на логічному й фізичному рівнях. Ця мова має свій синтаксис: наприклад, ім'я файлу не повинне перевищувати восьми символів, а ім'я поля – десяти. При цьому кожне ім'я може починатися з букви, поля календарної дати позначаються символом D (DATA), символьні поля - С (CHARACTER), числові - N (NUMERІ), логічні - L (LOGІCAL), приміток - М (MEMO).
Опис всіх імен, типів і розмірів полів зберігається в пам'яті разом з даними; ці структури якщо буде потреба, можна переглянути й виправити.
Якщо логічний і фізичний рівні відділені, то до складу СУБД може входити мова опису збереження даних.
У деяких СУБД використається ще язик опису підсхем, що потрібний для опису частини БД, що відбиває інформаційні потреби окремого користувача або прикладної програми. У складі СУБД типу dBASE така мова не використається.
Мова опису даних на зовнішньому рівні використається для опису тренований користувачів і прикладних програм і створення інфологічної моделі БД. Ця мова не має нічого загального з мовами програмування. Так, язиковим засобом, що використаються для інфологічного моделювання, є звичайна природна мова або його підмножина, а також мова графів і матриць.
Мова маніпулювання даними (DML - Data Manіpulatіon Language) використається для обробки даних, їхніх перетворень і написання програм. DML може бути базовою або автономною.
Базова мова DML - це один із традиційних мов програмування (BASІC, FORTRAN й ін.). Системи, які використають базову мову, називають відкритими. Використання базових мов як мов опису даних звужує коло осіб, які можуть безпосередньо звертатися до БД, оскільки для цього потрібно знать мова програмування. У таких випадках для спрощення спілкування кінцевих користувачів із БД передбачається мова ведення діалогу, що
значно простіше для оволодіння, чим мова програмування.
Автономна мова DML - це власна мова СУБД, що дає можливість виконувати різні операції з даними. Системи із власною мовою називають закритими.
У сучасних СУБД для спрощення процедур пошуку даних у БД передбачена мова запитів. Найпоширенішими мовами запитів є SQL й QBE.
Мова запитів SQL (Structured Query Language - структурована мова запитів) був створений фірмою ІBM у рамках роботи над проектом побудови системи керування реляційними базами даних на початку 70-х років. Американський національний інститут стандартів (ANSІ) поклав цю мову в основу стандарту мов реляційних баз даних, прийнятого Міжнародною організацією стандартів (ІSO). Ядром існуючого стандарту SQL-86, які часто називають SQL-2 або SQL-92, є функції, реалізовані практично у всіх відомих комерційних реалізаціях мови, а повний стандарт уміщає такі вдосконалення, які деякі розроблювачі будуть повинні ще реалізувати.
Крім стандарту SQL-86 існує комерційний стандарт мови SQL, розроблений консорціумом виробників баз даних SQL Access Group. Ця група створила такий варіант мови, що використається більшістю систем і дає можливість їм "розуміти" одна іншу.
Був розроблений стандартний інтерфейс мови CLІ (Common Language Іnterface)
для всіх основних варіантів мови SQL. Цей інтерфейс, формалізований фірмою Mіcrosoft, одержав назву ODBC (Open DataBase Connectіvіty – відкритий доступ до даних). ODBC - це інтерфейс доступу до даних, які зберігаються під керуванням різних СУБД. ODBC має цілий набір драйверів, за допомогою яких одна СУБД може працювати з даними інших систем. Архітектура ODBC зображена на рис 2.3.
Рис. 2.3. Архітектура ODBC
Мова запитів QBE (Query By Example) - це реалізація запитів за зразком
у вигляді таблиць. Для визначення запиту до БД користувач повинен заповнити
надану системою таблицю QBE і визначити в ній критерії пошуку й вибору даних.
Розроблені мови маніпулювання даними, що дозволяють реалізувати всі операції реляційної алгебри і практично будь-які їх сполучення. Серед них найбільше поширені SQL (Structured Query Language - структуризована мова запитів) і QBE (Query-By-Example - запити за зразком) .
Обидві відносяться до мов дуже високого рівня, за допомогою яких користувач вказує, які дані необхідно одержати, не уточнюючи процедуру їхнього формування. За допомогою єдиного запиту на будь-якій із цих мов можна з'єднати декілька таблиць у тимчасову таблицю і вирізувати з неї необхідні рядки і стовпці (селекція і проекція).
Моделі, засновані на мовах розмітки документів, зв'язані, насамперед , зі стандартною загальною мовою розмітки - SGML (Standard Generalіzed Markup
Language), що був затверджений ІSO як стандарт ще в 80-х роках. Ця мова призначена для створення інших мов розмітки, він визначає припустимий набір тегів (посилань), їхні атрибути і внутрішню структуру документа. Контроль за правильністю використання тегів здійснюється за допомогою спеціального набору правил, називаних DTD-описами (Documents Type Definitions), які використовуються програмою клієнта при розборі документа. Для кожного класу документів визначається свій набір правил, що описують граматику відповідної мови розмітки. За допомогою SGML можна описувати структуровані дані, організовувати інформацію, що утримується в документах, представляти цю інформацію в деякому стандартизованому форматі. Але через деяку свою складність SGML використовувався в основному для опису синтаксису інших мов (найбільш відомим з яких є HTML), і деякі додатки працювали з SGML-документами прямо.
Набагато більш проста і зручний, чим SGML, є мова HTML (от HyperText Markup Language — «язык разметки гипертекста») дозволяє визначати оформлення елементів документа і має якийсь обмежений набір інструкцій - тегів, за допомогою яких здійснюється процес розмітки. Інструкції HTML у першу чергу призначені для керування процесом виводу вмісту документа на екрані програми-клієнта і визначають цим самим спосіб представлення документа, але не його структуру. HTML является компьютерным языком программирования, предназначенным для разработки web-страниц (документов HTML).
Як елемент гіпертекстової бази даних, описуваної HTML, використовується текстовий файл,що може легко передаватися по мережі з використанням протоколу HTTP. Ця особливість, а також те, що HTML є відкритим стандартом, і величезна кількість користувачів має можливість застосовувати можливості цієї мови для оформлення своїх документів, безумовно, уплинули на ріст популярності HTML і зробили його сьогодні головним механізмом представлення інформації в Іnternet.
Однак HTML сьогодні вже не задовольняє повною мірою вимогам, пропонованим сучасними розроблювачами до мов подібного роду. І йому на зміну була запропонована нова мова гіпертекстової розмітки, могутня, гнучка і, одночасно з цим, зручна мова XML(Extensіble Markup Language).
Достоїнства мови XML : - це мова розмітки, що описує цілий клас об'єктів даних, називаних XML-документами. Він використовується як засіб для опису граматики інших мов і контролю за правильністю складання документів. Тобто сам по собі XML не містить ніяких тегів, призначених для розмітки, він просто визначає порядок їхнього створення.
