
- •Управление данными
- •1. Базы и банки данных
- •Информация, данные, знания ?
- •1.3. Банки данных
- •1.4. Преимущества Банка данных
- •1.6. Классификация языковых средств
- •1.8. Пользователи банков данных
- •1.9. Администраторы банка данных
- •2. Модели и структуры баз данных
- •2.1. Инфологическая модель
- •2.2. Понятие модели данных
- •2.3. Иерархическая структура и модель данных
- •2.4. Сетевая структура бд
- •2.5. Реляционные базы данных
- •Должен использоваться единый язык для взаимодействия с субд.
- •2.6. Диаграмма «сущность-связь» Чена
- •2.7. Объектно-ориентированные базы даных
- •2.8. Нормализация бд
- •2.9. Об эволюции и многообразии моделей данных
- •3... Технология «хранилище данных»
- •3. 1 Концепция хранилища данных
- •3.2. Витрины данных
- •3.3. Категории данных в хд
- •3.4. Метаданные
- •3.5. Потоки данных
- •3.7. Преобразование данных.
- •3.8. Загрузка данных и очистка данных
- •3.9. Выявление проблем в данных
- •4. Технологии управления данными
- •4.1. Oltp-системы
- •4.2. Многомерная модель данных
- •4.3. Olap-системы
- •12 Основных требований е. Кодда
- •5. Технологии интеллектуального анализа данных
- •5.1.Методология анализа данных
- •5.2. Технология Data Mining
- •5.3. Технология kdd
- •Лабораторные работы
БД должна включать в себя метаданные. БД хранит два вида таблиц: пользовательские и системные. В пользовательских таблицах хранятся данные, введенные пользователем. В системных таблицах хранятся метаданные: описание таблиц (название, типы и размеры колонок), индексы, хранимые процедуры и др. Системные таблицы тоже доступны, т. е. пользователь может получить информацию о метаданных БД.
Должен использоваться единый язык для взаимодействия с субд.
Для управления реляционной БД должен использоваться единый язык. В настоящее время таким инструментом стал язык SQL.
6. СУБД должна обеспечивать альтернативный вид отображения дан ных. СУБД не должна ограничивать пользователя только отображением таблиц, которые существуют. Пользователь должен иметь возможность строить виртуальные таблицы— представления (View). Представления являются динамическим объединением нескольких таблиц. Изменения данных в представлении должны автоматически переноситься на исход ные таблицы (за исключением нередактируемых полей в представлении, например вычисляемых полей).
Должны поддерживаться операции реляционной алгебры. Записи реляционной БД трактуются как элементы множества, на котором определены операции реляционной алгебры. СУБД должна обеспечивать выполнение этих операций. В настоящее время выполнение этого правила обеспечивает язык SQL.
Должна обеспечиваться независимость от физической организации данных. Приложения, оперирующие с данными реляционных БД, не должны зависеть от физического хранения данных (от способа хранения, формата хранения и др.).
Должна обеспечиваться независимость от логической организации данных. Приложения, оперирующие с данными реляционных БД, не должны зависеть от организации связей между таблицами (логической организации). При изменении связей между таблицами не должны меняться ни сами таблицы, ни запросы к ним.
За целостность данных отвечает СУБД. Под целостностью данных в общем случае понимается готовность БД к работе. Различают физическую целостность — сохранность информации на носителях и корректность форматов хранения данных и логическую целостность — непротиворечивость и актуальность данных, хранящихся в БД. Потеря целостности базы данных может произойти из-за сбоев аппаратуры ЭВМ, ошибок в программном обеспечении, неверной технологии ввода и корректировки данных, низкой достоверности самих данных и т. д. За сохранение целостности данных должна отвечать СУБД, а не приложение, оперирующее ими. Различают два способа обеспечения целостности: декларативный и процедурный. При декларативном способе целостность достигается наложением ограничений на таблицы, при процедурном — обеспечивается с помощью хранимых в БД процедур.
Целостность данных не может быть нарушена. СУБД должна обеспечивать целостность данных при любых манипуляциях, производимых с ними.
Должны поддерживаться распределенные операции. Реляционная БД может размещаться как на одном компьютере, так и на нескольких — распределенно. Пользователь должен иметь возможность связывать данные, находящиеся в разных таблицах и на разных узлах компьютерной сети. Целостность БД должна обеспечиваться независимо от мест хранения данных.
2.6. Диаграмма «сущность-связь» Чена
Обобщением иерархической, сетевой и реляционной моделей данных является диаграмма «сущность-связь» Чена. Долгое время она оставалась не реализованной в СУБД, но, за счет своей наглядности, активно применялась на этапе логического проектирования базы данных.. В этой модели между классами сущностей существуют именованные n-арные связи с атрибутами. Объект может принадлежать к нескольким сущностям. Сущности могут входить в связь в нескольких ролях. Сущности обозначаются прямоугольниками, а связи – ромбиками. Связи также как и сущности могут иметь атрибуты. Атрибуты обозначаются овалами. Пример диаграммы «Сущность-связь» приведена на Рис. 212.
Рис. 21. Пример диаграммы «Сущность-связь»
Диаграмма «Сущность-связь» легко преобразуется в реляционную модель. Сущностям соответствуют таблицы, связям с арностью больше двух и связям с атрибутами также соответствуют таблицы. Бинарные связи «многие ко многим» заменяются на вспомогательные таблицы, соединенные со связываемыми таблицами двумя связями «один ко многим».