
- •Управление данными
- •1. Базы и банки данных
- •Информация, данные, знания ?
- •1.3. Банки данных
- •1.4. Преимущества Банка данных
- •1.6. Классификация языковых средств
- •1.8. Пользователи банков данных
- •1.9. Администраторы банка данных
- •2. Модели и структуры баз данных
- •2.1. Инфологическая модель
- •2.2. Понятие модели данных
- •2.3. Иерархическая структура и модель данных
- •2.4. Сетевая структура бд
- •2.5. Реляционные базы данных
- •Должен использоваться единый язык для взаимодействия с субд.
- •2.6. Диаграмма «сущность-связь» Чена
- •2.7. Объектно-ориентированные базы даных
- •2.8. Нормализация бд
- •2.9. Об эволюции и многообразии моделей данных
- •3... Технология «хранилище данных»
- •3. 1 Концепция хранилища данных
- •3.2. Витрины данных
- •3.3. Категории данных в хд
- •3.4. Метаданные
- •3.5. Потоки данных
- •3.7. Преобразование данных.
- •3.8. Загрузка данных и очистка данных
- •3.9. Выявление проблем в данных
- •4. Технологии управления данными
- •4.1. Oltp-системы
- •4.2. Многомерная модель данных
- •4.3. Olap-системы
- •12 Основных требований е. Кодда
- •5. Технологии интеллектуального анализа данных
- •5.1.Методология анализа данных
- •5.2. Технология Data Mining
- •5.3. Технология kdd
- •Лабораторные работы
2. Модели и структуры баз данных
2.1. Инфологическая модель
Развитие базы данных показало, что качественное решение задачи управления большими объемами данных невозможно без решения многих проблем технического, организационного, программного характера. Чтобы подчеркнуть важность всех этих компонентов, некоторые авторы характеризуют базы данных как совокупность информационных, математических, технических и организационных средств, направленных на удовлетворение информационных потребностей широкого круга пользователей. Важно подчеркнуть, что базы данных - не просто собранный в одном месте большой объем данных, а такое объединение данных, в котором выделена структура взаимосвязей для каждого отдельного элемента информации.
База данных является моделью некоторой предметной области, состоящей из связанных между собой данных об объектах, их свойствах и характеристиках. Чтобы сохранять данные согласно какой-либо модели предметной области, структура БД должна максимально соответствовать этой модели. В базе данных отображается какая-то часть реального мира. Естественно, что полнота ее описания будет зависеть от целей создаваемой информационной системы. Для того чтобы база данных адекватно отражала предметную область, проектировщик базы данных должен хорошо представлять себе все нюансы, присущие данной предметной области (ПО), и уметь отобразить их в базе данных. Поэтому, прежде чем начинать проектирование базы данных, необходимо как следует разобраться, как функционирует предметная область, для отображения которой создается БД. Предметная область должна быть предварительно описана. Для этого в принципе может использоваться и естественный язык, но его применение имеет много недостатков, основными из них являются громоздкость описания и неоднозначность его трактовки. Поэтому обычно для этих целей используют искусственные формализованные языковые средства. В связи с этим под инфологической моделью (ИЛМ) понимают описание предметной области, выполненное с использованием специальных языковых средств, не зависящих от используемых в дальнейшем программных средств.
Инфологическая модель (ИЛМ) должна строиться вне зависимости от того, будете ли вы в дальнейшем использовать какую-либо СУБД или пользоваться другими программными средствами для реализации своей информационной системы.
Основным требованием к ИЛМ, вытекающим из ее назначения, является требование адекватного отображения предметной области. В связи с этим язык для представления ИЛМ должен обладать достаточными выразительными возможностями для отображения явлений, имеющих место в предметной области. ИЛМ должна быть непротиворечивой. Она является единым интегрированным описанием предметной области и отражает взгляды и потребности всех пользователей системы. Не должна допускаться неоднозначная трактовка модели.
Несмотря на то, что реальный мир, отображаемый в ИЛМ, является по своей природе бесконечным, инфологическая модель является конечной, что обеспечивается четким ограничением предметной области. Тем не менее в ИЛМ по разным причинам часто приходится вводить новые объекты. ИЛМ должна в связи с этим обладать свойством легкой расширяемости, обеспечивающим ввод новых данных без изменения ранее определенных. То же самое можно сказать и об удалении данных. В связи с большой размерностью реальных инфологических моделей должна обеспечиваться возможность композиции и декомпозиции модели.
Желательно, чтобы язык спецификации ИЛМ был одинаково применим как при ручном, так и при автоматизированном проектировании информационных систем. Последнее предъявляет дополнительные требования к нему, а именно он должен: быть вычисляемым, т. е. восприниматься и обрабатываться ЭВМ; использовать «дружелюбные» пользователю интерфейсы, в частности графические; быть не зависимым от оборудования и других ресурсов, которые подвержены частым изменениям; использовать средства тестирования ИЛМ, а также иметь аппарат для указания того, что спецификация завершена и по ней может быть выполнена генерация структур баз данных. При автоматизированном проектировании все изменения, внесенные в ИЛМ, должны быть автоматически отражены в связанных с модифицируемым элементом компонентах банка данных.
Инфологическая модель должна легко восприниматься разными категориями пользователей. Желательно, чтобы ИЛМ строил специалист, работающий в этой предметной области, а не проектировщик систем машинной обработки данных. Если в силу определенных причин это невозможно обеспечить, то необходимо, чтобы первые могли хотя бы проверить сделанное описание, чтобы убедиться, что специфика предметной области воспринята правильно. Инфологическая модель должна также легко н однозначно восприниматься всеми специалистами, которые в дальнейшем участвуют в процессе проектирования баз данных и программного обеспечения.
Инфологическая модель является средством коммуникации разнообразных коллективов как конечных пользователей, так и разработчиков. Кроме того, она является ядром системы проектирования