
- •Информация и компьютер
- •Иерархические системы
- •Сетевые системы
- •Инфологическое проектирование баз данных
- •Выбор модели данных. Существование различных моделей обусловлено большим количеством разработанных к настоящему времени разнообразных субд.
- •Реляционные операторы
- •Целостность внешних ключей
- •Операторы dml (Data Manipulation Language) - операторы манипулирования данными
Информация и компьютер
Информация – любые сведения о каком либо событии, сущности, процессе и тп, являющиеся объектом некоторых операций восприятия, передачи, преобразования, хранения или использования.
Данные - информация, фиксированная в определённой форме, пригодной для последующей обработки, хранения и передачи.
Информационные системы:
В самом широком смысле информационная система представляет собой программный комплекс, функции которого состоят в поддержке надежного хранения информации в памяти компьютера, выполнении специфических для данного приложения преобразований информации и/или вычислений, предоставлении пользователям удобного и легко осваиваемого интерфейса. Обычно объемы информации, с которыми приходится иметь дело таким системам, достаточно велики, а сама информация имеет достаточно сложную структуру. Классическими примерами информационных систем являются банковские системы, системы резервирования авиационных или железнодорожных билетов, мест в гостиницах и т.д.
Типы информационных систем:
Системы, основанные на инвертированных списках, иерархические и сетевые системы управления базами данных.
Пример систем, основанных на инвертированных списках: Datacom/DB. В этих системах пользователи не имеют непосредственного доступа к инвертированным спискам (индексам). Хранимые таблицы и пути доступа к ним видны пользователям. При этом строки таблиц упорядочены системой в некоторой физической последовательности. Для каждой таблицы можно определить произвольное число ключей поиска, для которых строятся индексы. Эти индексы автоматически поддерживаются системой, но явно видны пользователям. Общие правила определения целостности БД отсутствуют. В некоторых системах поддерживаются ограничения уникальности значений некоторых полей, но в основном все возлагается на прикладную программу.
Иерархические системы
Типичным представителем является Information Management System (IMS) фирмы IBM. Иерархическая БД состоит из упорядоченного набора деревьев; более точно, из упорядоченного набора нескольких экземпляров одного типа дерева. Тип дерева состоит из одного "корневого" типа записи и упорядоченного набора из нуля или более типов поддеревьев (каждое из которых является некоторым типом дерева). Тип дерева в целом представляет собой иерархически организованный набор типов записи.
Автоматически поддерживается целостность ссылок между предками и потомками. Основное правило: никакой потомок не может существовать без своего родителя. В иерархических системах поддерживалась некоторая форма представлений БД на основе ограничения иерархии.
Сетевые системы
Типичным представителем является Integrated Database Management System (IDMS) компании Cullinet Software, Inc. Сетевой подход к организации данных является расширением иерархического. В иерархических структурах запись-потомок должна иметь в точности одного предка; в сетевой структуре данных потомок может иметь любое число предков. Сетевая БД состоит из набора записей и набора связей между этими записями, а если говорить более точно, из набора экземпляров каждого типа из заданного в схеме БД набора типов записи и набора экземпляров каждого типа из заданного набора типов связи. В принципе, поддержание ограничения целостности не требуется, но иногда требуют целостности по ссылкам (как в иерархической модели).
Типы баз данных:
Базы данных бывают двух типов: сплошные и реляционные. В неструктурированной системе (сплошном файле) все данные объединены в одной единственной таблице. Например телефонная книга: фамилии, адреса и телефоны (данные) собраны в одном месте (базе данных). В таких случаях возможно дублирование информации, например, если кто-то провел себе домой три телефонных номера, то его фамилия и адрес будет трижды повторяться в справочнике.
В реляционной (связанной) системе данные организованы таким образом, чтобы занимать как можно меньше места. Это достигается за счет отказа от дублирования данных (избыточность) в базе. Данные при этом разбиваются на несколько таблиц, в каждой из которых храниться определённая информация. Все таблицы реляционной БД должны содержать ключевое поле (данные этого поля связывают соответствующие записи из различных таблиц).
Неструктурированные системы просты в создании и управлении (Microsoft Excel), предназначены для простого решения простых задач. Реляционные БД экономят место, позволяют быстрее найти нужную информацию, могут иметь содержать в себе большое количество информации, но требуют большего навыка разработчика.
Краткая характеристика этапов проектирования баз данных.
Основные этапы проектирования БД: инфологическое и датологическое проектирования, причем последнее подразделяют на логическое и физическое проектирования.
Проектирование любой базы данных складывается из нескольких этапов:
формулировка и анализ требований;
концептуальное проектирование;
проектирование реализацией;
физическое проектирование.
На первом этапе определяются цели проектирования, семантика, выделяются информационные потоки, определяются сферы применения, собирается информация об используемых данных, преобразуется в форму, удобную для анализа.
На втором этапе проектирования строится модель предметной области, т.е. формализованное представление объекта проектирования, абстрагированное от несущественных характеристик с точки зрения решения задачи. Таким образом, на данном этапе создаётся информационная модель – описание, абстрагированное от аппаратуры и СУБД. При этом, модель должна отвечать следующим требованиям: адекватность, непротиворечивость, расширяемость, воспринимаемость.
На третьем этапе в модели, созданной при концептуальном проектировании, данные и связи между ними определяются в терминах СУБД. Проверяется адекватность, определяется состав БД, оценивается эффективность БД.
На четвёртом этапе выбираются форматы представления информации, организуется описание данных и связей между ними на уровне СУБД. Задачей физического этапа проектирования является выбор рациональной структуры хранения данных и методов доступа к ним, исходя из того арсенала методов и средств, который представляется разработчику используемой СУДБ.