Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ИС. Систематизация и хранение информации. Базы....doc
Скачиваний:
6
Добавлен:
03.12.2018
Размер:
145.92 Кб
Скачать

Систематизация и хранение информации. Базы данных

В каком виде должна храниться информация, чтобы с ней было удобно работать? Ее нужно определенным образом структурировать, организовать в информационную систему

(в узком смысле) Информационной системой (ИС) можно считать совокупность любой связанной структурированной информации.

Например, в качестве информационной системы можно рассматривать расписание движения поездов или книгу регистрации данных о заказах.

Информационная система позволяет облегчить труд человека, повысить качество и достоверность обработки информации. Информационная система может храниться как в «бумажном» варианте, так и в памяти компьютера.

Основу информационной системы составляют хранящиеся в ней данные. Хорошая информационная система должна предоставлять достоверную информацию в определенное время конкретному лицу с ограниченными затратами.

Элемент информационной системы, информация о котором сохраняется в ней, называется объектом.

Объект может быть реальным (человек, населенный пункт, какой-либо предмет) и абстрактным (событие, счет покупателя).

Например, при продаже автомобилей ИС будет содержать такие объекты: модель автомобиля (например, ВАЗ-2107), клиент (Сидоров), счет.

На товарном складе это будут: поставщик, товар, отгрузка товара и т. д.

Каждый объект обладает набором свойств, которые запоминаются в ИС.

Например, объект «клиент Сидоров» может характеризоваться фамилией, именем, годом рождения, телефоном, адресом, номером счета.

Свойства, характеризующие объект, называются атрибутами объекта.

Например, модель автомобиля характеризуется типом кузова, рабочим объемом двигателя, количеством цилиндров, мощностью, габаритами и т. д.

Каждый атрибут имеет свое имя — идентификатор.

Атрибут, записанный на каком-либо носителе информации, называют элементом данных, полем данных или просто полем.

При обработке данных часто встречаются однотипные объекты с одинаковыми свойствами. Клиент Булкин также характеризуется фамилией, именем, годом рождения и т.д.

Совокупность объектов, обладающих одинаковым набором свойств, называется классом объектов. Сидорова и Булкина можно объединить в класс - клиенты.

(в узком смысле) Информационная система, которая хранится в электронном виде, называется базой данных

Базы данных

База данных (БД) представляет совокупность взаимосвязанных, хранящихся вместе сведений, которые используются оптимальным образом для одного или нескольких программных приложений. Данные запоминаются так, чтобы они были независимы от программ, использующих эти данные. Для добавления новых или модификации существующих данных, а также для поиска данных в базе данных применяется общий управляемый способ.

Описание данных выполняется на трех уровнях, породивших, соответственно, три схемы: концептуальную, внешнюю и внутреннюю.

Концептуальная схема представляет собой описание логической структуры всей БД. Термин «логическая» означает, что описание структуры выполняется на смысловом уровне (слово концепт означает смысл), без указания способа представления данных в ЭВМ.

Рассмотрим этот подход более подробно. БД есть информационная модель реального мира, в котором выделяются объекты, свойства (характеристики или признаки) объектов и взаимосвязи между объектами. Например, для объекта ТОВАРЫ свойствами являются Код товара, Наименование товара, Описание товара, Цена, Код поставщика. Для объекта ПОСТАВЩИКИ свойствами являются Код поставщика, Название поставщика, Телефон, Факс, Адрес, Фамилия директора. Объекты могут быть связаны свойством Код поставщика.

В БД объекты представляются с помощью записей, свойства — с помощью атрибутов, а взаимосвязи — с помощью связей. Записи, атрибуты и связи являются тремя основными формами представления данных в БД.

Атрибут представляет собой элементарное данное — число, символьную строку, специализированное числовое данное (такое как «деньги») и т. д. Так, для объекта ТОВАРЫ значениями атрибутов являются конкретное число, например 10, соответствующее коду товара, символьная строка, например телевизор, определяющая наименование товара, и т. д. Запись состоит из значений нескольких атрибутов. Связи, как и атрибуты, являются элементарными данными. Однако их функция — непосредственно связывать две записи.

Часто БД проектируется таким образом, чтобы один или несколько атрибутов однозначно идентифицировали запись. Совокупность значений этих атрибутов называется ключом записи, а сами атрибуты — ключевыми атрибутами. Ключ записи можно рассматривать как уникальное имя записи, по которому СУБД всегда может найти эту запись.

Кроме того, в концептуальной схеме обычно дается информация о типах значений атрибутов (символьные, числовые и др.) и об ограничениях целостности, которые рассматриваются как ограничения на допустимые значения атрибутов, например возраст сотрудников не может быть меньше 16 лет.

Внешняя схема — это фрагмент концептуальной схемы. Внешнюю схему можно рассматривать как взгляд пользователя на интересующие его данные БД. Каждый пользователь вместе с администрацией БД составляет свою внешнюю схему и при решении рассматриваемой задачи он может иметь доступ только к описанным в ней данным и не может обратиться к остальной части БД. Одной БД, таким образом, может соответствовать ряд внешних схем, определяющих интерфейсы прикладных программ при их взаимодействии с БД.

Внутренняя схема представляет собой описание способов размещения данных во внешней памяти ЭВМ. Составление внутренней схемы выполняется администрацией БД. От удачного выбора внутренней схемы существенно зависит эффективность доступа к БД. Способы описания внутренней схемы в разных СУБД существенно отличаются друг от друга.

Правомерно предполагать, что информационные объекты концептуального уровня обладают большей продолжительностью жизни, чем технология, определяющая уровень развития технических средств и программного обеспечения. Концептуальная схема остается нечувствительной к изменениям этих технологий.

При проектировании баз данных решаются две основные проблемы:

— отображение объектов предметной области в абстрактные объекты модели данных таким образом, чтобы это отображение не противоречило семантике предметной области и было по возможности лучшим (эффективным, удобным и т. п.). Часто эту проблему называют проблемой логического проектирования баз данных;

— обеспечение эффективного выполнения запросов к базе данных, т. е. рациональное расположение данных в памяти, создание полезных дополнительных структур (например, индексов) с учетом особенностей конкретных СУБД. Эту проблему называют проблемой физического проектирования баз данных.

Известны три основных типа моделей данных, каждая из которых основана на какой-либо структурной модели данных. Обычно различают три модели: иерархическую, сетевую и реляционную. Первые две из них основаны на графовом представлении информации об объектах, последняя — на табличном.