Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
IV.docx
Скачиваний:
52
Добавлен:
11.04.2015
Размер:
107.1 Кб
Скачать

1.4 Преимущества баз данных

Различают однопользовательские системы (single – user – system) – это системы, в которых в одно и тоже время к базе данных может получить доступ не более одного пользователя; и многопользовательские системы (multi – user – system) – это системы, в которых к базе данных могут получить доступ сразу несколько пользователей.

В общем случае данные в базе данных являются интегрированными и общими. Что является наиболее важным ее преимуществом.

Интеграция данных подразумевает возможность представить базу данных как объединение нескольких отдельных файлов данных, полностью или частично не перекрывающихся.

Общие данные подразумевают возможность использования отдельных областей в базе данных несколькими различными пользователями.

Между физической базой данных и пользователями системы располагается уровень программного обеспечения – диспетчер базы данных или система управления базой данных (СУБД). Основная функция СУБД – предоставление возможности пользователю баз данных работать с ней, не вникая в детали на уровне аппаратного обеспечения.

Пользователи базы данных делятся на три большие группы:

  • прикладные программисты. Это сотрудники компании, которые создают прикладное программное обеспечение для решения конкретных задач компании. Программное обеспечение может быть написано на стандартном языке программирования типа Си или же на языке (обычно называемом языком четвертого поколения), входящем в комплект системы управления базой данных;

  • конечные пользователи. Это те люди, которым информация базы данных требуется для выполнения их прямых служебных обязанностей;

  • администраторы. Выделяют администратора сервера баз данных. Он ведает установкой, конфигурированием сервера, регистрацией пользователей, групп, ролей и т.п. Прямо или косвенно он обладает всеми привилегиями, которые имеют или могут иметь другие пользователи. Кроме администратора сервера может быть и администратор базы данных. К этой категории относится любой пользователь, создавший базу данных, и, следовательно, являющийся ее владельцем. Он может предоставлять другим пользователям доступ к базе и к содержащимся в ней объектам. Администратор базы отвечает за ее сохранение и восстановление. В принципе в организации может быть много администраторов баз данных.

Преимущества системы баз данных по сравнению с бумажными методами сохранения записей следующие:

  • компактность;

  • скорость;

  • низкие трудозатраты;

  • применимость.

Преимущества баз данных, связанные с централизованным управлением:

  • возможность сокращения избыточности;

  • возможность устранения противоречивости;

  • возможность общего доступа к данным;

  • соблюдение стандартов;

  • введение ограничений для обеспечения безопасности;

  • обеспечение целостности данных;

  • возможность сбалансировать противоречивые требования.

Основная цель систем баз данных – обеспечение независимости данных. Независимость данных можно определить как иммунитет к изменениям в структуре хранения данных и в методах доступа к ним.

Контрольные вопросы

  1. Назовите наиболее важные преимущества баз данных.

  2. В чем преимущества баз данных, связанные с централизованным управлением?

1.5 Основополагающие категории в теории баз данных

Одними из основополагающих в концепции баз данных являются обобщенные категории “данные” и “модель данных”.

Понятие «данные» – это набор конкретных значений, параметров, характеризующих объект, условие, ситуацию или любые другие факторы.

Данные не обладают определенной структурой, данные становятся информацией тогда, когда пользователь задает им определенную структуру, то есть осознает их смысловое содержание.

Модель данных – это некоторая абстракция, которая, будучи применима к конкретным данным, позволяет пользователям и разработчикам трактовать их уже как информацию, то есть сведения, содержащие не только данные, но и взаимосвязь между ними.

Модель, выражающая информацию о предметной области в виде, независимом от используемой СУБД, называется инфологической или семантической. Она отражает в естественной и удобной для разработчиков и других пользователей форме информационно-логический уровень абстрагирования, связанный с фиксацией и описанием объектов предметной области, их свойств и их взаимосвязей.

Инфологические модели данных используются на ранних стадиях проектирования для описания данных в процессе разработки приложения, а даталогические модели уже поддерживаются конкретной СУБД.

Обычно данные в базе данных называют «постоянными» (хотя они могут недолго оставаться таковыми!). Под словом «постоянные» подразумеваются данные, которые отличаются от других, более изменчивых данных, таких как промежуточные результаты, входные и выходные данные, управляющие операторы, рабочие очереди и вообще все транзитные данные.

Входные данные – это информация, передаваемая системе (обычно с терминала или рабочей станции). Такая информация может стать причиной изменений в постоянных данных (она может стать частью постоянных данных), но не является частью базы данных как таковой.

Выходные данные – это сообщения и результаты, выдаваемые системой (обычно выдаются на печать или отображаются на экране). И опять же эту информацию можно брать из постоянных данных, но ее нельзя рассматривать как часть базы данных.

База данных состоит из некоторого набора постоянных данных, которые используются прикладными системами на предприятии.

Предприятие – это любая независимая коммерческая, научная, техническая или другая организация. Любое предприятие неизбежно имеет большое количество данных, связанных с его деятельностью. Это и есть постоянные данные.

На практике сегодняшние предприятия используют две отдельные базы данных: с операционными данными и с данными для поддержки принятия решений. Базы данных систем принятия решения часто содержат отчетную информацию (например, итоги и средние результаты), которую, в свою очередь, периодично (раз в день или раз в неделю, например) получают из операционной базы данных (постоянной базы данных).

Обычно предприятию требуется записывать информацию об имеющихся проектах, деталях, поставщиках, складах, служащих. Все это составляет основные объекты, о которых необходимо хранить информацию.

Под термином объект мы будем понимать все, что может быть представлено в базе данных. Объект – это то, о чем необходимо записать информацию.

Кроме основных объектов существуют еще и отношения между ними, которые связывают их вместе.

Отношения могут быть: бинарными (связываются два типа объектов); отношения, связывающие один тип объектов; может быть любое количество отношений (служащие заняты в проекте, служащие управляют проектом).

Следует отметить, что отношение подобно основным объектам является частью данных. Поэтому вместе с основными объектами отношения тоже должны быть представлены в базах данных.

Схему, связывающую объекты между собой, будем называть схемой объект/отношения или диаграммой объект отношения.

Отметим несколько моментов в построении схемы:

  • большинство отношений в схеме связывают два типа объектов (т.е. они являются бинарными). Но возможно связать и три объекта (поставщики, проекты и детали) – тройное отношение. Т.е. определенные поставщики поставляют определенные детали для определенных проектов;

  • отношение может связывать один тип объектов. Например, детали. Это отношения означает, что некоторые детали содержат другие компоненты (спецификация материалов);

  • в наборе объектов может быть любое количество отношений. Например. Служащие заняты в проектах – один факт, и другой – служащие управляют проектом.

Дадим определение терминов: хранимое поле, хранимая запись, хранимый файл.

Хранимое поле - это поименованная единица хранения данных. Вообще, база данных содержит много экземпляров каждого из нескольких типов хранимых полей.

Хранимая запись – это набор связанных хранимых полей. Здесь также различают тип и экземпляр. Экземпляр хранимой записи состоит из группы связанных экземпляров хранимых полей.

Хранимый файл – это набор всех экземпляров хранимых записей одного типа.

В базах данных логическая запись не обязательно совпадает с хранимой записью, то есть может понадобиться внести изменения в структуру хранения данных, в то время как логическая структура остается неизменной.

Контрольные вопросы

  1. Поясните структуру инфологической модели

Назовите типы объектов в отношении.

1.6 Модели систем баз данных

Почти все базы данных, созданные с конца 70-х годов, основаны на реляционном подходе. Более того, подавляющее большинство научных исследований в области баз данных в течение последних 35 лет проводилось в этом направлении.

Реляционный подход представляет собой основную тенденцию сегодняшнего рынка, и реляционная модель – единственная наиболее существенная разработка в истории развития баз данных.

Дореляционные системы можно разделить на три большие категории:

система инвертированных списков;

иерархические;

сетевые.

Системы инвертированных списков: CA – DATACOM/DB компании Computer Associates International.

Иерархические системы: IMS корпорации IBM.

Сетевые: CA – IDMS/DB компании Computer Associates International Inc.

Первые реляционные продукты начали появляться в конце 1970-х – начало 1980-х годов. А в 1998г. существовало уже более 250 коммерческих реляционных продуктов.

Среди них DB2 корпорации IBM; Rdb/VMS корпорации Digital Equipment; ORACLE корпорации Oracle; INGRES компании Ingress Division of the Ask Group Ins; SYBASE компании SYBASE Ins. и многие другие.

Несколько позже исследования велись в направлении так называемых «постреляционных» систем, некоторые из них основаны на совместимых снизу вверх расширениях оригинального реляционного подхода, другие представляют собой попытки создать что-то отличное.

Перечислим лишь некоторые наиболее поздние из них:

  • дедуктивные СУБД;

  • экспертные СУБД;

  • расширяемые СУБД;

  • объектно-ориентированные СУБД;

  • семантические СУБД;

  • универсальные СУБД.

Постреляционная модель допускает многозначные поля, чем снимается ограничение неделимости данных, хранящихся в записях таблиц.

По способу установления связей между данными различают реляционную, иерархическую и сетевую модели.

В настоящее время создано большое количество СУБД, имеющих приблизительно одинаковые возможности. Все они позволяют создавать файлы БД, редактировать их, обновляя записи, удаляя ненужные, добавляя новые. Созданные файлы БД можно упорядочивать по значению определенного индексного реквизита, выполнять поиск информации в базе, формировать отчеты заданной формы. Кроме того, очень важной является функция изменения структуры уже созданного файла базы данных.

Увеличение объема и структурной сложности хранения данных, расширение круга пользователей информационных систем привели к широкому распространению наиболее удобных и сравнительно простых для понимания реляционных СУБД. В них тем или иным путем решаются специфические проблемы параллельных процессов, целостности (правильности) и безопасности данных, а также санкционированного доступа.

Достоинством реляционной модели является сравнительная простота инструментальных средств ее поддержки, недостатком – жесткость структуры данных (невозможность, например, задания строк таблицы произвольной длины) и зависимость скорости ее работы от размера базы данных.

Реляционная модель является простейшей и наиболее привычной формой представления данных в виде таблицы. В теории множеств таблице соответствует термин отношение (relation), который и дал название модели. Для нее имеется развитый математический аппарат – реляционное исчисление и реляционная алгебра, где для баз данных (отношений) определены такие хорошо известные теоретико-множественные операции, как объединение, вычитание, пересечение, соединение и др.

Иерархическая и сетевая модели предполагают наличие связей между данными, имеющими какой-либо общий признак. В иерархической модели такие связи могут быть отражены в виде дерева- графа, где возможны только односторонние связи от старших вершин к младшим. Это облегчает доступ к необходимой информации, но только если все возможные запросы отражены в структуре дерева. Никакие иные запросы удовлетворены быть не могут.

Указанный недостаток снят в сетевой модели, где, по крайней мере, теоретически, возможны связи “всех со всеми”. Поскольку на практике это, естественно, невозможно, приходится прибегать к некоторым ограничениям.

Использование иерархической и сетевой моделей ускоряет доступ к информации в базе данных. Но так как каждый элемент данных должен содержать ссылки на некоторые другие элементы, требуются значительные ресурсы как дисковой, так и оперативной памяти ПЭВМ. Недостаток оперативной памяти, конечно, снижает скорость обработки данных. Кроме того, для таких моделей характерна сложность реализации СУБД.

В настоящее время реляционные системы лучше всего соответствуют техническим возможностям персональных компьютеров и вполне удовлетворяют большинство пользователей. Скоростные характеристики этих СУБД поддерживаются специальными средствами ускоренного доступа к информации и индексированием баз данных.

Контрольные вопросы

  1. Назовите основные преимущества реляционной модели

  2. Перечислите проблемы, которые решаются реляционной моделью.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]