
- •1. Введение в информатику
- •1.1. Информатика как научная дисциплина
- •1.2. Понятие информации
- •1.3. Основные свойства информации
- •1.4. Общая характеристика процессов сбора, передачи, обработки и накопления информации
- •2. Количество информации. Формы представления информации
- •2.1. Количество информации
- •2.2. Единицы измерения количества информации
- •2.3. Формы представления информации
- •2.3.1. Язык как знаковая система
- •2.3.2. Кодирование информации
- •2.3.3. Двоичная система счисления
- •2.3.4. Двоичное кодирование информации в компьютере
- •3. Технические средства реализации информационных процессов. Персональный компьютер
- •3.1. Архитектура персональных компьютеров
- •3.2. Функциональная схема компьютера
- •4. Состав аппаратного обеспечения персонального компьютера
- •4.3. Устройства ввода информации
- •4.4. Устройства вывода информации
- •5. Принципы построения вычислительных сетей
- •5.1. Программные и аппаратные компоненты вычислительной сети
- •5.2. Локальные и глобальные сети эвм
- •6. Программные средства реализации информационных процессов
- •6.1. Системное и прикладное программное обеспечение
- •6.2. Операционные системы
- •6.2.1. Понятие, основные функции и составные части операционной системы
- •6.2.2. Классификация операционных систем
- •6.2.3. Операционная система ms dos
- •6.2.4. Командный процессор Command.Com
- •6.2.5. Операционные системы Windows
- •7. Файловые системы
- •7.1. Основные функции файловой системы
- •7.2. Файлы и каталоги
- •7.3. Физическая организация данных на носителе
- •Текстовые редакторы, процессоры
- •4.2.2. Текстовый npoцeccop WordPad
- •4.2.3. Текстовый npoцeccop Word
- •4.3.1. Общие сведения о табличном процессоре Excel
- •4.3.2. Создание таблиц
- •4.3.3. Работа с формулами, диаграммами, списками
- •10. Базы данных
- •10.1. Понятие базы данных
- •10.2. Модели организации данных
- •11. Основы защиты информации и сведений, составляющих государственную тайну. Методы защиты информации
- •Библиографический список
10. Базы данных
В самом широком смысле любая программа имеет дело с некоторой внешней по отношению к ее коду информацией, задающей какие-либо параметры или режим ее работы. Такую информацию также называют данными программы. Очевидно, что в зависимости от типа задач проблемы организации работы с данными будут качественно различными. В подавляющем большинстве случаев при решении хозяйственных, экономических и финансовых задач приходится иметь дело с обширными специфически структурированными и взаимозависимыми массивами данных. Такие сложные наборы данных традиционно принято называть базами данных.
10.1. Понятие базы данных
Базу данных (БД) можно определить как унифицированную совокупность данных, совместно используемую различными задачами в рамках некоторой единой автоматизированной информационной системы.
Теория управления базами данных как самостоятельная дисциплина начала развиваться приблизительно с начала 50-х годов двадцатого столетия. За это время в ней сложилась определенная система фундаментальных понятий. Приведем некоторые из них.
Предметной областью принято называть часть реального мира, подлежащую изучению с целью организации управления в этой сфере и последующей автоматизации процесса управления.
Объектом называется элемент информационной системы, сведения о котором хранятся в базе данных. Иногда объект также называют сущностью.
Классом объектов называют их совокупность, обладающую одинаковым набором свойств.
Атрибут – это информационное отображение свойств объекта. Каждый объект характеризуется некоторым набором атрибутов.
Ключевым элементом данных называется такой атрибут (или группа атрибутов), который позволяет определить значения других элементов данных.
Запись данных – это совокупность значений связанных элементов данных.
Первичный ключ – это атрибут (или группа атрибутов), который уникальным образом идентифицирует каждый экземпляр объекта (запись).
Вторичным ключом называется атрибут (или группа атрибутов), значение которого может повторяться для нескольких записей (экземпляров объекта). Прежде всего вторичные ключи используются в операциях поиска записей.
Процедуры хранения данных в базе должны подчиняться некоторым общим принципам, среди которых в первую очередь следует выделить:
- целостность и непротиворечивость данных, под которыми понимается как физическая сохранность данных, так и предотвращение неверного использования данных, поддержка допустимых сочетаний их значений, защита от структурных искажений и несанкционированного доступа;
- минимальную избыточность данных, которая обозначает, что любой элемент данных должен храниться в базе в единственном виде, что позволяет избежать необходимости дублирования операций, проводимых с ним.
Программное обеспечение, осуществляющее операции над базами данных, получило название система управления базами данных (СУБД). Очевидно, что его работа должна быть организована таким образом, чтобы выполнялись перечисленные принципы.
10.2. Модели организации данных
Набор принципов, определяющих организацию логической структуры хранения данных в базе, получил название модели данных. Модели баз данных определяются тремя компонентами:
а) допустимой организацией данных;
б) ограничениями целостности;
в) множеством допустимых операций.
В теории систем управления базами данных выделяют модели трех основных типов: иерархическую, сетевую и реляционную.
Терминологической основой для иерархической и сетевой моделей являются понятия: атрибут, агрегат и запись.
Под атрибутом (элементом данных) понимается наименьшая поименованная структурная единица данных. Поименованное множество атрибутов может образовывать агрегат данных. В некоторых случаях отдельно взятый агрегат может состоять из множества экземпляров однотипных данных или, как еще говорят, являться множественным элементом.
Наконец, записью называют составной агрегат, который не входит в состав других агрегатов. В иерархической модели все записи, агрегаты и атрибуты базы данных образуют иерархически организованный набор, то есть такую структуру, в которой все элементы связаны отношениями подчиненности и при этом любой элемент может подчиняться только одному какому-нибудь другому элементу. Такую форму зависимости удобно изображать с помощью древовидного графа.
Рисунок 10.1. Иерархическая модель базы данных.
Концепция сетевой модели данных связана с именем Ч. Бахмана. Сетевой подход к организации данных является расширением иерархического. В иерархических структурах запись-потомок должна иметь в точности одного предка. В сетевой структуре данных потомок может иметь любое число предков.
Сетевая БД состоит из набора записей и набора связей между этими записями, точнее из набора экземпляров записей заданных типов (из допустимого набора типов) и набора экземпляров из заданного набора типов связей.
Рисунок 10.2. Сетевая модель базы данных.
Концепция реляционной модели впервые были сформулирована в работах американского ученого Э.Ф. Кодда. Откуда происходит ее второе название – модель Кодда (рис. 10.3).
В реляционной модели объекты и взаимосвязи между ними представляются с помощью таблиц. Для ее формального определения используется фундаментальное понятие «отношения». Собственно говоря, термин «реляционная» происходит от английского relation – отношения.
Основным достоинством реляционной модели является ее простота. Именно благодаря ней она положена в основу подавляющего большинства реально работающих СУБД. В настоящее время одной из самых популярных среди настольных (персональных) программных систем управления базами данных является Microsoft Access.
Т |
| ||||||
Поле 1.1 |
Поле 1.2 |
Поле 1.3 |
П |
| |||
|
|
|
|
| |||
|
|
|
|
| |||
|
Т | ||||||
|
Поле 2.1 |
Поле 2.2 |
Поле 2.3 | ||||
|
|
|
| ||||
|
|
|
| ||||
Таблица 3 |
| ||||||
П |
Поле 3.2 |
Поле 3.3 |
Поле 3.4 |
| |||
|
|
|
|
| |||
|
|
|
|
|
Рис. 10.3. Реляционная модели базы данных.