
БАЗЫ ДАННЫХ
В самом широком смысле «База данных» - это набор записей и файлов , организованный специальным образом. Примеры:
- адреса и телефоны друзей, их дни рождения, и они сгруппированы, например, по алфавиту;
- телефонный справочник;
- список сотрудников фирмы.
Обычно эта информация хранится в виде таблиц, часто - электронных таблиц, например Excel. Но часто возможностей электронных таблиц бывает недостаточно и возникает необходимость переходить к электронным базам данных.
Например, у предприятия существует несколько таблиц различных данных: список сотрудников, список поступающих материалов, производимых товаров, фирм, с которыми работает предприятие. И эти таблицы должны быть связаны каким-то образом.
Второй причиной перехода является следующее. Электронная таблица при работе загружается с диска в память целиком. При больших объемах таблиц может не хватить памяти. При работе с электронными базами в память с диска загружаются только необходимые в этот момент данные.
Кроме того, обычно на предприятиях этими данными пользуется не один сотрудник, а некоторое количество людей, т.е. возникает коллективное пользование, поэтому возникают вопросы защиты информации.
А если появляется какой-то комплекс данных, то появляется необходимость управления им – система управления базой данных СУБД. СУБД – комплекс программ, управляющих работой базы данных.
Таким образом, основными причинами перехода к базам данных являются:
- необходимость установления связей между таблицами
- большой объем таблиц.
- коллективное пользование.
История развития субд
Еще в начале появления вычислительных машин развитие вычислительной техники шло в 2-х направлениях:
Численные расчеты.
Автоматизированные информационные системы. Несколько позже – 1968 г. появилась первая промышленная СУБД фирмы IBM.
Основные этапы развития БД в нашей стране.
Организация БД на больших ЭВМ типа ЕС-ЭВМ. Базы хранились во внешней памяти, доступ обеспечивался с помощью терминалов, которыми служили устройства ввода-вывода. Это были системы коллективного пользования (распределенного доступа). База была централизованной, а доступ был от многих пользователей.
С появлением персональных компьютеров появились различные СУБД: DBase, FoxPro, Clipper, Paradox, Oracle и др. Это СУБД с монопольным доступом.
Начало 80-х характеризуется широким внедрением локальных сетей. Многие из перечисленных СУБД используются с распределенным доступом, но на более высоком уровне.
Модели данных
Ядром любой БД является модель данных. С помощью модели могут быть представлены различные объекты и взаимодействие между ними.
Модель данных - совокупность структур данных и операций их обработки.
Рассмотрим 3 основных типа моделей данных.
Иерархическая модель. Образует ориентированный граф – перевернутое дерево
Основные понятия: уровень, элемент (узел), связь.
Узел – описание некоторого объекта и его данные. Каждый узел на более низком уровне связан только с одним узлом на более высоком уровне. Иерархическое дерево имеет только 1 вершину (корень дерева), не подчиненную никакой другой вершине и находящуюся на самом верхнем (первом) уровне. Остальные узлы – подчиненные. В базе могут быть одно или несколько деревьев. Примеры:
- файловая структура компьютера;
- домашний адрес.
Поиск данных в такой базе очень простой, если известен путь.
Сетевая модель.
При тех же понятиях: (уровень, узел, связь) каждый элемент может быть связан с другим элементом. Пример – интернет.
Реляционная модель. (Relatoin – отношение). Данные организованы в виде таблиц. Практически все электронные БД являются реляционными. В этих таблицах строки называются записями, а столбцы – полями.
В электронных таблицах EXCEL единицей объекта является ячейка, т.е. каждой ячейке соответствует адрес памяти в компьютере.
В БД элементарным объектом является строка, а столбец – атрибут объекта, его свойство, т.е. адрес присваивается строке.
Свойства:
Каждая запись (строка) содержит информацию, относящуюся (related) только к одному конкретному объекту. Здесь опять есть отличие от EXCEL, где ячейки независимы, и в одной строке может быть любая информация.
Все элементы в одном столбце имеют одинаковый тип (числовой, символьный и т.д.).
Каждый столбец имеет уникальное имя.
Данные в столбце независимы от других столбцов т.е. не изменяются при изменении в других столбцах.
Порядок следования столбцов может быть произвольным, т.е столбцы можно перемещать на экране.
Порядок следования строк в таблице таков, в каком порядке ее заполняли.
Поле, которое однозначно определяет соответствующую запись, называется простым ключом или ключевым полем. Пример- табельный номер сотрудника.
Существуют специализированные БД, созданные специально для каких-либо областей производства, знаний, банков. И есть универсальные, это dBase (старая), FoxPro, Paradox, Oracle, Access. На их основе разрабатываются нужные для определенного пользователя приложения.
Реляционная модель, в отличие о иерархической, не является естественной, отражающей природу объекта, но она позволяет выполнять различные действия
Основные функции БД:
- главная – хранение, поиск, извлечение нужной информации;
- обработка информации: вычисления (различные функции, суммы и т.д.)
- изменения;
- управление.
В отличие от таблиц EXCEL, которые при работе все загружаются в память, в БД вся таблица не загружается в память, а происходит поиск в файле нужных записей, и только они загружаются в память.
Существуют специальные правила ведения БД.
В БД не должно быть ничего такого, что можно вычислить из существующих полей.
Изменения в таблицах БД производится, только если это действительно необходимо, для этого существуют специальные команды. Вы можете осуществлять какие-то изменения и вычисления, которые будут только на экране или на бумаге, но не изменятся в таблицах. Например, вы можете увеличить цену товара на 10% и посмотреть, как это повлияет на другие характеристики, посмотреть это на экране, но в таблице ничего не изменяя.