Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Информационное обеспечение товароведения и эксп...doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
368.13 Кб
Скачать

3 Базы данных

  • Базой данных - представленная в объективной форме совокупность самостоятельных материалов (статей, расчетов, нормативных актов, судебных решений и иных подобных материалов), систематизированных таким образом, чтобы эти материалы могли быть найдены и обработаны с помощью электронной вычислительной машины

Наиболее часто используются следующие отличительные признаки:

  1. База данных хранится и обрабатывается в вычислительной системе. Таким образом, любые внекомпьютерные хранилища информации (архивы, библиотеки, картотеки и т. п.) базами данных не являются.

  2. Данные в базе данных логически структурированы (систематизированы) с целью обеспечения возможности их эффективного поиска и обработки в вычислительной системе. Структурированность подразумевает явное выделение составных частей (элементов), связей между ними, а также типизацию элементов и связей, при которой с типом элемента (связи) соотносится определённая семантика и допустимые операции[6].

  3. База данных включает метаданные, описывающие логическую структуру БД в формальном виде (в соответствии с некоторой метамоделью).

Не называют базами данных файловые архивы, Интернет-порталы или электронные таблицы, несмотря на то, что они в некоторой степени обладают признаками БД. Принято считать, что эта степень в большинстве случаев недостаточна (хотя могут быть исключения).

Многие специалисты указывают на распространённую ошибку, состоящую в некорректном использовании термина база данных вместо термина система управления базами данных. Эти понятия, следовательно, необходимо различать. [7]

Классификации БД

Существует огромное количество разновидностей баз данных, отличающихся по различным критериям (например, в [1] определяются свыше 50 видов БД).

Укажем только основные классификации.

  1. Классификация БД по модели данных.

1.1 Иерархическая модель базы данных состоит из объектов с указателями от родительских объектов к потомкам, соединяя вместе связанную информацию. Иерархической базой данных является файловая система, состоящая из корневой директории, в которой имеется иерархия поддиректорий и файлов.

Например, если иерархическая база данных содержала информацию о покупателях и их заказах, то будет существовать объект «покупатель» (родитель) и объект «заказ» (дочерний). Объект «покупатель» будет иметь указатели от каждого заказчика к физическому расположению заказов покупателя в объект «заказ».

В этой модели запрос, направленный вниз по иерархии, прост (например: какие заказы принадлежат этому покупателю); однако запрос, направленный вверх по иерархии, более сложен (например, какой покупатель поместил этот заказ). Также, трудно представить неиерархические данные при использовании этой модели.

Первые системы управления базами данных использовали иерархическую модель данных, и во времени их появление предшествует появлению сетевой модели.

  • По принципу иерархической БД построены иерархические файловые системы и Реестр Windows.

  • InterSystems Caché

  • Google App Engine Datastore API

1.2 К основным понятиям сетевой модели базы данных относятся: уровень, элемент (узел), связь.

Узел — это совокупность атрибутов данных, описывающих некоторый объект. На схеме иерархического дерева узлы представляются вершинами графа. В сетевой структуре каждый элемент может быть связан с любым другим элементом.

Сетевые базы данных подобны иерархическим, за исключением того, что в них имеются указатели в обоих направлениях, которые соединяют родственную информацию.

Несмотря на то, что эта модель решает некоторые проблемы, связанные с иерархической моделью, выполнение простых запросов остается достаточно сложным процессом.

Также, поскольку логика процедуры выборки данных зависит от физической организации этих данных, то эта модель не является полностью независимой от приложения. Другими словами, если необходимо изменить структуру данных, то нужно изменить и приложение.

Примеры сетевых СУБД

  • СООБЗ Cerebrum[1]

  • ИСУБД CronosPRO[2]

  • dbVista

1.3 Реляционная модель базы данных —Слово «реляционный» происходит от англ. relation (отношение[1]). Для работы с реляционными БД применяют реляционные СУБД.

Эти модели характеризуются простотой структуры данных, удобным для пользователя табличным представлением и возможностью использования формального аппарата алгебры отношений и реляционного исчисления для обработки данных.

Реляционная модель ориентирована на организацию данных в виде двумерных таблиц. Каждая реляционная таблица представляет собой двумерный массив и обладает следующими свойствами:

  • каждый элемент таблицы — один элемент данных

  • все ячейки в столбце таблицы однородные, то есть все элементы в столбце имеют одинаковый тип (числовой, символьный и т. д.)

  • каждый столбец имеет уникальное имя

  • одинаковые строки в таблице отсутствуют

  • порядок следования строк и столбцов может быть произвольным

1.4 Объектная модель данных обладает Объекты, обладающие одинаковыми свойствами, составляют классы (например, курица, пингвин и чайка - объекты класса "птицы"). Обычно класс описывается как новый тип данных, а объекты (экземпляры класса) - определенные на его основе переменных. 1.5 Объектно-ориентированная база данных база данных, в которой данные оформлены в виде моделей объектов, включающих прикладные программы, которые управляются внешними событиями.

Объектно-ориентированные базы данных обычно рекомендованы для тех случаев, когда требуется высокопроизводительная обработка данных, имеющих сложную структуру.

2 Классификация БД по технологии хранения:

  • БД во вторичной памяти (традиционные)

  • БД в оперативной памяти (in-memory databases)

  • БД в третичной памяти (tertiary databases)

3 Классификация БД по содержимому:

Примеры:

  • Географические

  • Исторические

  • Научные

  • Мультимедийные.

4 Классификация БД по степени распределённости:

  • Централизованные (сосредоточенные)

  • Распределённые базы данных (РБД) — совокупность логически взаимосвязанных баз данных, распределённых в компьютерной сети.

Очень большие базы данных

Очень большая база данных (Very Large Database, VLDB) — это база данных, которая занимает чрезвычайно большой объём на устройстве физического хранения. Термин подразумевает максимально возможные объёмы БД, которые определяются последними достижениями в технологиях физического хранения данных и в технологиях программного оперирования данными.

Конкретное определение понятия «чрезвычайно большой объём» меняется во времени; в настоящее время считается, что это объём, измеряемый по меньшей мере терабайтами, а в последнее время — петабайтами.

Примеры:

  • Проект «Архив Интернета» занимается созданием архива в один миллион книг в цифровом формате, он займёт 6 петабайт,[источник не указан 43 дня]

  • 15 петабайт в год — такой объём данных будет обрабатываться в экспериментах над элементарными частицами на ускорителе LargeHadronCollider, запущенном в ЦЕРНе.[1]

  • 1 петабайт равен 1024 Тб, а 1 Тб — 1024 Гб и т. д., следовательно, 1 Пт = 1 073 741 824 Мб, или же 1024 жёстких дисков по 1 Тб каждый.

  • для создания мира Пандоры в фильме «Аватар» понадобилось более петабайта (1024 терабайта) цифрового дискового пространства для хранения всех компьютерно-графических активов фильма (растений и животных, насекомых, скал, гор и облаков и т. д.).[2]

  • Базы данных популярной онлайн-игры World of Warcraft (WoW) занимают 1,3 петабайта на 20000 компьютеров.[источник не указан 43 дня]

  • Популярный Российский торрент-трекер rutracker.org содержит 824 797 раздач размером 1,081 PB[3]