Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Базы данных- лекции.docx
Скачиваний:
2
Добавлен:
01.04.2025
Размер:
391.4 Кб
Скачать

Понятие ключа и индекса. Прямая и инвертированная формы индекса. Примеры.

Ключ – значение (элемент данных), используемое для идентификации или определения адреса записи. (логическое определение).

Ключ сцепленный (составной) – несколько элементов данных, которые в совокупности обеспечивают уникальность идентификации каждой записи набора данных. Индекс – физическая реализация ключа, обеспечивающая доступ к записям, соответствующим отдельным значениям ключа.

Логически индекс есть бинарное отношение I(v,a), где v – значение атрибута, а a – список адресов элементов хранения (записей, кортежей, документов), соответствующих данному значению атрибута. Для повышения эффективности поиска отдельных значений и слияния/пересечения списков значения v и адреса элементов в списке a хранятся в упорядоченном виде, что обеспечивает применение процедур быстрого поиска. Индекс I(v,a) часто называют инвертированным индексом. Каждый элемент а инвертированного индекса наз. инвертированным списком.

Прямая реализация индекса представляет собой расширение бинарного отношения до совокупности записей, состоящих из 2-ух полей – значения атрибута и адреса размещения одного элемента хранения. Отдельное значение атрибута повторяется в индексе столько раз, сколько оно встречается в файле данных, а длина индекса (в записях) совпадает с длиной файла данных.

В инвертированной форме:

В случае, когда списки а достаточно длинные, инвертированный индекс хранится в двух разных файлах, связанных указателями. Такая организация требует меньше памяти для хранения значений ключей и поиск в ней более эффективен. Способы реализации указателя пересылок:

- Указанием ссылки на первый и последний адреса размещения элементов для отдельного ключевого значения; - Заданием ссылки на адрес размещения первого элемента и длиной списка адресов. Пример:

Сходство и отличие процессов обработки данных средствами файловой системы и системы управления (су) базы данных (бд).

Приведем основные отличительные особенности обработки данных, характерные для файловых систем и СУБД. Файлы обладают следующими свойствами: • файл, как правило, представляет собой совокупность записей одного типа, доступ к которым определяется типом организации файла и осуществляется только средствами операционной системы;

• файл описывают и используют в прикладной программе, работающей с данными. База данных имеет следующие особенности:

• база данных представляет собой совокупность данных разного типа, причем часто по одним данным получают другие;

• база данных существует независимо от конкретной прикладной программы – база оздается с целью интеграции данных, объединяющей данные многих приложений (но определенного назначения). База данных предназначена для совместного, многофункционального использования многими пользователями один раз введенных данных. Надо отметить, что с точки зрения управления данными СУБД оперирует данными на содержательном уровне, хотя физические структуры, используемые для этих целей, могут совпадать с аналогичными структурами, создаваемыми ОС. Коренное же отличие СУБД от файловых систем ОС состоит в том, что СУБД устанавливает связь между содержанием и адресом, а ОС – между именем и адресом данных. В то же время эта граница постоянно подвергается «атакам» с обеих сторон. Например, ОС-360 с «индексным доступом к данным», IN-PICK, включающая язык поиска записи файлов по содержанию, UNIX, включающая команды коррекции, сортировки или объединения содержимого текстовых файлов, наподобие того, как это осуществляется с таблицами данных в СУБД. Тем не менее, следует признать это скорее исключением, чем правилом и в компетенцию ОС надо относить только связь «имя-адрес», оставляя другие зависимости на ответственность прикладных программ и оболочек СУБД и АИПС автоматизированные информационно-поисковые системы).