- •Лекция 1 Глава 1 основные понятия баз данных
- •Лекция 2 проблемы обработки информации
- •Методы и средства обработки данных
- •Лекция 3 понятие базы данных
- •Лекция 4 реляционная модель базы данных
- •Лекция 5 инфологическое моделирование данных сущность-связь
- •Модель сущность-связь
- •Сущность
- •Атрибут
- •Лекция 6 связи между сущностями
- •Ключ, первичный ключ, внешний ключ
- •Имя роли
- •Лекция 7-8 реляционный подход
- •Основные понятия
- •Формальное определение
- •Связывание таблиц реляционных баз данных
- •Контроль целостности связей
- •Лекция 9 физическая организация данных в соответствии с реляционным подходом
- •Реляционная модель и модель сущность - связь
- •Языки запросов к реляционнам базам данных
- •Лекция 10-11 принципы организации хранения данных устройства хранения данных
- •Принципы хранения данных на вторичных устройствах
- •Неупорядоченные последовательные файлы
- •Упорядоченные последовательные файлы
- •Хешированные файлы
- •Лекция 12-13 открытая адресация
- •Несвязанная область переполнения
- •Связанная область переполнения
- •Многократное хеширование
- •Динамическое хеширование
- •Лекция 14 индексированные файлы
- •Индексно-последовательный файл
- •Вторичный индекс
- •Многоуровневые индексы
- •Лекция 15 деревья
- •Языки запросов к базе данных
- •Специальные реляционные операции (операции обработки данных)
- •Дополнительные операции
- •Операции изменения тела отношения
- •Правила записи выражений реляционной алгебры
- •Реляционное исчисление
Лекция 14 индексированные файлы
Индекс – это структура данных, связанная с файлом БД, и предназначенная для повышения скорости поиска отдельных записей в файле, в соответствии с чем сокращается время выполнения запросов пользователей на поиск, модификацию и удаление записей.
Индекс аналогичен по своей структуре и назначению предметному указателю, приведенному в конце книги. Как и предметный указатель книги, индекс базы данных упорядочен, и каждый элемент индекса содержит признак искомого объекта (поле индексирования), а также один или несколько указателей на место его расположения. Файл, содержащий логические записи, называется файлом данных, а файл, содержащий индексные записи, — индексным файлом.
В отличие от хеширования: а) индексирование не требует физической упорядоченности записей в файле данных (при индексировании индексный файл «подгоняется» под файл данных, а при хешировании – файл данных под значения хеш - функции); б) индексирование сохраняет требуемую логическую упорядоченность записей в файле данных (становится возможным поиск по интервалам, поиск близких значений, доступ к данным в их логической последовательности).
Применение индексов в целом эффективнее рассмотренных выше способов хранения и обработки данных. Это достигается за счет обработки значительно меньшего объема данных (индексного файла вместо файла данных) в операциях поиска и сортировки, особенно, если используемый индекс целиком помещается в оперативную память. Основной проблемой применения индексов является потеря производительности при их обновлении после операций удаления, вставки или изменения значения индексируемого поля.
Если индексирование организовано по ключу таблицы, то индекс называется первичным (не содержит повторяющихся значений), иначе индекс называется вторичным (может содержать повторяющиеся значения).
Файл данных может иметь один первичный индекс и несколько вторичных индексов.
Индекс может быть разреженным (поле индексирования содержит индексные записи только для некоторых ключевых значений поиска в последовательно упорядоченном файле) или плотным (в индексе содержатся индексные записи для всех значений поиска в упорядоченном или неупорядоченном файле).
Применение индексов в целом эффективнее рассмотренных выше способов хранения и обработки данных. Это достигается за счет обработки значительно меньшего объема данных (индексного файла вместо файла данных) в операциях поиска и сортировки, особенно, если используемый индекс целиком помещается в оперативную память. Основной проблемой применения индексов является потеря производительности при их обновлении после операций удаления, вставки или изменения значения индексируемого поля.
Если индексирование организовано по ключу таблицы, то индекс называется первичным (не содержит повторяющихся значений), иначе индекс называется вторичным (может содержать повторяющиеся значения).
Файл данных может иметь один первичный индекс и несколько вторичных индексов.
Индекс может быть разреженным (поле индексирования содержит индексные записи только для некоторых ключевых значений поиска в последовательно упорядоченном файле) или плотным (в индексе содержатся индексные записи для всех значений поиска в упорядоченном или неупорядоченном файле).
