
- •1. Понятие базы данных. Основные определения
- •2. История развития представлений о базах данных
- •3.Архитектура типичной субд
- •4.Трехуровневая архитектура anci-sparc
- •5.Модели ранних субд. Иерархические системы
- •6.Модели данных ранних субд. Сетевые системы
- •7.Модели баз данных. Модель «сущность - связь». Объектно – ориентированная и объектно – реляционная модели данных.
- •8.Модели баз данных. Xml – модель данных. Многомерная модель данных.
- •9.Жизненный цикл базы данных.
- •10.Этапы проектирования баз данных.
- •11. Проектирование системы с базой данных.
- •12.Введение в реляционные базы данных. Реляционная модель данных
- •13.Реляционная модель данных. Свойства отношений
- •14.Реляционная модель данных. Виды отношений.
- •15.Реляционная модель данных. Реляционная целостность данных.
- •16.Реляционная алгебра. Основные определения
- •17.Реляционная алгебра. Традиционные операции над множествами
- •18.Реляционная алгебра. Специальные реляционные операции
- •19.Реляционная алгебра. Соединения. Зависимость реляционных операторов.
- •20.Проектирование реляционных баз данных. Аномалии базы данных
- •21.Проектирование реляционных баз данных. Функциональные зависимости
- •22.Проектирование реляционных баз данных. Правила функциональной зависимости
- •23. Проектирование реляционных баз данных. Замыкания и ключи
- •24. Проектирование реляционных баз данных. Нормальные отношения
- •25. Проектирование реляционных баз данных. Алгоритм приведения семантической модели к пятой нормальной форме
- •26.Структуры хранения и методы доступа к данным.
- •27.Индексирование
- •28. Структуры хранения и методы доступа к данным
- •29.Инфологическое моделирование данных. Объекты. Типы объектных множеств
- •30. Инфологическое проектирование. Отношения. Кардинальность. Степень участия
- •31. Инфологическое моделирование данных. Атрибуты. Виды атрибутов. Ключи
- •32. Инфологическое проектирование. Наследование. Составные объекты. Слабые объектные множества
- •33. Инфологическое проектирование. Принципы проектирования. Моделирование ограничений
- •34. Инфологическое моделирование данных. Проектирование транзакций
- •35. Концептуальное моделирование данных. Проектирование транзакций. Принципы проектирования
- •36. Инфологическое моделирование данных. Метод нормальных форм
- •37. Средства автоматизированного проектирования баз данных. Power Designer
- •38 Проектирование баз данных на логическом и физическом уровне
28. Структуры хранения и методы доступа к данным
Индекс – это файл, каждый элемент которого состоит точно из двух значений: значения данных и указателя.
Значением данных является значение некоторого поля индексированного файла, а указатель определяет запись в этом файле, имеющую такое же значение этого же поля. Соответствующее поле индексированного файла называют индексированным полем или ключом индекса.
Фундаментальное преимущество индекса: ускорение поиска. Недостатки: замедляют операции обновления.
Индексы могут использоваться двумя различными способами:1)-последовательный доступ (индекс позволяет упростить выполнение запросов и с применением диапазона значений) 2)-прямой доступ (индекс позволяет также упростить выполнение запросов с применением списка)
Существует также возможность сформировать индекс на основе значений двух или нескольких полей, составляющих единую комбинацию. Индекс на комбинации полей F1,F2,…,Fn может использоваться в качестве таких индексов:1)-на одном поле F1 2)-на комбинации полей F1F2 3)-на комбинации полей F1F2F3
Общее количество индексов, которые требуются для обеспечения полной индексации с помощью указанного способа, не так уж велико, как может показаться на первый взгляд.
Индекс принято называть неплотным – в том случае, если он не содержит по одному элементу для каждой записи индексированного файла. Преимущество неплотного индекса: занимает меньше места по сравнению с соответствующим плотным индексом, т.к. он содержит меньше элементов. Недостаток: нет возможности проводить проверки на наличие данных с применением лишь одного индекса. Любой файл может иметь не больше одного неплотного индекса.
Наиболее широко применяемым и важным типом индекса являются B-деревья. Любое B-дерево представляет собой один из конкретных типов древовидного индекса.
Индекс состоит из двух частей: 1)-последовательный набор представляет собой одноуровневый индекс к фактическим данным 2)-индексный набор, в свою очередь, дает возможность получить быстрый прямой доступ к последовательному набору
Хэширование - обеспечение быстрого прямого доступа к конкретной записи с учетом заданного значения определенного поля. Хэширование отличается от индексации по следующему важному признаку – файл может иметь любое количество индексированных полей, но только одно хэшированное поле. Недостатки: возможность коллизий, по мере увеличения размеров хэшированного файла – увеличивается количество коллизий.
Метод расширяемого хэширования представляет собой изящный вариант основного метода хэширования, позволяющий устранить проблемы хэшировани. В действительности, расширяемое хэширование гарантирует, что количество операций доступа к диску, необходимых для поиска определенной записи, никогда не превышает двух и обчно сводится только к одной операции, независимо от того, какого размера достигает сам файл.
Применение сжатия: 1)-для уменьшения объема памяти, необходимого для хранения определенной коллекции данных 2)-сокращение количества операций ввода-вывода на диске
В основе методов сжатия лежит тот факт, что значения данных почти никогда не бывают полностью случайными и характеризуются определенной степенью предсказуемости
Методы сжатия:1)-дифференциальное 2)-префиксное 3)-суффиксное
-иерархическое сжатие (хранимая иерархическая запись состоит из двух частей: постоянной и переменной.)
-кодирование по Хаффману (основная идея – кодирование отдельных символов битовыми строками различной длины, причем наиболее часто встречающиеся символы кодируются строками наименьшей длины.)