
Выбор субд
Процесс, концептуального, логическоро проектирования включает в себя не только разработку концептуальной схемы проектируемой БД, но так же выбор конкретной СУБД, отображение концептуальной схемы средствами СУБД и описание языка запросов.
Одним из основных критериев выбора СУБД является удобство и эффективность отображения разработанной концептуальной схемы средствами конкретной СУБД.
Различают 2 подхода к оценке СУБД.
Основанный на представлении пользователя о конечном виде продукта (системы)
Основанный на производительности системы.
Обычно рассматривают 7 групп характеристик СУБД:
Общие характеристики (тип ПК, максимальное число записей в файле, максимальное число символов на запись, максимальное число индексов на файл, максимальное число таблиц, максимальное число файлов и т.д. возможность прямого доступа, использование полей переменной длины, многозначных полей, наличие русификации).
Управление файлами и поиск (тип связи, возможность модификации нескольких файлов, реализация двунаправленного соединения, тип поиска и реализуемая модель данных)
Средство поддержки приложений (каталог данных, генератор приложений, процедурный язык, отладчик, программные макросы и т.д.)
Ввод и поддержание целостности (управление с помощью команд, меню, проверка целостности по таблице, по уникальности ключа, даты, независимость данных)
Отчеты (по нескольким файлам, сохранение форматов отчета, выдача отчета на экран, вычисляемые поля, группы, генераторы отчетов)
Операционная среда (тип ОС, под которой работает СУБД, объем требуемой ОЗУ, необходимость использования постоянной памяти, язык системы).
Дополнительные сведения. Наличие сетевого варианта, стоимость, совместимость с другими СУБД.
Методы вычисления адреса по значению ключа
Методы в которых адресная функция реализует взаимноодназначное соответствие адресов и ключей.
Методы перемешивания, в которых адресная функция реализует только одно значение преобразования ключа в адрес. Обратное преобразование, обычно, не имеет места.
Методы перемешивания. Методы хеширования. Так же это методы рассеянной памяти. Методы рандомизации. Основная идея метода – каждый экземпляр хранимой записи размещается в памяти по адресу, вычисляемому с помощью некоторой хеш-функции, на основе первичного ключа.
Что бы первоначально запомнить экземпляр записи вычисляется адрес хранения и затем помещается экземпляр записи. При поиске записи снова выполняются те же вычисления, и запись считывается.
Недостатки
Полученная с помощью хеширования последовательность расположения экземпляров хранимых записей, обычно, не совпадают с последовательностью определяемой первичным ключом. Фактически, хранимый файл с хеш-адресацией рассматривается как неупорядоченный.
Возможность коллизий. То есть таких ситуаций, когда для двух разных записей с разными значениями ключа вычисляется один и тот же адрес.
Структура данных и представления этой структуры в памяти 2 важных, но различных понятия.