
- •Перечислите набор общих процедур управления ресурсами.
- •Какова структура программы при использовании файловой системы управления информационными массивами.
- •В чем основное функциональное отличие использования файловой системы управления информационными массивами и технологии баз данных.
- •2. К разделу «База данных как модель предметной области»
- •Дайте определение следующим базовым понятиям: данные, элемент данных, атрибут, объект, предметная область.
- •Сформулируйте определение базы данных, исходя из понятия предметной области.
- •Дайте определения понятиям: проблема, проблемная ситуация, цель, проблемная среда.
- •Дайте общее определение понятию модели. В чем отличительная особенность модели от других видов систем. Перечислите системные свойства модели.
- •Сформулируйте определение базы данных как модели предметной области.
- •Сформулируйте понятие модели данных. Какие составляющие должны быть определены в модели, чтобы ее можно было рассматривать как модель данных.
- •3. К разделу «Понятие о банке данных»
- •Приведите схему общей структуры банка данных.
- •Приведите общую схему коллектива специалистов. Перечислите основные функции аналитиков, системных программистов, прикладных программистов.
- •Приведите схему уровней представления (абстракций) информационной системы.
- •Дайте понятие инфологической модели. В чем отличие инфологической модели от концептуальной.
- •4. К разделу «Вопросы проектирования баз данных»
- •Перечислите и охарактеризуйте основные этапы жизненного цикла информационной системы.
- •Приведите общую схему инфологического проектирования. Дайте понятие по- и пп-информации и поясните смысл их использовании для процесса проектирования.
- •3 Приведите общую схему концептуального проектирования.
- •5. Контрольные вопросы по разделу «Реляционная модель данных»
- •Дайте определение базовым понятиям реляционной модели: домен, кортеж, отношение, схема отношения, схема базы данных.
- •Каковы пользовательские представления понятия схемы отношения и экземпляра отношения.
- •Перечислите свойства отношений.
- •Сформулируйте понятие функциональной зависимости. Определите 1нф, 2нф и 3нф представления реляционной модели.
- •Дайте понятия целостности для сущностей и ссылок. Что такое внешний ключ.
- •В чем отличие в использовании аппарата реляционной алгебры и аппарата реляционного исчисления.
- •Опишите набор традиционных операций над множествами как операций реляционной алгебры.
- •Опишите набор специальных операций реляционной алгебры.
- •Перечислите достоинства и недостатки реляционных систем.
- •6. Контрольные вопросы по разделу «Система управления базой данных»
- •Перечислите основные функции субд.
- •Определите понятие транзакции. Назначение и суть механизма журнализации.
- •Какие основные аспекты сохранения целостности учитываются при функционировании субд.
- •Какие основные аспекты защиты данных должны учитываться при функционировании субд.
- •Сформулируйте понятия логической и физической независимости данных.
- •Приведите обобщенную схему субд.
- •Приведите упрощенную схему функционирования субд.
- •7. Контрольные вопросы по разделу «Основы физического проектирования»
- •Сформулируйте основные понятия физического уровня: хранимая запись, формат хранимой записи, метод доступа, механизм поиска.
- •Сформулируйте основные задачи этапа физического проектирования.(11 вопрос
- •Приведите общую классификацию методов доступа.
- •Опишите способы последовательной организации.
- •Опишите метод доступа – хеширование. В чем состоит проблема синонимов.
- •Опишите метод доступа с полным индексом и индексно-последовательный метод доступа. Сравните эти методы. В чем достоинства и недостатки каждого из них.
- •В чем суть инвертирования.
- •Что такое в-дерево.
- •Опишите механизмы использования битовых шкал.
- •В чем суть бесфайловой организации внешней памяти. Опишите общую структуру страницы.
- •Выделяют четыре типа страниц:
- •Вопросы управления внешней памятью при бесфайловой организации внешней памяти.
- •2.Опишите языковую компоненту субд.
- •8. Контрольные вопросы по разделу «Особенности объектно-ориентированных субд»
- •Перечислите побудительные мотивы к началу исследований по созданию оосубд.
- •Каковы особенности объектной модели данных.
- •Каковы достоинства и недостатки оосубд.
- •Поддержка сложных объектов,
- •Поддержка динамических изменений определений классов,
- •Полная интеграция с объектно-ориентированными системами программирования.
- •В чем основные отличия оосубд от орсубд.
- •Отображение классов на таблицы. Способы реализации наследования в орсубд.
- •9. Контрольные вопросы по разделу «Вопросы распределенных баз данных»
- •Перечислите основные стратегии распределения данных, их достоинства и недостатки.
- •Перечислите проблемы распределенных баз данных.
- •Перечислите свойства транзакций. Варианты завершения транзакции.
- •Сформулируйте понятие расписания. Приведите примеры рассогласования.
- •Управление блокированием. Перечислите основные методы синхронизации распределенных
Опишите метод доступа – хеширование. В чем состоит проблема синонимов.
Общей идеей методов хэширования является применение к значению ключа некоторой
функции свертки (Хэш-функции), вырабатывающей значение меньшего размера. Свертка
значения ключа затем используется для доступа к записи. В самом простом случае свертка
ключа используется как адрес в таблице, содержащей ключи и записи.
В реальности записи файла разделяются между участками, каждый из которых
содержит один или несколько блоков памяти. В этом случае хеширование обеспечивает
прямую адресацию записи путем преобразования значения первичного ключа в абсолютный
или относительный адрес участка.
Пусть v есть значение ключа записи и h – Хеш-функция. Тогда h (v) - адрес участка, в котором должна находиться искомая запись (в том случае, если она присутствует вообще). Общая схема организации хешированного файла представлена на рис.26.
Проблема синонимов
при реализации Хеш-функции отношения 1:1 между значениями ключей и номерами участков размер справочника участков становиться неприемлемо большим, а величина самих участков неприемлемо малой=>к нерациональному расходу памяти.
Реальным выходом из этой ситуации является принятие соглашения, при котором в общем случае Хеш-функции осуществляет отображение типа 1:M; однако в этом случае фиксируется эффект возникновения синонимов, когда записи с различными значениями ключей направляются для хранения в один участок, что приводит, в конечном счете, к различной степени загруженности участков.
И, если при использовании связанной последовательной организации блоков внутри участков (именно такая организация представлена на рис.26.) наличие синонимов приводит, в основном, только к различию во времени поиска в пределах отдельных участков, то при использовании физически последовательной организации могут возникнуть дополнительные проблемы, связанные с необходимостью введения области переполнения (рис.27.).
Очевидно, что возникновение слишком большого количества цепочек переполнения ведет к потере главное преимущества хэширования - доступа к записи практически всегда за одно обращение. Переход на использование новой хэш-функции (со значением свертки большего размера) требует перестройки всех участков основного файла, что в случае баз данных являются абсолютно неприемлемым. Поэтому обычно вводят промежуточные таблицы-справочники, содержащие значения ключей и адреса записей, а сами записи хранятся отдельно. Тогда при переполнении справочника требуется только его переделка, что вызывает меньше накладных расходов.
Замечание. Конечно, структура самой области переполнения может быть связанной последовательной или физически последовательной.
Опишите метод доступа с полным индексом и индексно-последовательный метод доступа. Сравните эти методы. В чем достоинства и недостатки каждого из них.
Метод доступа с полным (плотным) индексом (или индексно-произвольный метод)
представляет собой такую организацию файла, при которой для каждого экземпляра записи в
файле предусмотрен соответствующий элемент индекса (рис. 28.). Этот элемент включает
значение ключа записи и указатель на блок, содержащий искомую запись. Обычно для
ускорения поиска в индексе его элементы упорядочиваются.
Достоинством данного метода доступа является произвольное расположение записей
данных в основном файле, что обеспечивает их физическую независимость при хранении.
Основной недостаток проявляется в тех случаях, когда:
1. Выдается оператор выборки всех или большинства записей, и при этом требуется
упорядочивание полученных данных.
2. Сложность процесса обновления основного файла, особенно при добавлении в него
новых записей (требуется перестройка индекса).
Доступ с неплотным индексом (индексно-последовательный метод доступа) строится на
основе физически упорядоченного по возрастанию значения ключей последовательного файла
и совокупности пронумерованных индексных элементов (индексе), каждый из которых
содержит ключ подобно записям основного файла; элементы в индексе упорядочиваются по
возрастанию значений ключей. Значение ключа в индексном элементе представляет
наибольший (или наименьший) из значений ключей записей, входящих в блок основного
файла с номером, совпадающим с номером индексного элемента.
Алгоритм поиска при данной организации файла очевиден и включает два этапа:
Поиск в индексе элемента, указывающего на блок, в котором должна находиться искомая запись, используя максимальное (или минимальное) значение ключей записей, размещенных в блоках основного файла.
Последовательный просмотр записей найденного блока.
Таким образом, к записям индексно-последовательного файла с помощью индекса осуществляется прямой доступ к блоку (странице), включающему требуемую запись, и последовательный доступ в соответствии с упорядоченностью записей по этому ключу индексирования.
Использование индексно-последовательной организации наиболее эффективно, когда модификация исходного файла не предполагает его расширения. В противном случае, как праавило, необходимо введение области переполнения, существование которой принципиально ломает простоту алгоритм поиска, присущую индексно-последоватльному методу доступа
Сравнение метода полного индекса с индексно-последовательной организацией
В методе полного индекса не предусмотрена обработка переполнения; вместо этого всякий раз при включении новой записи в основной файл выполняется переупорядочивание индекса.
При отсутствии переполнения поиск всех записей в обоих методах имеют одинаковую производительность.
В обоих методах достаточно эффективно выполняется операция поиска записей с уникальными ключами.
Вследствие физически последовательного размещения записей операции типа ПОЛУЧИТЬ СЛЕДУЮЩУЮ и ПОЛУЧИТЬ ПРЕДЫДУЩУЮ выполняются гораздо эффективнее в методе неплотного индекса.
Добавление, а так же изменение значений первичных ключей в основном файле в обоих методах трудоемко, поскольку, как правило, влечет обновление индекса.