
- •Перечислите набор общих процедур управления ресурсами.
- •Какова структура программы при использовании файловой системы управления информационными массивами.
- •В чем основное функциональное отличие использования файловой системы управления информационными массивами и технологии баз данных.
- •2. К разделу «База данных как модель предметной области»
- •Дайте определение следующим базовым понятиям: данные, элемент данных, атрибут, объект, предметная область.
- •Сформулируйте определение базы данных, исходя из понятия предметной области.
- •Дайте определения понятиям: проблема, проблемная ситуация, цель, проблемная среда.
- •Дайте общее определение понятию модели. В чем отличительная особенность модели от других видов систем. Перечислите системные свойства модели.
- •Сформулируйте определение базы данных как модели предметной области.
- •Сформулируйте понятие модели данных. Какие составляющие должны быть определены в модели, чтобы ее можно было рассматривать как модель данных.
- •3. К разделу «Понятие о банке данных»
- •Приведите схему общей структуры банка данных.
- •Приведите общую схему коллектива специалистов. Перечислите основные функции аналитиков, системных программистов, прикладных программистов.
- •Приведите схему уровней представления (абстракций) информационной системы.
- •Дайте понятие инфологической модели. В чем отличие инфологической модели от концептуальной.
- •4. К разделу «Вопросы проектирования баз данных»
- •Перечислите и охарактеризуйте основные этапы жизненного цикла информационной системы.
- •Приведите общую схему инфологического проектирования. Дайте понятие по- и пп-информации и поясните смысл их использовании для процесса проектирования.
- •3 Приведите общую схему концептуального проектирования.
- •5. Контрольные вопросы по разделу «Реляционная модель данных»
- •Дайте определение базовым понятиям реляционной модели: домен, кортеж, отношение, схема отношения, схема базы данных.
- •Каковы пользовательские представления понятия схемы отношения и экземпляра отношения.
- •Перечислите свойства отношений.
- •Сформулируйте понятие функциональной зависимости. Определите 1нф, 2нф и 3нф представления реляционной модели.
- •Дайте понятия целостности для сущностей и ссылок. Что такое внешний ключ.
- •В чем отличие в использовании аппарата реляционной алгебры и аппарата реляционного исчисления.
- •Опишите набор традиционных операций над множествами как операций реляционной алгебры.
- •Опишите набор специальных операций реляционной алгебры.
- •Перечислите достоинства и недостатки реляционных систем.
- •6. Контрольные вопросы по разделу «Система управления базой данных»
- •Перечислите основные функции субд.
- •Определите понятие транзакции. Назначение и суть механизма журнализации.
- •Какие основные аспекты сохранения целостности учитываются при функционировании субд.
- •Какие основные аспекты защиты данных должны учитываться при функционировании субд.
- •Сформулируйте понятия логической и физической независимости данных.
- •Приведите обобщенную схему субд.
- •Приведите упрощенную схему функционирования субд.
- •7. Контрольные вопросы по разделу «Основы физического проектирования»
- •Сформулируйте основные понятия физического уровня: хранимая запись, формат хранимой записи, метод доступа, механизм поиска.
- •Сформулируйте основные задачи этапа физического проектирования.(11 вопрос
- •Приведите общую классификацию методов доступа.
- •Опишите способы последовательной организации.
- •Опишите метод доступа – хеширование. В чем состоит проблема синонимов.
- •Опишите метод доступа с полным индексом и индексно-последовательный метод доступа. Сравните эти методы. В чем достоинства и недостатки каждого из них.
- •В чем суть инвертирования.
- •Что такое в-дерево.
- •Опишите механизмы использования битовых шкал.
- •В чем суть бесфайловой организации внешней памяти. Опишите общую структуру страницы.
- •Выделяют четыре типа страниц:
- •Вопросы управления внешней памятью при бесфайловой организации внешней памяти.
- •2.Опишите языковую компоненту субд.
- •8. Контрольные вопросы по разделу «Особенности объектно-ориентированных субд»
- •Перечислите побудительные мотивы к началу исследований по созданию оосубд.
- •Каковы особенности объектной модели данных.
- •Каковы достоинства и недостатки оосубд.
- •Поддержка сложных объектов,
- •Поддержка динамических изменений определений классов,
- •Полная интеграция с объектно-ориентированными системами программирования.
- •В чем основные отличия оосубд от орсубд.
- •Отображение классов на таблицы. Способы реализации наследования в орсубд.
- •9. Контрольные вопросы по разделу «Вопросы распределенных баз данных»
- •Перечислите основные стратегии распределения данных, их достоинства и недостатки.
- •Перечислите проблемы распределенных баз данных.
- •Перечислите свойства транзакций. Варианты завершения транзакции.
- •Сформулируйте понятие расписания. Приведите примеры рассогласования.
- •Управление блокированием. Перечислите основные методы синхронизации распределенных
В чем суть инвертирования.
Инвертированный файл – это файл, для которого поддерживается плотный вторичный
индекс по значениям некоторого поля содержащихся в нем записей. Инвертированный файл
состоит из многоуровневого индекса и набора списков указателей доступа, обеспечивающих
доступ к записям данных.
Список указателей доступа представляет собой физически последовательный список указателей на записи, содержащие идентичные значения соответствующего атрибута.
В наиболее распространенном варианте используется двухуровневый индекс. Схема организации инвертированного файла представлена на рис.31.
Частично инвертированный файл инвертируется по выборочному количеству неключевых атрибутов.
Полностью инвертированный файл инвертируется по каждому неключевому атрибуту, то есть это файл, для которого поддерживается плотный вторичный индекс по значениям каждого поля содержащихся в нем записей, не являющегося первичным ключем.
Что такое в-дерево.
Это дерево, каждый родительский блок которого связан с одинаковым количеством подчиненных блоков, количество которых равно количеству индексных записей, размещенных в родительском блоке. Число шагов при этом для поиска любой записи основного файла одинаково и равно количеству уровней в дереве.
Такие деревья называют сбалансированными (путь от корня до любого листа одинаков). Использование техники B-деревьев является наиболее популярным подходом к организации индексов в БД. С точки зрения внешнего логического представления, B-дерево - это сбалансированное, сильно ветвистое дерево во внешней памяти. Ветвистость дерева - это свойство каждого узла дерева ссылаться на большое число узлов-потомков. С точки зрения физической организации, B-дерево представляется как мультисписочная структура страниц внешней памяти, то есть каждому узлу дерева соответствует блок внешней памяти. Внутренние и листовые страницы обычно имеют разную структуру.
Поиск в B-дереве - это прохождение от корня к листу в соответствии с заданным значением ключа.
B-деревья универсальны и обеспечивают хорошую скорость доступа как при просмотрах по диапазонам, так и при выборке единичной записи по значению ключа, однако характеризуются относительно большим объемом памяти для хранения и затратами на поддержание в актуальном состоянии, включающими обычно балансировку дерева.
Опишите механизмы использования битовых шкал.
Этот вид индекса определяется на множестве записей, в котором каждому свойству записей ставится в соответствие битовая строка (статья индекса). Количество битов в строке равно общему количеству записей файла, и соответствующий данной записи бит принимает единичное значение тогда и только тогда, когда запись обладает рассматриваемым свойством. Очевидно, что при этом записи файла СУБД пронумеровываются, так что соответствие между битами строки и записями устанавливается по этим внутрисистемным номерам. Свойство может иметь различный смысл, например, может означать, что некоторый атрибут записи имеет данное значение. Пример 1. Пусть основной файл содержит следующие записи:
01 |
S01 |
Иванов |
Томск |
02 |
S02 |
Петров |
Томск |
03 |
S03 |
Сидоров |
Кемерово |
04 |
S04 |
Кузнецов |
Барнаул |
05 |
S05 |
Петров |
Омск |
Свойство |
Статья (битовая строка) |
Фамилия_поставщика = “Петров” |
0 1 0 0 1 |
Город = ”Томск” |
1 1 0 0 0 |
Организация индекса имеет два важных достоинства:
Если индексирование осуществляется по некоторому ключу и мощность множества значений этого ключа невелика, для хранения битового индекса требуется сравнительно небольшой объем памяти, а в некоторых случаях он может полностью помещаться в оперативную память. Это обстоятельство обеспечивает дополнительное существенное повышение производительности операций доступа к данным за счет уменьшения количества операций ввода-вывода, связанных с обращением к индексу.
Битовое представление индекса позволяет с высокой эффективностью выполнять операции выборки (селекции) записей по сложным логическим критериям, содержащим логические связки AND, OR и NOT, с помощью поразрядных логических операций над битовыми строками.
Возможны различные другие схемы организации битовых индексов. Например, можно статьи индекса ставить в соответствие не свойствам записей, а самим записям. При этом статья индекса будет содержать уникальный идентификатор записи (не обязательно соответствующий первичному ключу) и битовую строку, позиции которой будут соответствовать значениям различных свойств.
Пример 2. По этой схеме сформируем битовые строки для записей файла из Примера 1, соответствующие следующим свойствам:
Свойство 1. Фамилия_поставщика = “Петров”
Свойство 2. Город = “Томск”
Состав индекса:
Номер статьи |
Значение уникального идентификатора |
Битовая строка |
01 |
S01 |
0 1 |
02 |
S02 |
1 1 |
03 |
S03 |
0 0 |
04 |
S04 |
0 0 |
05 |
S05 |
1 0 |
Очевидно, что такая организация битовых шкал освобождает СУБД от необходимости перенумеровывать записи файла.
Решения, принимаемые на этапах физического проектирования и настройки, чаще всего представляют собой компромисс между достижением требуемых характеристик, которые часто противоречат друг другу. За выигрыш в скорости обработки запросов, которую дает индекс, приходится платить дополнительными ресурсами памяти на его размещение и процессорным временем для его поддержки в актуальном состоянии.