
- •Перечислите набор общих процедур управления ресурсами.
- •Какова структура программы при использовании файловой системы управления информационными массивами.
- •В чем основное функциональное отличие использования файловой системы управления информационными массивами и технологии баз данных.
- •2. К разделу «База данных как модель предметной области»
- •Дайте определение следующим базовым понятиям: данные, элемент данных, атрибут, объект, предметная область.
- •Сформулируйте определение базы данных, исходя из понятия предметной области.
- •Дайте определения понятиям: проблема, проблемная ситуация, цель, проблемная среда.
- •Дайте общее определение понятию модели. В чем отличительная особенность модели от других видов систем. Перечислите системные свойства модели.
- •Сформулируйте определение базы данных как модели предметной области.
- •Сформулируйте понятие модели данных. Какие составляющие должны быть определены в модели, чтобы ее можно было рассматривать как модель данных.
- •3. К разделу «Понятие о банке данных»
- •Приведите схему общей структуры банка данных.
- •Приведите общую схему коллектива специалистов. Перечислите основные функции аналитиков, системных программистов, прикладных программистов.
- •Приведите схему уровней представления (абстракций) информационной системы.
- •Дайте понятие инфологической модели. В чем отличие инфологической модели от концептуальной.
- •4. К разделу «Вопросы проектирования баз данных»
- •Перечислите и охарактеризуйте основные этапы жизненного цикла информационной системы.
- •Приведите общую схему инфологического проектирования. Дайте понятие по- и пп-информации и поясните смысл их использовании для процесса проектирования.
- •3 Приведите общую схему концептуального проектирования.
- •5. Контрольные вопросы по разделу «Реляционная модель данных»
- •Дайте определение базовым понятиям реляционной модели: домен, кортеж, отношение, схема отношения, схема базы данных.
- •Каковы пользовательские представления понятия схемы отношения и экземпляра отношения.
- •Перечислите свойства отношений.
- •Сформулируйте понятие функциональной зависимости. Определите 1нф, 2нф и 3нф представления реляционной модели.
- •Дайте понятия целостности для сущностей и ссылок. Что такое внешний ключ.
- •В чем отличие в использовании аппарата реляционной алгебры и аппарата реляционного исчисления.
- •Опишите набор традиционных операций над множествами как операций реляционной алгебры.
- •Опишите набор специальных операций реляционной алгебры.
- •Перечислите достоинства и недостатки реляционных систем.
- •6. Контрольные вопросы по разделу «Система управления базой данных»
- •Перечислите основные функции субд.
- •Определите понятие транзакции. Назначение и суть механизма журнализации.
- •Какие основные аспекты сохранения целостности учитываются при функционировании субд.
- •Какие основные аспекты защиты данных должны учитываться при функционировании субд.
- •Сформулируйте понятия логической и физической независимости данных.
- •Приведите обобщенную схему субд.
- •Приведите упрощенную схему функционирования субд.
- •7. Контрольные вопросы по разделу «Основы физического проектирования»
- •Сформулируйте основные понятия физического уровня: хранимая запись, формат хранимой записи, метод доступа, механизм поиска.
- •Сформулируйте основные задачи этапа физического проектирования.(11 вопрос
- •Приведите общую классификацию методов доступа.
- •Опишите способы последовательной организации.
- •Опишите метод доступа – хеширование. В чем состоит проблема синонимов.
- •Опишите метод доступа с полным индексом и индексно-последовательный метод доступа. Сравните эти методы. В чем достоинства и недостатки каждого из них.
- •В чем суть инвертирования.
- •Что такое в-дерево.
- •Опишите механизмы использования битовых шкал.
- •В чем суть бесфайловой организации внешней памяти. Опишите общую структуру страницы.
- •Выделяют четыре типа страниц:
- •Вопросы управления внешней памятью при бесфайловой организации внешней памяти.
- •2.Опишите языковую компоненту субд.
- •8. Контрольные вопросы по разделу «Особенности объектно-ориентированных субд»
- •Перечислите побудительные мотивы к началу исследований по созданию оосубд.
- •Каковы особенности объектной модели данных.
- •Каковы достоинства и недостатки оосубд.
- •Поддержка сложных объектов,
- •Поддержка динамических изменений определений классов,
- •Полная интеграция с объектно-ориентированными системами программирования.
- •В чем основные отличия оосубд от орсубд.
- •Отображение классов на таблицы. Способы реализации наследования в орсубд.
- •9. Контрольные вопросы по разделу «Вопросы распределенных баз данных»
- •Перечислите основные стратегии распределения данных, их достоинства и недостатки.
- •Перечислите проблемы распределенных баз данных.
- •Перечислите свойства транзакций. Варианты завершения транзакции.
- •Сформулируйте понятие расписания. Приведите примеры рассогласования.
- •Управление блокированием. Перечислите основные методы синхронизации распределенных
Вопросы управления внешней памятью при бесфайловой организации внешней памяти.
Выбор размера блока данных (страницы)
Размер блока оказывает большое влияние на производительность базы данных — при больших размерах скорость операций чтения/записи растет (особенно это характерно для полных просмотров таблиц и операций интенсивной загрузки данных), однако возрастают накладные расходы на хранение (база увеличивается) и снижается эффективность индексных просмотров. Меньший размер блока позволяет более экономно расходовать память, но вместе с тем относительно дорог. Длинные блоки (16, 32 или 64 Кбайт) лучше использовать для больших объектов данных: полнотекстовые фрагменты, мультимедиа-объекты, длинные строки и т.п. Короткие блоки (2 или 4 Кбайт) лучше подходят для значений числовых типов, недлинных строк, значений даты и времени. Следует также учитывать размер блока операционной системы (ОС), он должен быть кратен размеру блока базы данных. Малый размер блока лучше подходит для систем оперативной обработки транзакций, потому что, если сервер блокирует данные на уровне блоков, то это позволяет большему числу пользователей работать, не мешая друг другу. В системах поддержки принятия решений, для которых более критичным является не общая пропускная способность (количество транзакций в единицу времени), а среднее время отклика, больший блок предпочтительнее.
Очень важно сразу правильно выбрать размер блока: в работающей базе изменить его практически невозможно (для этого часто проводят ряд испытаний базы данных - прототипа).
Выбор размера экстента
Информация о наличии экстентов для объекта схемы данных находится в специальных управляющих структурах, реализация которых зависит от СУБД. На управление экстентами (выделение пространства, освобождение, слияние) тратятся определенные ресурсы, поэтому для достижения эффективности нужно правильно определять их экстентов.
Фрагментация
Распространенной проблемой для администраторов при управлении физическим хранением является фрагментация различных структур внешней памяти, которая чаще обусловлена операциями удаления. В отличие от преднамеренной фрагментации, такая «фрагментация» обычно ухудшает производительность. Встречается фрагментация на уровне блоков, когда в блоке остается свободное пространство после удаления строк из таблицы, на уровне экстентов, когда заполненные экстенты чередуются с незаполненными, появившимися после операций удаления таблиц, и т.п.
Фрагментацией могут быть обусловлены следующие важные для эксплуатации базы данных проблемы.
Выделение свободного пространства. При вставке строк в таблицу СУБД выдает сообщение о нехватке свободного пространства, хотя на первый взгляд пространства достаточно. Пространство выделяется экстентами и, если в базе данных нет непрерывного свободного блока нужного размера, то выдается это сообщение.
Расход свободного пространства и общее увеличение времени обработки данных. В случае сильной фрагментации обе величины могут вырасти вдвое.
Фрагментация неизбежна и поэтому является нормальным явлением, и не всегда ухудшает характеристики базы данных. Индексы также подвержены проблемам фрагментации.
Параметры проектирования физического уровня
Таким образом, организация хранения объектов данных является одной из самых сложных задач проектирования схемы базы данных, для решения которой привлекаются администраторы баз данных. И, хотя универсальных решений, которые подошли бы для любой СУБД, не существует, так как каждый производитель СУБД создает свой способ хранения и доступа к данных, хранение данных во внешней памяти в известных СУБД организовано очень похожим образом.
Вследствие этого, в литературе определяется совокупность следующих основных параметров, оказывающих влияние на проектирование схемы базы данных, общая для большинства реляционных СУБД:
размер табличных пространств для хранения таблиц;
размер табличных пространств для хранения индексов;
размер табличных пространств для хранения BLOB;
кластеры и их параметры;
размер словаря данных, включая код всех хранимых процедур, функций, триггеров, пакетов;
управляющие файлы;
файлы журнала;
интенсивность потока запросов, модифицирующих данные и индексы;
файлы временных табличных пространств (для хранения временных таблиц, которые строятся, например, при выполнении group by, а также других временных объектов);
интенсивность потока запросов, инициирующих создание временных таблиц;
потоки транзакций read-write, read-only, объем модифицируемых и считываемых ими данных, характеристики параллельной работы транзакций (какие и сколько их);
количество приложений, работающих параллельно с базой данных;
количество соединений с базой данных для каждого приложения;
входные и выходные данные, генерируемые пользовательскими программами.
В процессе проектирования все данные должны быть отражены в журнале проектирования. Однако многие тонкости в вопросах размещения объектов данных и конфигурации сервера баз данных на этапе проектирования не могут быть учтены, так как требуют полномасштабного тестирования.