- •Основные функции субд:
- •По модели данных:
- •Иерархические (Иерархической базой данных является файловая система, состоящая из корневого каталога, в котором имеется иерархия подкаталогов и файлов).
- •Сетевые (Сетевые базы данных подобны иерархическим, за исключением того, что в них имеются указатели в обоих направлениях, которые соединяют родственную информацию).
- •По степени распределённости
- •Локальные субд (все части локальной субд размещаются на одном компьютере)
- •Распределённые субд (части субд могут размещаться на двух и более компьютерах).
- •Различные представления о данных в базах данных:
- •Ограничения не-Null Ограничение не-null просто говорит, что колонка не должна содержать значение null. Пример синтаксиса:
- •2. Определение структур базы данных (ddl)
- •3. Манипуляция данными (dml)
- •4. Отбор данных (dql)
- •5. Язык управления данными (dcl)
- •6. Команды администрирования данных
- •7. Команды управления транзакциями
- •14.Запись sql-операторов
- •15.Типы данных языка sql, определенные стандартом
- •16.Основные команды языка ddl
- •17.Основные команды языка dml
- •18.Оператор выбора select
- •19.Применение агрегатных функций и вложенных запросов в операторе выбора
- •20. Операторы манипулирования данными
- •21.Физическая организация бд: файлы, записи, блоки.
- •23.Организация файла бд в виде кучи. Эффективность таких файлов.
- •24.Хешированные файлы: бакет, каталог бакетов, дополнительный каталог бакетов, выбор хеш-функции. Операции над хешированными файлами.
- •25.Сравнение эффективности хешированных файлов и файлов, организованных в виде кучи. Причины снижения эффективности хешированных файлов.
- •26.Динамическое хеширование. Операции над динамически хешированными файлами.
- •27.Последовательная организация файлов. Операции добавления и удаления записей в последовательных файлах, блок переполнения.
- •28. Индексированные файлы: инициализация, поиск.
- •29. Индексированные файлы: операции вставки и удаления записей.
- •30.Разреженные и плотные индексы. Индексация по нескольким полям.
- •Составные индексы
- •31.Эффективность операций в индексированных файлах при различной организации поиска.
- •32.B-деревья: принципы построения, операция поиска.
- •33.В-деревья: операции добавления и удаления записей.
- •34.Эффективность организации файлов в виде в-дерева.
- •35.Технология кластеризации бд.
- •36.Технология сжатия информации в бд.
- •37.Основные шаги обработки запросов.
- •Можно транслировать в выражение
- •38.Статистика бд.
- •40.Алгоритмы выполнения селекции с одним условием сравнения: размер селекции, использование первичного индекса, использование вторичного индекса.
- •41.Размер комплексной селекции при конъюнкции и дизъюнкции условий.
- •43.Алгоритм внешней сортировки.
- •44.Размер операции соединения. Алгоритм соединения, основанный на двух вложенных циклах.
- •45.Алгоритмы выполнения соединения: поблочное соединение, усовершенствование алгоритма поблочного соединения, соединение по индексу.
- •46.Алгоритм соединения слиянием.
- •47.Алгоритмы выполнения операций с множествами, проекции, внешнего соединения.
- •48.Два подхода к вычислению выражений при обработке запросов.
- •50.Виды оптимизаторов: итеративный, основанный на стоимостях и эвристический.
- •51.Понятие транзакции. Свойства acid транзакций.
- •52.Аномалии параллельных транзакций: потерянное обновление, зависимость от нефиксированных результатов, несогласованная обработка.
- •53.Понятие плана параллельного выполнения транзакций. Последовательные, непоследовательные и неупорядоченные планы.
- •54.Конфликтное упорядочивание планов и упорядочивание планов по просмотру.
- •55.Блокировки как механизм управления параллельными транзакциями: понятие блокировки, хранение блокировок, виды блокировок.
- •56.Работа транзакций при использовании механизма блокировок. Предотвращение аномалий при использовании блокировок.
- •57.Понятие протокола. Двухфазный протокол.
- •58.Проблема каскадного отката в параллельных транзакциях. Строгий двухфазный протокол.
- •59.Взаимная блокировка параллельных транзакций.
- •60.Использование метода временных отметок для управления параллельными транзакциями.
- •61.Оптимистические технологии управления транзакциями.
- •63.Уровни изоляции параллельных транзакций.
- •64.Восстановление бд: возможные причины отказов, механизм резервного копирования, журнал транзакций, создание контрольных точек.
- •65.Методы восстановления бд: восстановление с резервной копии, метод «redo», метод теневых страниц.
- •66.Улучшенные модели транзакции: проблемы классических моделей транзакций, модель вложенных транзакций, модель хроник.
- •67.Технология raid. Уровни raid.
- •68.Oltp- технологии и хранилища данных. Хранилища данных.
- •Понятие хранилища данных.
- •Проблемы хранилищ данных.
- •Архитектура хранилища данных
- •Проектирование схемы бд для хранилища данных.
- •Olap-технологии.
67.Технология raid. Уровни raid.
Хранить Базу данных, ее журнал и резервные копии нельзя на одном физическом носителе, следовательно, встает вопрос использования нескольких дисков. Использование множества небольших дисков может оказаться эффективнее, чем использование небольшого числа больших дисков.
Системы с большим числом дисков предоставляют возможность повысить скорость чтения и записи, если диски обслуживаются параллельно. Более того, такие системы позволяют повысить надежность хранения информации, так как есть возможность сохранить избыточную информацию на нескольких дисках, то есть повреждение одного диска не приведет к потере информации.
Использование большого числа небольших дисков с целью повышения производительности и надежности систем нашло отражение в технологии RAID (redundant arrays of inexpensive disksизбыточный массив дешевых дисков).
Уровни RAID
Существуют различные схемы использования избыточных массивов. Такие схемы называют уровнями RAID.
Уровень 0. Этот уровень представляет собой простое расщепление данных для размещения их на нескольких физических устройствах. При этом каждая часть данных записывается только один раз, то есть, нет никакого дублирования. Такая организация позволяет повысить эффективность операций ввода/вывода, за счет одновременного обращения сразу к нескольким дискам. Уровень 0 не обеспечивает устойчивости к отказам.
Уровень 1. Этот уровень подразумевает зеркальное отображение дисковых устройств. Зеркальные отображения выполняют полное дублирование данных физического устройства на зеркало. /*Зеркала могут обеспечиваться как системой, наличием специальных винчестеров, поддерживаемых операционной системой, так и самой СУБД. */ В зависимости от реализации зеркальное отображение может увеличить производительность. Это происходит в случае, когда чтение частей данных производится параллельно с обоих устройств, а затем выполняет объединение считанных фрагментов. При этом снижается производительность записи, так одну и ту же информацию необходимо записать дважды. Уровень 1 обеспечивает устойчивость к отказам. Отказ диска вызывает прозрачное для пользователя переключение на зеркальную копию.
Уровень 2. Этот уровень подразумевает контроль ошибок с использованием бита четности. В этом случае для каждого байта данных дополнительно сохраняется бит. Значение его=1, если число единиц в байте – четно и 0, если не четно. Биты четности сохраняют на отдельных от основной информации носителях. Для того чтобы данные можно было восстановить, их сохраняют особым образом: первый бит каждого байта – на первый диск, второй бит - на второй диск и т.д. до 8. Если какой-либо диск выходит из строя его содержимое можно легко восстановить на основании битов четности и содержимого остальных дисков.
Этот уровень эффективнее, чем второй, так как для каждого байта дополнительно хранится один бит, а не целый байт, как для первого уровня.
Уровень 3. По сути аналогичен уровню 2. Этот уровень исходит из того, что данные с дисков читаются по сектору, поэтому необходимо контролировать корректность именно сектора. Основное отличие от уровня 2 состоит в том, что бит четности сохраняется не для байта, а для сектора диска. То есть анализируются первые биты первых секторов всех дисков. Если число единиц в них четное, то первый бит четности =1, иначе 0. Таким образом, для первых секторов всех дисков массива заполняется один сектор дополнительного диска. /*нет никакого специального способа хранения основных данных, т. е. хранятся обычным образом */ Уровень 3 повышает эффективность второго уровня, так как требует только одно дополнительное устройство для хранения битов четности.
Уровень 4. Этот уровень исходит из того, что объемы данных, которые читаются и записываются, могут превышать сектор. В остальном работа осуществляется как при уровне 3. Биты четности также хранятся на одном носителе.
Уровень 5. Этот уровень не предполагает выделение специального устройства для хранения информации восстановления. Каждый диск хранит обычную информацию и дополнительно информацию восстановления других дисков. Например, если в системе 5 дисков, то информация восстановления для n-ых блоков сохранена на диске (n mod 5)+1. То есть на диске (n mod 5)+1 блок n хранит информацию восстановления, а на остальных дисках – обычную информацию.