Вопросы
Данные;
Информация;
База данных (БД);
Банк данных (БнД);
Система баз данных;
Система управления базами данных (СУБД);
Хранилище данных.
Классификация БД
Файл-серверные БД
Клиент-серверные БД
Классификация моделей БД
Этапы проектирования БД
Пути оптимизации работы с БД
NoSql базы данных
NewSql базы данных
Различие NoSql и NewSql баз данных
Характеристики NoSql баз данных
Уровни изолированности
Уровень изолированности Read uncommitted (чтение незафиксированных данных);
Уровень изолированности Read committed (чтение фиксированных данных);
Уровень изолированности Repeatable read (повторяемость чтения);
Уровень изолированности Serializable (упорядочиваемость).
Проблемы параллельного доступа с использованием транзакций
Проблема потерянного обновления
Проблема «грязного» чтения
Проблема неповторяющегося чтения
Проблема фантомного чтения
Виды согласованности состояния данных
Согласованность в «конечном счёте».
Согласованность «Монотонные чтения».
Согласованность «Чтение своих записей».
Согласованность «Мгновенная согласованность».
Теорема CAP
Nosql типа Хранилище семейств колонок
ACID свойства.
Две модели Семейства столбцов
Nosql типа Хранилище пар "ключ — значение"
Nosql типа Хранилища на основе графов
Решения в области хранения и обработки данных NewSql
Обзор VoltDB
Обзор MemSQL
Обзор FoundationDB
Принцип векторизации данные
Способы ускорения доступа в векторных БД
Векторные БД, назначение, описание принципа работы
Денормализация и нормализация. Назначение.
Три подхода денормализации данных:
Подход к денормализации «Дублирование».
Подход к денормализации «Предварительная подготовка».
Подход к денормализации «Вертикальные таблицы».
Столбцовые (колоночные) реляционные модели
Общие понятия о фрагментации и репликации
Виды репликации: Master-Slave и Master-Master.
Асинхронность репликации. Синхронный режим репликации. "Ручная" репликация.
Виды шардинга.
Организация словарей при шардинге
Организация выборки свежих записей при шардинге
Организация сортировки и фильтрации при шардинге
Шардинг. Перебалансировка.
Структуры хранения в базе данных. Тип данных, мно́жество, абстра́ктный тип да́нных, список, стек, очередь, ассоциативный массив, очередь с приоритетом.
Формы хранения данных: неупорядоченное хранение, упорядоченное хранение, структурированные файлы, кучи, хеш-корзины, B+-деревья.
Индексы в базах данных. Две базовые функции индексов.
Два типа индекса.
Кластерный индекс
Некластерный индекс.
Некластерный индекс поверх кластерного
Доступ к записям при наличии или отсутствии индексов.
Статистика и выбор индексов.
B, B+, B* деревья. Удаление и добавление элементов
Модель стоимости. Стратегия поиска. Пространство поиска.
Путь обработки запроса в реляционной СУБД.
Путь обработки запроса в распределенной реляционной СУБД.
Логическая оптимизация запросов.
Классы логических преобразований.
Семантическая оптимизация запросов.
План выполнения запроса.
Алгоритм «Вложенные циклы» и его особенности
Алгоритм «Слияние» и его особенности
Дерево разбора запроса
Профилирование запроса
Нагрузочное тестирование запросов
OLAP и OLTP
ETL-системы
OLTP-системы. Их характеристика, свойства, достоинства и недостатки.
OLAP-системы. Их характеристика, свойства, достоинства и недостатки.
Способы извлечения данных в ETL-системах
Очистка данных в ETL-системах
Действия при неполной загрузке данных в ETL-системах
Обработка запроса в параллельной СУБД.
Формы параллелизма.
Межтранзакционный параллелизм.
Внутритранзакционный параллелизм.
Внутризапросный (внутриоператорный) параллелизм.
Вертикальный (конвейерный) параллелизм.
