- •Понятие баз данных. Концепция бд. Преимущества банковской организации данных.
- •Системы управления базами данных. Функции субд.
- •3. Категории пользователей бд. Администратор бд.
- •4. Требования к БнД.
- •5. Компоненты БнД.
- •7. Классификация субд и бд.
- •8. Модели представления данных в субд.
- •Постреляционная, многомерная и объектно-ориентированная модели представления данных
- •11. Oltp и olap системы. Хранилище данных и olap. Назначение. Основные характеристики
- •Olap и oltp. Характеристики и основные отличия
- •Правила Кодда для olap систем
- •Основные элементы и операции olap
- •Типы olap. Преимущества и недостатки
- •Моделирование многомерных кубов на реляционной модели данных
- •Уровни моделей бд.
- •Этапы проектирования бд. Взаимосвязь этапов проектирования.
- •19. Реляционная модель данных. Основные понятия и определения. Базовые понятия реляционных баз данных
- •1.1. Тип данных
- •1.2. Домен
- •1.3. Схема отношения, схема базы данных
- •1.4. Кортеж, отношение
- •23. Объекты реляционных баз данных: таблицы, индексы, представления, хранимые процедуры, триггеры и др.
- •25. Понятие функциональной зависимости. Нормализация таблиц. Метод нормальных форм. 1нф, 2нф, 3нф. Основной пример
- •1Нф (Первая Нормальная Форма)
- •Аномалии обновления
- •Аномалии вставки (insert)
- •Аномалии обновления (update)
- •Аномалии удаления (delete)
- •Функциональные зависимости
- •Определение функциональной зависимости
- •Функциональные зависимости отношений и математическое понятие функциональной зависимости
- •2Нф (Вторая Нормальная Форма)
- •Анализ декомпозированных отношений
- •Оставшиеся аномалии вставки (insert)
- •Оставшиеся аномалии обновления (update)
- •Оставшиеся аномалии удаления (delete)
- •3Нф (Третья Нормальная Форма)
- •Алгоритм нормализации (приведение к 3нф)
- •Анализ критериев для нормализованных и ненормализованных моделей данных Сравнение нормализованных и ненормализованных моделей
- •27. Структурированный язык запросов sql. Общая характеристика. Методы использования.
- •28. Состав языка sql. Язык sql
- •Состав языка sql
- •Язык sql
- •4.6.1.Типы данных sql.
- •Язык определения данных (ddl). Ddl: Операторы создания схемы базы данных.
- •Операторы базы данных
- •Создание и удаление таблиц
- •4.6.3.Ddl: Операторы создания индексов.
- •30. Язык манипулирования данными (dml). Dml: Команды модификации данных.
- •Добавить новую запись в таблицу:
- •Модификация записей:
- •Удаление записей
- •4.6.6.Dml: Выборка данных.
- •4.6.7.Dml: Выборка из нескольких таблиц.
- •4.6.8.Dml: Вычисления внутри sеlесt.
- •4.6.9.Dml: Групировка данных.
- •4.6.10.Dml: Сортировка данных.
- •4.6.11.Dml: Операция объединения.
- •4.6.12.Использование представлений.
- •4.6.13.Другие возможности sql.
- •31. Язык управления данными (dcl).
- •4.6.4.Dсl: Операторы управления правами доступа.
- •33. Субд в архитектуре клиент-сервер. Двухзвенная и трехзвенная архитектура. Технология "клиент – сервер"
- •34. Защита информации в бд. Методы и средства защиты. Защита информации в базах данных
11. Oltp и olap системы. Хранилище данных и olap. Назначение. Основные характеристики
Хранилище данных (Data Warehouse) - предметно - ориентированный, интегрированный, привязанный ко времени и неизменяемый набор данных, предназначенный для поддержки принятия решений.
Хранилище данных содержит непротиворечивые консолидированные исторические данные и предоставляет инструментальные средства для их анализа с целью поддержки принятия стратегических решений. Информационные ресурсы хранилища данных формируются на основе фиксируемых на протяжении продолжительного периода времени моментальных снимков баз данных оперативной информационной системы и, возможно, различных внешних источников. В хранилищах данных применяются технологии баз данных, OLAP, глубинного анализа данных, визуализации данных.
Основные характеристики хранилищ данных.
содержит исторические данные;
хранит подробные сведения, а также частично и полностью обобщенные данные;
данные в основном являются статическими;
нерегламентированный, неструктурированный и эвристический способ обработки данных;
средняя и низкая интенсивность обработки транзакций;
непредсказуемый способ использования данных;
предназначено для проведения анализа;
ориентировано на предметные области;
поддержка принятия стратегических решений;
обслуживает относительно малое количество работников руководящего звена.
Термин OLAP (On-Line Analytical Processing) служит для описания модели представления данных и соответственно технологии их обработки в хранилищах данных. В OLAP применяется многомерное представление агрегированных данных для обеспечения быстрого доступа к стратегически важной информации в целях углубленного анализа. Приложения OLAP должны обладать следующими основными свойствами:
многомерное представление данных;
поддержка сложных расчетов;
правильный учет фактора времени.
Преимущества OLAP:
повышение производительности производственного персонала, разработчиков прикладных программ. Своевременный доступ к стратегической информации.
предоставление пользователям достаточных возможностей для внесения собственных изменений в схему.
приложения OLAP опираются на хранилища данных и системы OLTP, получая от них актуальные данные, что дает сохранение контроля целостности корпоративных данных.
уменьшение нагрузки на системы OLTP и хранилища данных.
Olap и oltp. Характеристики и основные отличия
OLAP |
OLTP |
Хранилище данных должно включать как внутренние корпоративные данные, так и внешние данные |
основным источником информации, поступающей в оперативную БД, является деятельность корпорации, а для проведения анализа данных требуется привлечение внешних источников информации (например, статистических отчетов) |
Объем аналитических БД как минимум на порядок больше объема оперативных. для проведения достоверных анализа и прогнозирования в хранилище данных нужно иметь информацию о деятельности корпорации и состоянии рынка на протяжении нескольких лет |
Для оперативной обработки требуются данные за несколько последних месяцев |
Хранилище данных должно содержать единообразно представленную и согласованную информацию, максимально соответствующую содержанию оперативных БД. Необходима компонента для извлечения и "очистки" информации из разных источников. Во многих крупных корпорациях одновременно существуют несколько оперативных ИС с собственными БД (по историческим причинам). |
Оперативные БД могут содержать семантически эквивалентную информацию, представленную в разных форматах, с разным указанием времени ее поступления, иногда даже противоречивую |
Набор запросов к аналитической базе данных предсказать невозможно. хранилища данных существуют, чтобы отвечать на нерегламентированные запросы аналитиков. Можно рассчитывать только на то, что запросы будут поступать не слишком часто и затрагивать большие объемы информации. Размеры аналитической БД стимулируют использование запросов с агрегатами (сумма, минимальное, максимальное, среднее значение и т.д.) |
Системы обработки данных создаются в расчете на решение конкретных задач. Информация из БД выбирается часто и небольшими порциями. Обычно набор запросов к оперативной БД известен уже при проектировании |
При малой изменчивости аналитических БД (только при загрузке данных) оказываются разумными упорядоченность массивов, более быстрые методы индексации при массовой выборке, хранение заранее агрегированных данных |
Системы обработки данных по своей природе являются сильно изменчивыми, что учитывается в используемых СУБД (нормализованная структура БД, строки хранятся неупорядоченно, B-деревья для индексации, транзакционность) |
Информация аналитических БД настолько критична для корпорации, что требуются большая грануляция защиты (индивидуальные права доступа к определенным строкам и/или столбцам таблицы) |
Для систем обработки данных обычно хватает защиты информации на уровне таблиц |
