
- •Хранение информации
- •Системы оперативной обработки информации
- •Обобщенная структура системы oltp
- •Системы поддержки принятия решений
- •Хранилища данных
- •Обобщенная концептуальная схема хд детализированные и агрегированные данные
- •Метаданные
- •Управление жизненным циклом информации
- •Фиксированный контент
- •Извлечение данных (etl)
- •Обобщенная структура процесса etl Архитектуры хранилищ данных
- •Шесть уровней архитектуры хранилища данных
- •Консолидация с использованием витрин данных
- •Реляционные хранилища данных
- •Многомерные хранилища данных
- •Гибридные хранилища данных
- •Гибридное хд
- •Анализ данных введение в olap
- •Эволюция понимания места olap в архитектуре
- •Принцип организации многомерного куба
- •Измерения и факты в многомерном кубе
- •Сечения гиперкуба
- •Двумерный срез куба для одного факта
- •Двумерный срез куба для нескольких фактов
- •Двумерный срез куба с несколькими измерениями на одной оси
Какую работу нужно написать?
Системы поддержки принятия решений
Понимание преимуществ, которые способен дать интеллектуальный анализ, привело к появлению нового класса систем — информационных систем поддержки принятия решений (информационных СППР), ориентированных на аналитическую обработку данных с целью получения знаний, необходимых для разработки решений в области управления. Дополнительным стимулом стало снижение стоимости высокопроизводительных компьютеров и расходов на хранение больших объемов информации.
Обобщенная структурная схема информационной СППР
В основе работы с СППР лежат запросы, с которыми к ней обращается пользователь. При этом запросы, допустимые в традиционных OLTP- системах, очень примитивны. Например, для банка это может быть запрос типа «Сколько денег на счету клиента?» или «Сколько денег клиент потратил за последний месяц?». Очевидно, что ценность информации, полученной с помощью подобного запроса, невелика. В то же время аналитическая система может ответить на гораздо более сложные запросы, например: «Определить среднее время между выставлением и оплатой счета для каждой категории клиентов».
Можно выделить ряд принципиальных отличий СППР и OLTP-систем.
Как видно из табл. 1, требования к СППР и OLTP-системам существенно отличаются. Поэтому в СППР используются специализированные базы данных, которые называются хранилищами данных (ХД). Хранилища данных ориентированы на аналитическую обработку и удовлетворяют требованиям, предъявляемым к системам поддержки принятия решений.
Таблица 1. Сравнение СППР и OLTP-систем
Свойство |
OLTP-система |
СППР |
Цели использования данных |
Быстрый поиск, простейшие алгоритмы обработки Обработка текущих хозяйственных операций, хранение оперативных данных |
Аналитическая обработка с целью поиска скрытых закономерностей, построения прогнозов и моделей и т.д. Многомерный анализ, моделирование |
Уровень обобщения (детализации) данных |
Детализированные |
Как детализированные, так и обобщенные (агрегированные) |
Требования к качеству данных |
Возможны некорректные данные (ошибки регистрации, ввода и т.д.) |
Ошибки в данных не допускаются, поскольку могут привести к некорректной работе аналитических алгоритмов |
Формат хранения данных |
Данные могут храниться в различных форматах в зависимости от приложения, в котором они были созданы |
Данные хранятся и обрабатываются в едином формате |
Время хранения данных |
Как правило, не более года (в пределах отчетного периода) |
Годы, десятилетия |
Изменение данных |
Данные могут добавляться, изменяться и удаляться |
Допускается только пополнение; ранее добавленные данные изменяться не должны, что позволяет обеспечить их хронологию |
Периодичность обновления |
Часто, но в небольших объемах |
Редко, но в больших объемах |
Доступ к данным |
Должен быть обеспечен доступ ко всем текущим (оперативным) данным |
Должен быть обеспечен доступ к историческим (то есть накопленным за достаточно длительный период времени) данным с соблюдением их хронологии |
Характер выполняемых запросов |
Стандартные, настроенные заранее |
Нерегламентированные, формируемые аналитиком «на лету» в зависимости от требуемого анализа |
Время выполнения запроса |
Несколько секунд |
До нескольких минут |
Типы запросов |
Предсказуемые (регламентированные) |
Произвольные |
Типы вопросов |
Сколько? Как? Когда? |
Почему? Что будет, если? |
Время отклика |
Не регламентируется |
Секунды |
Типичные операции |
Регламентированный отчет, диаграмма |
Последовательность интерактивных отчетов, диаграмм, экранных форм; динамическое изменение уровней агрегации и срезов данных |