- •Введение
- •1. Системы поддержки принятия решений
- •1.1. Задачи систем поддержки принятия решений
- •1.2 OLTP-системы
- •1.3 Неэффективность использования OLTP-систем для анализа данных
- •2 Хранилище данных
- •2.1 Концепция хранилища данных
- •2.2 Организация хранилища данных
- •2.3 Метаданные в хранилищах данных
- •2.3.1. Функции метаданных в хранилище данных
- •2.3.2 Состав метаданных в хранилище данных
- •2.3.3 Стандарты метаданных
- •2.4 Очистка данных
- •2.5 Концепция хранилища данных и анализ
- •3. Архитектура хранилищ данных
- •3.1 Факторы, определяющие архитектуру ХД
- •3.2 Основные типы программно-аппаратной архитектуры хранилища данных
- •3.3 Организация работ по созданию хранилища данных
- •3.4 Характеристика решений ведущих производителей
- •3.5 Типовые программно-аппаратные решения реализации ХД
- •3.5 Области применения технологии хранилищ данных
- •4 Основные бизнес-функции процесса разработки и проектирования хранилища данных.
- •4.1 Задачи процесса проектирования хранилища данных
- •4.2 Модель жизненного цикла хранилища данных
- •4.2.1 Планирование
- •4.2.2 Разработка требований.
- •4.2.3 Анализ
- •4.2.4 Проектирование
- •4.2.5 Построение хранилища данных
- •4.2.6 Внедрение
- •4.2.7 Поддержка
- •5.1. Многомерная модель данных
- •5.2 Двенадцать правил Кодда
- •5.3 Дополнительные правила Кодда
- •5.4 Тест FASMI
- •5.5. Архитектура OLAP-систем
- •6. Интеллектуальный анализ данных
- •6.1. Добыча данных — Data Mining
- •6.2. Задачи Data Mining
- •6.3. Практическое применение Data Mining
- •6.4. Модели Data Mining
- •6.5. Методы Data Mining
- •6.6. Процесс обнаружения знаний
- •Заключение
- •Глоссарий
59
системы анализа. От вида анализа также зависит и непосредственная реализация структур хранения данных в ХД.
2.5 Концепция хранилища данных и анализ
Концепция ХД не является законченным архитектурным решением СППР и тем более не является готовым программным продуктом. Цель концепции ХД
— определить требования к данным, помещаемым в ХД, общие принципы и этапы построения ХД, основные источники данных, дать рекомендации по решению потенциальных проблем, возникающих при выгрузке, очистке, согласовании, транспортировке и загрузке данных.
Необходимо понимать, что концепция ХД:
•это не концепция анализа данных, скорее, это концепция подготовки данных для анализа;
•не предопределяет архитектуру целевой аналитической системы.
Концепция ХД указывает на то, какие процессы должны выполняться в системе, но не где конкретно и как они будут выполняться.
Таким образом, концепция ХД определяет лишь самые общие принципы построения аналитической системы и в первую очередь сконцентрирована на свойствах и требованиях к данным, но не на способах организации и представления данных в целевой БД и режимах их использования. Концепция ХД описывает построение аналитической системы, но не определяет характер ее использования. Она не решает ни одну из следующих проблем:
выбор наиболее эффективного для анализа способа организации данных; организация доступа к данным; использование технологии анализа.
Проблемы использования собранных данных решают подсистемы анализа. Как отмечалось ранее, такие подсистемы используют следующие технологии:
•регламентированные запросы;
•оперативный анализ данных;
60
• интеллектуальный анализ данных.
Если регламентированные запросы успешно применялись еще задолго до появления концепции ХД, то оперативный и интеллектуальный анализы в последнее время все больше связывают с ХД.
Контрольные вопросы
1.Какая идея лежит в основе концепции ХД?
2.Приведите данное Инмоном определение хранилища данных.
3.Приведите основные преимущества виртуального хранилища данных.
4.Охарактеризуйте недостатки физического хранилища данных.
5.В чем заключаются основных проблемах создания классического (физического) ХД?
6.Для чего нужны метаданные пользователям СППР?
7.Что такое «витрина данных»?
8.На какие три основные категории делятся данные в ХД?
9.Охарактеризуйте основные этапы ETL процесса.
10.Опишите основные этапы процесса очистки данных.
