
- •Понятие хранилища данных
- •Основные составляющие Хранилища данных: Предметная ориентированность
- •Интегрированность (целостность и внутренняя взаимосвязь)
- •Временная привязка
- •Неразрушаемая совокупность данных.
- •Расхождения в требованиях между бд и хд
- •Почему нельзя использовать традиционные бд в процессе принятия решений?
- •Особенности хранилищ данных:
- •Понятие о кубах
- •Вид трехмерного куба
- •Основные понятия многомерной модели данных
- •Виртуальное хранилище данных
- •Концепция Corporate Information Factory, (сокр. Сif) Билла Инмона
- •Концепция Data Warehouse Bus
- •Гибридное хранилище данных
- •Многомерный olap-формат (Multi-dimensional olap - molap)
- •Преимущества и недостатки molap
- •Область применения molap
- •Реляционный olap-формат (Relational olap - rolap)
- •Преимущества rolap :
- •Недостатки rolap
- •Гибридный olap-формат (Hybrid olap - holap)
- •Преимущества и недостатки holap
- •Сравнительные характеристики
- •Основные характеристики olap включают:
- •Управление размерностью
- •Достоинства olap:
- •Недостатки olap:
- •Общий вид mdx-запроса
- •Инструкция select
- •Предложение from
- •Предложение where
- •Предложение with
- •Именованные наборы
- •Вычисляемые члены
- •Примеры запросов
- •Проектирование схемы "звезда"
- •Основные составляющие структуры схемы "звезда"
- •Отличие схем «звезда» и "снежинка"
Основные характеристики olap включают:
1. Многомерность модели данных.
Это считается основной характеристикой OLAP. Частью этого требования считается возможность построения различных проекций и разрезов модели.
2. Интуитивные механизмы манипулирования данными.
Кодд считает, что манипулирование данными должно производиться с помощью действий непосредственно в ячейке таблиц, без применения меню или сложных интерфейсов. Эта характеристика незначительно влияет на качество анализа данных.
3. Доступность.
OLAP это Посредник. Ядро OLAP является программой промежуточного уровня между источниками данных и UI. Большинство продуктов обеспечивают эти функции, но удобство доступа к данным часто оказывается ниже.
4. Пакетное извлечение данных.
Это правило требует, чтобы продукты предлагали как собственные базы для хранения анализируемых данных, так и динамический (live) доступ к внешним данным. Не все OLAP продукты соответствуют этому требованию. Даже те программы, которые предлагают такие функции, редко делают их легкими и достаточно автоматизированными.
5. Архитектура "клиент-сервер".
Серверная компонента OLAP продуктов должна быть достаточно интеллектуальной для того, чтобы разные клиенты могли быть подключены с минимальными усилиями и программированием.
6. Прозрачность.
Этот пункт также сложен, но необходим. Полное соответствие означает, что пользователь, скажем, электронной таблицы может получить полный доступ к средствам, предоставляемым ядром OLAP и может при этом даже не знать о том, откуда получены эти данные. Для того чтобы достичь этого, продукты должны предоставлять динамический доступ к гетерогенным источникам данных и полнофункциональный модуль, встраиваемый в электронную таблицу.
7. Многопользовательская работа.
Для того, чтобы считаться стратегическим OLAP инструментом, приложения должны работать не только на чтение и интерпретацию данных, и, соответственно, они должны обеспечивать одновременный доступ (включая и извлечение, и обновление данных), целостность и безопасность.
8. Обработка ненормализованных данных.
Это означает возможность интеграции между ядром OLAP и ненормализованным источником данных.
9. Хранение OLAP результатов отдельно от исходных данных.
В действительности, это имеет отношение к реализации продукта, а не к его возможностям, но мало кто будет спорить с этим утверждением.
10. Выделение отсутствующих данных.
Это означает, что отсутствующие данные должны отличаться от нулевого значения.
11. Обработка отсутствующих значений.
Все отсутствующие значения должны быть проигнорированы при анализе.
12. Гибкое построение отчетов.
Различные измерения должны выстраиваться любым способом в соответствии с потребностями пользователя. Большинство продуктов соответствует этому требованию в рамках специальных редакторов отчетов. Хотелось бы, чтобы такие же возможности были доступны и в интерактивных средствах просмотра, но это встречается значительно реже.
13. Стабильная производительность при построении отчетов.
Это означает, что производительность системы при построении отчетов не должна существенно зависеть от размерности или величины базы данных.
14. Автоматическое регулирование физического уровня.
OLAP система должна автоматически регулировать физическую структуру для адаптации ее к типу и структуре модели.