Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Лекция 1

.pdf
Скачиваний:
28
Добавлен:
25.02.2015
Размер:
246.56 Кб
Скачать

Лекция №1. Идеология хранилищ данных. Основные понятия

Хранилища данных:

1.Система хранения данных = Аппаратное обеспечение хранилища данных: диски, массивы

2.Application – некий комплекс приложений, которые в той или иной концепции решают вопросы хранения данных.

BI – business intelligence бизнес анализ

Приложения категории бизнес анализа – категория приложений и технологий для сбора, хранения, анализа и публикации таких данных, которые позволят корпоративным пользователям принять лучшее решение.

Как удобно, так и храним.

Анализом данных базы данных не занимаются, хранилища данных занимаются.

Публикация происходит по строгому принципу, который заранее прописан.

Система поддержки принятия решений. Общий принцип архитектуры

 

 

 

 

 

 

 

 

 

 

 

OLTP

 

 

ОИ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

OLTP

 

 

ОИ

 

 

ХД

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

OLTP

 

 

ОИ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Внешние данные

 

 

 

 

 

 

 

 

 

 

 

 

Все системы поддержки принятия решений начинаются с оператора (человек) – данные заносятся в OLTP-системы (online transaction) / подсистема ввода / оперативный источник

– хранилища данных – подсистема анализа – аналитик (человек).

OLTP-система представляет собой накопления первичной информации бизнеса, с которой он сталкивается ежедневно. Однако такие системы хранят только текущую информацию о положении дел: прошла продажа и т.д.

Большинство мелких предприятий живут по принципу оператор – OLTP.

Хранилища данных – система хранения данных. Концепция заключается в том, чтобы разделить данные, которые используются в настоящий момент и данные, которые используются для анализа. Отсюда принципы хранения будут разные. Хранилища данных хранит данные с целью обнаружения закономерностей. Хранение как можно больше данных.

Подсистема анализа:

1.Подсистема информационно-поискового анализа – система, оперирующая статичными запросами, которая возвращает какие-то данные по стандартным шаблонам (самый продаваемый продукт в месяце).

2.Подсистема оперативного анализа OLAP.

3.Data mining – подсистема интеллектуального анализа данных работает не на принципах SQL, а на математических принципах.

Хранилища данных – предметно-ориентированный (то есть хранит информацию,

отражающую различные точки зрения на предметную область), интегрированный (хранение данных в едином формате), редко меняющийся (существующие данные чаще всего не меняются, только добавляются), поддерживающий хронологию (все данные соответствую последовательным интервалам времени, существуют системы, которые поддерживают автоматически, также существуют которые нужно подправлять ручками)

набор данных, организованных для цели и поддержки принятия решений.

Структура системы поддержки принятия решений с физическим (реализован физически, а не абстрактен) хранилищем данных. При переходе информации из оперативного источника хранения в хранилище данных происходит фильтрация информации (дублируемая информация), обогащение атрибутами (записывает информацию об источнике, времени записи, валюта).

Система поддержки принятия решений с виртуальным хранилищем. Все запросы аналитика идут к оперативным источникам хранения, минуя хранилища данных. Плюсы данной системы: дешевизна, отсутствует дублирование данных, аналитик работает только с актуальными данными, требуется меньше места для хранения. Минусы: отсутствие хронологической истории, зависимость от каналов передачи, дополнительная нагрузка на оперативный источник.

Соседние файлы в предмете Хранилища данных