Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Информационные технологии в экономике_4 лекция (Морозова).doc
Скачиваний:
75
Добавлен:
09.06.2015
Размер:
1.01 Mб
Скачать

Накоплен. Бд Корпора-

Данные тивное

ХД Средства

Internet ИАД

Intranet

Исходные данные Преобразование Хранилища

данных

Рис.1. Информационная структура хранилища данных

Цель концепции Хранилищ данных:

  • зафиксировать отличия в характеристиках данных в оперативных и аналитических системах (табл.1);

  • определить требования к данным, помещаемым в целевую БД Хранилища данных;

  • определить общие принципы и этапы ее построения, основные источники данных;

  • предложить рекомендации по решению потенциальных проблем возникающих при выгрузке, очистке, согласовании, транспортировке и загрузке данных в целевую БД.

Таблица 1

Сравнение характеристик данных в информационных системах ориентированных на операционную и аналитическую обработку данных

Характеристика

Операционные

Аналитические

Частота

обновления

Источники данных

Объемы хранимых данных

Возраст данных

Назначение

Высокая частота, маленькими порциями

В основном – внутренние

Сотни мегабайт, гигабайты

Текущие (за период от нескольких месяцев до одного года)

Фиксация, оперативный поиск и преобразование данных

Малая частота, большими порциями

В основном – внешние

Гигабайты и терабайты

Текущие и исторические (за период в несколько лет, десятки лет)

Хранение детализированных и агрегированных исторических данных, аналитическая обработка, прогнозирование и моделирование

Предметом концепции ХД являются сами данные. После того как традиционная система обработки данных реализована и начинает функционировать, она становится таким же самостоятельным объектом, как и любой производственный процесс. В этом смысле данные обладают теми же свойствами и характеристиками, что и любой промышленный продукт: сроком годности, местом складирования (хранения), совместимостью с данными с других производств, рыночной стоимостью, транспортабельностью, компактностью, ремонтопригодностью и т.д. Предметом рассмотрения являются не способы описания и отображения объектов предметной области, а собственно данные, как самостоятельный объект предметной области, порожденной в результате функционирования ранее созданных систем оперативной обработки данных. Для понимания данной концепции необходимо выделить следующие моменты:

  • концепция Хранилищ данных – это концепция подготовки данных для анализа;

  • концепция Хранилищ данных не предопределяет архитектуру целевой СППР. Она указывает на то, какие процессы должны выполняться в системе, но не на то, где конкретно и как эти процессы должны выполняться.

Концепция ХД предполагает реализацию единого интегрированного источника данных.

Аналитические системы предъявляют более высокие требования к аппаратному и программному обеспечению, чем традиционные СОД. Реализация аналитической системы невозможна без разрешения таких вопросов, как:

  • Неоднородность программной среды;

  • Распределенность;

  • Защита данных от НСД;

  • Построение и ведение многоуровневых справочников метаданных;

  • Эффективное хранение и обработка очень больших объемов данных.

Таблица