Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
шпоры 2011.doc
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
743.94 Кб
Скачать

16.Системы интеллектуального анализа данных (иад). Многомерные хранилища данных как основа для иад. Отличие хранилищ данных от витрин данных.

ИАД – это: 1.Поиск функциональных и логических закономерностей в накопленной информации; 2.Построение моделей, которые прогнозируют развитие некоторых процессов. ИАД выполняется на основе многомерных хранилищ данных для решения задач: 1)прогнозирования; 2)стратегического планирования; 3)анализа рисков. Сферы применения ИАД Методы ИАД используют коммерческие предприятия, развертывающие проекты на основе их данных. Опыт таких предприятий показывает, что отдача от использования ИАД может достигать 1000%. Например, годовая экономия за счет внедрения ИАД в сети универсамов в Великобритании составила 700 тыс. долл. ИАД может использоваться в: розничной торговле – анализ покупательской корзины, прогноз характера потребностей отдельных категорий покупателей и т. д.; банковском деле – выявление мошенничества с кредитными карточками, прогнозирование изменений клиентуры и т. д.; cтраховании – выявление мошенничества, анализ риска и т. д. Концепция Хранилищ Данных (ХД) Данные в ХД (Data Warehouse) представляют собой пополняемый набор, единый для всего предприятия и позволяющий восстановить картину деятельности предприятия на любой момент времени. Автором концепции является Б. Инмон, который определил следующие характеристики для хранящихся наборов данных: 1)предметно ориентированные; 2)интегрированные; 3)неизменчивые; 4)поддерживающие хронологию; 5)организованные для целей поддержки управления. ХД обеспечивают менеджеров и аналитиков достоверной информацией, необходимой для оперативного анализа и принятия решений. Все данные о бизнес объекте собираются (обычно из множества различных источников), очищаются, согласовываются (согласование определяет достоверность данных), агрегируются и представляются в единой, удобной для их использования в бизнес анализе форме. Исходные (исторические) данные, после того как они были согласованы и внесены в общекорпоративное хранилище, остаются неизменными и используются только в режиме чтения. Без поддержки хронологии (наличия исторических данных) не могут быть решены задачи прогнозирования и анализа тенденций. Основополагающие идеи концепции Хранилищ Данных 1.Интеграция ранее разъединенных детализированных данных (исторические архивы, данные из традиционных СОД, данные из внешних источников) в едином ХД. 2.Разделение наборов данных, используемых для операционной обработки, и наборов данных, используемых для решения задач анализа. 3.Хранение данных в многомерном информационном пространстве (также как в OLAP). а)Концепция ХД – это не концепция анализа данных, это концепция подготовки данных для анализа. Б)В ХД содержатся гигабайты и терабайты информации. Концепция Витрин Данных состоит в следующем: 1.Витрины Данных обычно содержат тематические подмножества заранее агрегированных данных, их проще проектировать и настраивать; 2.аналитики видят и работают только с теми данными, которые им реально нужны; 3.целевая БД Витрины Данных максимально приближена к конечному пользователю. 4.ВД – это множество тематических БД, содержащих информацию, относящуюся к отдельным аспектам деятельности организации. 5.ВД должны были стать реальной альтернативой Информационным Хранилищам (Information Warehouse) фирмы IBM. 6.Концепция Витрин Данных имеет свои недостатки, а именно не обеспечивается целостность и непротиворечивость хранимых данных

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]