
#ХД 1 модуль(бакалавры)БИ.
1Лекция
1) Укажите характерные черты хранилища данных.
предметная ориентированность;
интегрированность (целостность и внутренняя взаимосвязь);
временная привязка;
неразрушаемая совокупность данных.
2) Укажите базовые технологии СППР.
Data Mining
Data Warehouse
OLAP
3) Какая технология используется в приложениях OLAP?
Технология оперативной аналитической обработки данных
4) К какому типу относится система учета банковских платежей?
Транзакционные системы
5) Транзакционные системы выполняют:
операционную или транзакционную обработку данных; (ПРОИЗВОДЯТ КУЧУ ДАННЫХ)
К этому классу относятся любые автоматизированные бухгалтерские или банковские системы, которые осуществляют учет и хранение первичной информации по работе предприятия или банка;
6) Какого вида базы данных используют OLTP системы :
нормализованные реляционные структуры баз данных
7) Укажите причины по которым база данных OLTP не пригодна для СППР.
сложная структура таблиц, специфических форматов представления данных
проблема организации эффективного доступа к данным транзакционных систем (их много и они заняты обработкой операций по учету данных).
учетные системы не в состоянии обеспечить представление данных в требуемом для анализа виде и с требуемым уровнем детализации
существующие системы сбора и обработки корпоративных данных в принципе не пригодны для использования в ППР.
данные разнотипны и распределены как внутри организации, так и за её пределами
лицам, принимающим решения (ЛПР) и аналитикам приходится принимать решения не только в условиях неполной, но и зачастую недостоверной и противоречивой информации
к тому же не всегда удается получить требуемую информацию во время и в наглядном виде
OLTP- базы данных содержат много информации, абсолютно не нужной для анализа: (адреса, почтовые индексы, идентификаторы записей и др.). Подобная информация не заносится в хранилище, что ограничивает спектр рассматриваемых данных при принятии решения до минимума.
8) Особенности аналитических запросов
менее регламентированы чем запросы учетных систем
9) Какой охватывают интервал времени данные в оперативных системах:
Небольшой интервал времени
10) Компонент ХД «Менеджер загрузки» выполняет следующие функции:
Все операции, связанные с извлечением и загрузкой данных в хранилище.
Эти операции включают простые преобразования данных, необходимые для их подготовки к вводу в хранилище
11) К пользовательским инструментам доступа к данным относятся:
инструменты создания отчетов и запросов;
инструменты разработки приложений;
инструменты информационной системы руководителя (Executive Information System — EIS);
инструменты оперативной аналитической обработки (OLAPинструменты)
инструменты разработки данных
12) Укажите проблемы хранилищ данных.
1)Недооценка ресурсов, необходимых для загрузки данных;
2)Скрытые проблемы источников данных;
3)Отсутствие требуемых данных в имеющихся архивах;
4)Гомогенизация (однородность) данных;
5)Высокие требования к ресурсам;
6)Владение данными;
7)Сложное сопровождение;
8)Долговременный характер проектов
13) Укажите преимущества, которые можно получить при создании хранилищ данных.
Потенциально высокая отдача от инвестиций;
Повышение конкурентоспособности;
Повышение эффективности труда лиц, ответственных за принятие решений
14) Хранилище данных включает следующие компоненты:
Менеджер хранилища,
Менеджер загрузки данных,
Субд,
Менеджер запросов
Клиентские OLAP средства
система автоматизации. исп. Менеджер загрузки
менеджер загрузки
менеджер хранилища
менеджер запросов
менеджер хранилища
инструменты генерации отчетов и разработки приложений
инструменты OLAP
инструменты «раскопки» данных Data maining
15) OLAP инструменты создаются на основе концепции:
Многомерной БД
16) Архитектура ХД (DatawarehouseBus) Ральфа Кимболла (Ralph Kimball)предполагает:
Использование пространственной модели организации данных с архитектурой "звезда" (star scheme).
Использование двухуровневой архитектуры,
(которая включает стадию подготовки данных, недоступную для конечных пользователей и Хранилище, в состав которого входят НЕСКОЛЬКО ВИТРИН АТОМАРНЫХ данных, НЕСКОЛЬКО ВИТРИН АГРЕГИРОВАННЫХ данных и персональная витрина данных, но оно не содержит одного физически целостного или централизованного хранилища данных).
Хранилище Кимболла - скорее "виртуальный" объект. Это коллекция витрин данных, которые могут быть пространственно разобщенными.
17) Архитектура ХД CIF Билла Инмона предполагает:
Скоординированное извлечение данных из источников.
Загрузка реляционной базы данных, состоящей из таблиц в третьей нормальной форме, содержащей атомарные данные.
ПолучившеесянормализованноеХранилищеиспользуется для того, чтобы наполнить информацией дополнительные репозитории презентационных данных, т.е. данных, подготовленных для анализа.
Эти репозитории, в частности, включают специализированные Хранилища для изучения и "добычи" данных (Data Mining), a также витрины данных.
Накопление данных в централизованном хранилище.
Многомерный анализ данных в витринах.
18) Унифицированная модель измерений UMD используется для:
поддержки архитектуры виртуального ХД
UDM позволяет получать BI-данные непосредственно от OLTPсистем так, чтобы чрезмерно не нагружать эти системы. В результате отпадает необходимость в витринах данных
Новизна архитектуры UDM привела к появлению уникального набора возможностей, предлагающих пользователям ряд преимуществ по сравнению с традиционными реализациями OLAP. Эти преимущества в значительной степени устраняют проблемы и недостатки, зачастую связанные с реализацией бизнес-аналитики
UDM позволяет строить OLAP-кубы непосредственно на основе данных транзакций.
UDM не требует использования в качестве источника данных витрины данных со схемой звезды или снежинки. Годится любая нормально структурированная реляционная база данных