Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

1222

.pdf
Скачиваний:
9
Добавлен:
07.01.2021
Размер:
980.73 Кб
Скачать

Выбрать хранилище данных Deductor Warehous (кроссплатформенный). На следующем шаге из единственно доступного в списке типа базы данных выбрать Firebird. Задать параметры базы данных, в которой будет создана физическая и логическая структура хранилища данных.

Нажать кнопку «Создать». Если все параметры создания указаны верно, появится сообщение о его успешном создании.

С помощью Мастера импорта загрузить выборку данных в

Deductor Studio.

Указать параметры импорта текстового файла.

Указать параметры столбцов.

Выбрать способ отображения данных.

Запустить «Мастер экспорта» (на панели инструментов кнопка или пункт «Мастер экспорта» в всплывающем меню) и в списке форматов выбрать из ветки «Deductor Warehouse» Процесс или Измерение.

2.4 Лабораторная работа 4 «Определение представления источника данных и развертывание куба в проекте служб

Analysis Services»

Рекомендуемая литература: 1.

Перечень дополнительных ресурсов: 3,4.

Цель работы: рассмотреть понятие представления источника данных и развертывание куба в проекте служб Analysis Services.

Задание:

В меню «Пуск» последовательно выберите пункты «Все программы», «Microsoft SQL Server 2008», а затем выберите «Среда

SQL Server Business Intelligence Development Studio». Откроется среда разработки Microsoft Visual Studio.

В меню «Файл» Visual Studio укажите команду «Создать», затем выберите пункт «Проект».

В диалоговом окне «Новый проект» на панели «Типы проектов» выберите значение «Проекты бизнес-аналитики», а на панели «Шаблоны» укажите «Проект служб SSAS».

Измените имя проекта на Analysis Services Tutorial (при этом изменится и имя решения) и нажмите кнопку ОК.

В обозревателе решений щелкните правой кнопкой мыши элемент «Источники данных» и выберите команду «Создать источник данных».

На странице «Мастер источников данных» (рисунок 6.7) нажмите кнопку «Далее», чтобы открыть страницу «Выбор метода определения соединения».

Выбрать метод для определения соединения.

Внести имя сервера. Внести имя базы данных. Внести имя источника данных.

На странице «Мастер представления источника данных» нажать кнопку «Далее».

В группе «Источник реляционных данных» выбран источник данных «Adventure Works DW». Нажать на кнопку «Далее».

Выбрать источник данных. Выбрать таблицы и представления.

Внести имя представления источника данных.

Установить свойства связи между таблицами.

2.5 Лабораторная работа 5 «Изменение мер, атрибутов и иерархий»

Рекомендуемая литература: 1.

Перечень дополнительных ресурсов: 3,4.

Цель работы: получить навыки изменения мер, атрибутов и иерархий.

Задание:

Перейти на вкладку «Структура куба» конструктора кубов для куба Analysis Services Tutorial, раскрыть группу мер «Продажи через Интернет» на панели «Меры», нажать правой кнопкой мыши элемент Order Quantity и в контекстном меню выбрать пункт «Свойства».

Нажать на кнопку «Автоматически скрывать» окна «Свойства».

В окне «Свойства» в качестве значения свойства FormatString ввести #,#.

На панели инструментов вкладки «Структура куба» нажать на кнопку «Показывать сетку мер».

В окне свойств в раскрывающемся списке FormatString выбрать значение Currency.

В списке мер выбрать меру Unit Price Discount Pct, а затем выбрать значение Percent (Процент) в раскрывающемся списке

FormatString.

В окне си войств изменить свойство Name меры Unit Price Discount Pct на «Процент скидки на единицу товара».

На панели «Меры» нажать Tax Amt и изменить имя меры на «Размер налога».

В окне свойств нажать на кнопку «Автоматически скрыть», чтобы скрыть окно свойств, а затем нажать кнопку «Показывать дерево мер» на вкладке панели инструментов «Структура куба».

В меню «Файл» выбрать команду «Сохранить все».

2.6Лабораторная работа 6 «Разработка реляционного хранилища

данных средствами платформы Deductor»

Рекомендуемая литература: 1.

Перечень дополнительных ресурсов: 3,4.

Цель работы: изучить способы разработки реляционного хранилища данных с помощью средств платформы Deductor.

Задание:

Создать пустое хранилище, в котором нет ни одного объекта (процесса, измерения, факта). Открыть конструктор. Выбрать узел Измерения, нажать правой кнопкой мыши, затем нажать на кнопку Добавить и создать первое измерение Код группы со следующими параметрами: имя – GR_ID, метка – Группа.Код, тип данных – целый.

Создать таким же способом остальные измерения, с параметрами из табл. 1.

Таблица 1 – Параметры измерений

Измерение

Имя

Метка

Тип Данных

Код группы

GR_ID

Группа.Код

Целый

Код товара

TV_ID

Товар.Код

Целый

Код отдела

PART_D

Отдел.Код

Целый

Дата

S_DATE

Дата

Дата/время

Час покупки

S_HOUR

Час

Целый

Сформировать процесс и назвать его «Продажи», добавить в него ссылки на четыре существующих измерения: Дата, Отдел.Код, Товар.Код, Час.

2.7 Лабораторная работа 7 «Разработка РХД средствами СУБД»

Рекомендуемая литература: 1.

Перечень дополнительных ресурсов: 3,4.

Цель работы: изучить способы разработки РХД с помощью средств СУБД.

Задание:

Реализовать РХД архитектуру «звезда» – пробный проект.

Трасформировать базу данных учетной информационной системы до ХД.

Сформировать срезы OLAP–кубов средствами запросов.

2.8Лабораторная работа 8 «Определение и развертывание куба»

Рекомендуемая литература: 1.

Перечень дополнительных ресурсов: 3,4.

Цель работы: рассмотреть определение и метод развертывания

куба.

Задание:

Разработать систему аналитической отчетности. Для этого напишите в Deductor Studio сценарий обработки данных.

Выбрать любые 5 отчетов.

Найти сумму максимальной и средней стоимости покупки за последний месяц от имеющихся данных.

То же, что в п. 3, но за три месяца от имеющихся данных.

Сформировать многомерный отчет и график загруженности аптек по дням недели.

Сформировать многомерный отчет и график загруженности торговых точек по дням месяца.

То же, что в п. 6, но за последние три месяца от имеющихся данных.

20 самых продаваемых товаров.

10 самых продаваемых товаров по воскресеньям.

5 самых популярных товаров в каждой товарной группе.

То же, что и п. 10, но за последнюю неделю.

Товары, дающие 50% объема продаж.

То же, что и п. 12, но за последнюю неделю.

10 самых продаваемых товаров с 18 до 21 часа.

4. ТЕМЫ ДЛЯ ПОДГОТОВКИ К ИТОГОВОЙ ФОРМЕ КОНТРОЛЯ

1)Область применения хранилищ данных.

2)Data Mining. Характеристика классов задач, решаемых методами Data Mining.

3)Синтаксис кодов для создания запроса на языке MDX.

4)Основные принципы сбора (формализации) данных. Требования к объемам анализируемых данных.

5)Основные требования к данным, вводимым в хранилище данных.

6)Основные положения концепции хранилищ данных (DW).

7)Гиперкубические и поликубические модели данных.

8)Операции манипулирования измерениями в OLAP.

9)Способы построения моделей добычи данных в SQL Server

2005.

10)Технологии аналитической обработки данных (OLAP).

11)Характеристика вариантов реализации OLAP.

12)Реляционные хранилища данных (ROLAP).

13)Распределенные корпоративные хранилища данных.

14)Типичный набор инструментов предобработки данных в аналитическом приложении.

15)Цели, задачи и основное содержание консолидации данных. Обобщенная схема процесса консолидации.

16)Характеристика OLTP-систем.

17)Технология OLAP. Сущность многомерного представления

данных.

18)Организация процесса загрузки данных в хранилище. Постзагрузочные операции.

19)Структура многомерного куба. Работа с измерениями.

20)Обогащение данных.

21)Многомерные хранилища данных (MOLAP).

22)Цели, задачи и основное содержание визуализации данных. Группы методов визуализации.

23)Гибридные хранилища данных (HOLAP).

24)2 Манипуляции с измерениями OLAP-куба.

25)Виртуальные хранилища данных.

26)Визуализаторы общего назначения. OLAP-анализ.

27)Цели, задачи и основное содержание процесса ETL.

28)Организация процесса загрузки данных в хранилище. Постзагрузочные операции.

29)Технологии обновлении данных в ХД.

30)Причины отказа от использования хранилищ данных. Особенности загрузки данных из локальных источников.

31)Определение ETL, примеры ETL-процессов.

32)Создание вычисляемых выражений в кубе с помощью MS SQL Server.

33)Взаимодействие хранилища данных, системы DSS, OLAP и оперативных БД.

34)Двенадцать правил Кодда, применяемые для оценки OLAP-

систем.

35)Получение реляционной схемы данных из многомерного

куба.

36)Создание перспективы в кубах MS SQL Server.

37)Присоединение куба к источникам данных разного типа.

38)Тест FASMI, возможности его применения для оценки OLAP-систем.

39)Возможности применения OLTP-систем для оперативного анализа данных.

40)Основные положения концепции хранилищ данных (DW).

5.ТИПОВЫЕ ТЕСТОВЫЕ ЗАДАНИЯ

1.KDD (Knowledge Discovery in Databases) это:

a)Процесс получения из данных знаний в виде зависимостей, правил, моделей.

b)Обнаружение в «сырых» данных ранее неизвестных знаний.

c)Комплексирование достоверных данных, выполняемое на основе дисперсионного анализа.

2.Data Mining это:

a)Комплекс методов и процедур, направленных на устранение аномалий, пропусков, дубликатов, противоречий, шумов и т. д.

b)Набор операций над базой данных.

c)Обнаружение в «сырых» данных ранее неизвестных знаний.

3.К классам задач, решаемых методами Data Mining относятся:

a)Верстка и публикация результатов выполненного анализа

данных.

b)Загрузка, перезагрузка, выгрузка, проблемноориентированные операции.

c)Классификация, регрессия, кластеризация, ассоциация, последовательные шаблоны.

4 Очистка данных это:

a)Комплекс методов и процедур, направленных на устранение причин, мешающих корректной обработке: аномалий, пропусков, дубликатов, противоречий, шумов и т. д.

b)Комплекс методов и процедур, направленных на очистку хранилища от имеющихся в нем данных с обеспечением возможности отката.

c)Процесс удаления данных, содержащихся во временных и условно-постоянных файлах, а также в файлах разработки.

5.Обогащение данных это:

a)Процесс дополнения финансовых данных более высокими показателями за счет чего низкие показатели теряют свою актуальность и могут быть удалены.

b)Процесс дополнения данных некоторой информацией, позволяющей повысить эффективность решения аналитических задач.

c)Удаление данных, занимающих менее 10Гб.

6.Задачами процесса ETL (extraction, transformation, loading)

являются:

a)Извлечение данных из разнотипных источников, их преобразование, а также загрузка в базу или хранилище данных.

b)Загрузка данных в различные источники, а так же их выгрузка из базы или хранилища данных.

c)Сбор и последующая передача данных по единой телефонной линии (ЕТЛ).

7.Системы OLTP предназначены для:

a)Оперативной, то есть в режиме реального времени, обработки транзакций.

b)Удаления данных, содержащихся во временных и условнопостоянных файлах, а также в файлах разработки.

c)Длительного хранения больших объемов данных.

8.Транзакция это:

a)Набор операций над базой данных, который рассматривается как промежуточное, не завершенное, с точки зрения пользователя, действие над информацией.

b)Набор операций над базой данных, который рассматривается как единое завершенное, с точки зрения пользователя, действие над информацией.

c)Акция по транзиту данных через то или иное хранилище данных.

9.Главное требование к OLTP-системам:

a) Быстрое обслуживание относительно простых запросов

большого числа пользователей.

b)Обслуживание наиболее сложных запросов небольшого числа пользователей.

c)Должны иметь программное обеспечение, позволяющее выполнять быструю очистку и трансформацию данных.

10.Специализированные базы данных в СППР называются:

a)Реляционными базами данных.

b)Хранилищами данных.

c)Базами данных иерархической направленности.

11.Семантический слой это:

a)Механизм, позволяющий аналитику оперировать данными посредством бизнес-терминов предметной области.

b)Слой языковых единиц, позволяющий выполнять очистку поступающих в хранилище данных.

c)Слой языковых единиц, позволяющий создавать сводные таблицы.

12.Агрегирование данных это:

a)Процесс обобщения детализированных данных.

b)Применение специализированных программно-агрегатных комплексов для ускорения процесса загрузки данных в хранилище.

c)Процесс детализации обобщенных данных.

13.Аннотация, комментарии, глоссарий, примечания это:

a)Метаданные.

b)Семанотоданные.

c)Гетероданные.

14.Метаданные имеют два следующих уровня:

a)Технический (административный) и бизнес-уровень.

b)Высокоинтеллектуальный и сниженный.

c)Уровень пользователя и уровень разработчика.

15.ROLAP это:

a)Реляционные хранилища данных.

b)Многомерные хранилища данных.

c)Многофункциональные хранилища данных.

16.MOLAP это:

a)Реляционные хранилища данных.

b)Многомерные хранилища данных.

c)Многоуровневые хранилища данных.

17.HOLAP это:

a)Хост-процессорные хранилища данных.

b)Реляционные хранилища данных.

c)Гибридные хранилища данных.

18.Архитектуры ХД бывают:

a)Реляционными

b)Клиент-серверными.

c)Многоуровневыми.

d)Файл-серверными.

e)Модельными.

f)Виртуальными.

g)Гибридными.

h)Иерархическими.

i)Многомерными.

20.OLAP (On-Line Analytical Processing) это:

a)Аналитические системы, обеспечивающие загрузку данных в реляционные базы данных в режиме реального времени.

b)Быстрое обслуживание относительно простых запросов большого числа пользователей, при этом время ожидания выполнения типового запроса не должно превышать несколько секунд.

c)Технология оперативного извлечения нужной информации из больших массивов данных и формирования соответствующих отчетов.

21.Измерения это:

a)Средства визуализации анализируемых данных имеющие соответствующую разметку.

b)Наименования и свойства объектов, участвующих в некотором бизнес-процессе.

c)Измеренные значения объемов загружаемой информации.

22.Факты это:

a)Исключительно достоверные данные, загружаемые в хранилище данных.

b)Фактические данные, извлекаемые из хранилища данных для выполнения их анализа.

c)Данные, количественно описывающие бизнес-процесс.

23.Наименования товаров, названия фирм-поставщиков, названия городов это:

a)Факты.

b)Измерения.

c)Структурные элементы загружаемых в хранилище данных.

24.Цена товара, сумма продаж, зарплата сотрудников, сумма кредита это:

a)Факты.

b)Измерения.

c)Структурные элементы выгружаемых из хранилища данных.

25.Над измерениями гиперкуба можно производить следующие действия:

a)Сечение.

b)Свертка.

c)Транспонирование.

d)Группировка.

e)Детализация.

26.Реляционная БД состоит из:

a)Двумерных таблиц, связанных с помощью ключевых полей.

b)Структур типа «Звезда» или «Снежинка».

c)Объектно-ориентированных иерархических структур.

27.На логическом уровне различают следующие схемы построения реляционных ХД:

a)«Крыло».

b)«Релакс».

c)«Звезда».

d)Объектно-ориентированная.

e)«Снежинка».

28.ETL это:

a)Комплекс методов, реализующих процесс переноса исходных данных из различных источников в аналитическое приложение или поддерживающее его хранилище данных.

b)Единая телекоммуникационная линия для загрузки данных в хранилище.

c)Единая имитационно-моделирующая среда для построения виртуальных хранилищ данных.

29.В качестве источников извлечения данных используются:

a)Файлы СУБД.

b)Структурированные файлы различных форматов.

c)Неструктурированные источники.

30.К неструктурированным относятся данные:

a)Определенным образом упорядоченные и организованные с целью обеспечения возможности применения к ним некоторых действий.

b)Данные, для которых определены некоторые правила и форматы, но в самом общем виде.

c)Произвольные по форме, включающие тексты и графику, мультимедиа (видео, речь, аудио).

31.Трансформация данных это:

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]