
- •Раздел 1. Накопление и обработка данных .…………………………… 5
- •Раздел 2. Оперативный анализ данных ….…………………………… 43
- •Раздел 3. Интеллектуальный анализ данных ………………………… 82
- •Раздел 4 Загрузка данных и программирование запросов ...………… 110
- •Раздел 5. Подготовка отчетов по результатам анализа …….……… 136
- •Раздел 1. Накопление и обработка данных Лекция 1. Информационно-аналитические системы
- •Операционная обработка данных
- •Оперативный анализ данных
- •Интеллектуальный анализ данных
- •Краткие итоги
- •Контрольные вопросы
- •Литература
- •Лекция 2. Концепции хранения данных
- •Реляционные базы данных
- •Организация хранилищ данных
- •Концепция многомерной модели данных
- •Краткие итоги
- •Контрольные вопросы
- •Литература
- •Лекция 3. Интеграция и трансформации данных
- •Платформа sql Server 2008
- •Система Management Studio
- •Служба sql Server Integration Services
- •Краткие итоги
- •Контрольные вопросы
- •Литература
- •Раздел 3. Интеллектуальный анализ данных Лекция 8. Кластерный анализ данных
- •Формальная постановка задачи кластеризации
- •Меры близости в кластерном анализе
- •Иерархические алгоритмы кластеризации
- •Неиерархические алгоритмы кластеризации
- •Представление результатов кластеризации
- •Краткие итоги
- •Контрольные вопросы
- •Литература
- •Лекция 9. Классификация и регрессия
- •Математические функции
- •Правила классификации
- •Деревья решений
- •Методы построения деревьев решений
- •Алгоритмы построения деревьев решений
- •Краткие итоги
- •Контрольные вопросы
- •Литература
- •Лекция 10. Поиск ассоциативных правил
- •Цель лекции – изучение формализованной постановки и алгоритма решения задачи поиска ассоциативных правил.
- •Формальная постановка задачи
- •Обнаружение закономерностей в последовательностях данных
- •Алгоритм поиска ассоциативных правил Apriori
- •Представление результатов
- •Краткие итоги
- •Контрольные вопросы
- •Литература
- •Лекция 8. Службы sql Server Analysis Services
- •Конструктор интеллектуального анализа данных
- •Мастер интеллектуального анализа данных
- •Создание структуры интеллектуального анализа
- •Краткие итоги
- •Контрольные вопросы
- •Литература
- •Создание и представление источника данных
- •Загрузка с применением Integration Services
- •Краткие итоги
- •Контрольные вопросы
- •Литература
- •Лекция 12. Основы языка Multidimensional Expressions
- •Оператор select
- •Алгебра множеств и операции с множествами
- •Функции языка mdx
- •Краткие итоги
- •Контрольные вопросы
- •Литература
- •Лекция 13. Язык операций Data Mining
- •Ключевые концепции и объекты dmx
- •Синтаксис запросов dmx
- •Создание моделей интеллектуального анализа
- •Краткие итоги
- •Контрольные вопросы
- •Литература
- •Раздел 5. Подготовка отчёта по итогам анализа Лекция 14. Служба отчетов Reporting Services
- •Архитектура службы отчётов
- •Средства проектирования запросов
- •Развёртывание Reporting Services
- •Краткие итоги
- •Контрольные вопросы
- •Литература
- •Лекция 15. Источники данных для отчётов
- •Общие источники данных
- •Источники поддерживаемые Reporting Services
- •Создание, изменение и удаление источников
- •Краткие итоги
- •Контрольные вопросы
- •Литература
- •Лекция 16. Конструирование и создание отчётов
- •Основы конструирования отчётов
- •Создание нерегламентированных отчётов
- •Создание отчётов с применением конструктора
- •Краткие итоги
- •Контрольные вопросы
- •Литература
- •Глоссарий
Краткие итоги
Для доступа к данным OLAP-систем разработан язык программирования MDX (Multidimensional Expressions). Язык MDX является промышленным стандартом и широко используется в клиентских приложениях оперативного анализа данных.
Результатом MDX-запроса является многомерное подпространство в виде подкуба (subcube) с множеством осей (axes). При создании многомерного запроса указывается список осей. Количество осей в MDX-запросе теоретически не ограничено.
Понятие множества в языке MDX аналогично понятию множества в математике. Язык поддерживает пять операций для создания новые MDX-множества из существующих множеств: Объединение (Union); Пересечение (Intersect); Исключение (Except); Перёкрёстное соединение (Crossjoin); Извлечение (Extract).
В дополнение к операциям для работы с множествами MDX содержит функции, оперирующие многомерными объектами: Измерения (Dimensions), Иерархия (Hierarchies), Уровни (Levels), Элементы (Members), Кортежи (Tuples) и Скалярные Значения (Scalar Values). Все функции MDX разделяют на методы и свойства.
Перемещение по многомерным данным, хранящимся в Analysis Services, может выполняться с учётом иерархий измерений. Свойства иерархии представляются в MDX-запросе функцией навигации по иерархии.
Контрольные вопросы
1. Результатом MDX-запроса является:
а) данные из строки таблицы базы данных;
б) значения меток на осях гиперкуба;
в) значения координат ячейки в многомерном пространстве;
г) многомерное подпространство в виде подкуба;
2. Для реализации MDX-запросов можно использовать:
а) службы SQL Server Data Mining;
б) службы SQL Server Integration Services;
в) службы SQL Server Management Studio;
г) службы SQL Server Reporting Services.
3. Операция Пересечение (Interesect) создаёт новое множество, в котором:
а) содержатся кортежи с элементами, присутствующими в обоих исходных кортежах;
б) содержатся кортежи с элементами, присутствующими в одном или обоих исходных кортежах;
в) содержатся кортежи, которые присутствуют в обоих исходных множествах;
г) содержатся кортежи, присутствующие в одном или обоих исходных множествах.
4. Операция Перекрестного соединения сохраняет:
а) порядок иерархий, имеющихся в исходных множествах;
б) иерархию атрибутов в измерениях многомерной модели;
в) кортежи элементов из обоих исходных множеств;
г) кортежи элементов, имеющиеся в исходных множествах.
5. Функция для упорядочения данных (Order) используется для сортировки:.
а) данных столбца по возрастанию или убыванию;
б) кортежей по множеству в порядке убывания или возрастания;
в) элементов кортежа в порядке убывания или возрастания;
г) элементов в строке реляционной таблицы данных.
Литература
1. Бергер А.Б. Microsoft SQL Server 2005 Analysis Services. OLAP и многомерный анализ данных / Бергер А.Б, Горбач И.В., Меломед Э.Л, Щербинин В.А., Степаненко В.П. / Под общ. Ред. А.Б. Бергера, И.В. Горбач. – СПб.: БХВ-Петербург, 2007. – 928 с.
2. Байдачный С. SQL Server 2005: Новые возможности для разработчиков / С. Байдачный, Д. Маленко, Ю. Лозинский. – М.: СОЛОН-Пресс, 2006. – 2008 с.
3. Microsoft SQL Server 2008: Data mining – интеллектуальный анализ данных. Пер. с англ. / Дж. Макленнен, Чж. Танг, Б. Криват. – БХВ-Петербург. 2009. – 720 с.