- •Раздел 1. Накопление и обработка данных .…………………………… 5
- •Раздел 2. Оперативный анализ данных ….…………………………… 43
- •Раздел 3. Интеллектуальный анализ данных ………………………… 82
- •Раздел 4 Загрузка данных и программирование запросов ...………… 110
- •Раздел 5. Подготовка отчетов по результатам анализа …….……… 136
- •Раздел 1. Накопление и обработка данных Лекция 1. Информационно-аналитические системы
- •Операционная обработка данных
- •Оперативный анализ данных
- •Интеллектуальный анализ данных
- •Краткие итоги
- •Контрольные вопросы
- •Литература
- •Лекция 2. Концепции хранения данных
- •Реляционные базы данных
- •Организация хранилищ данных
- •Концепция многомерной модели данных
- •Краткие итоги
- •Контрольные вопросы
- •Литература
- •Лекция 3. Интеграция и трансформации данных
- •Платформа sql Server 2008
- •Система Management Studio
- •Служба sql Server Integration Services
- •Краткие итоги
- •Контрольные вопросы
- •Литература
- •Раздел 3. Интеллектуальный анализ данных Лекция 8. Кластерный анализ данных
- •Формальная постановка задачи кластеризации
- •Меры близости в кластерном анализе
- •Иерархические алгоритмы кластеризации
- •Неиерархические алгоритмы кластеризации
- •Представление результатов кластеризации
- •Краткие итоги
- •Контрольные вопросы
- •Литература
- •Лекция 9. Классификация и регрессия
- •Математические функции
- •Правила классификации
- •Деревья решений
- •Методы построения деревьев решений
- •Алгоритмы построения деревьев решений
- •Краткие итоги
- •Контрольные вопросы
- •Литература
- •Лекция 10. Поиск ассоциативных правил
- •Цель лекции – изучение формализованной постановки и алгоритма решения задачи поиска ассоциативных правил.
- •Формальная постановка задачи
- •Обнаружение закономерностей в последовательностях данных
- •Алгоритм поиска ассоциативных правил Apriori
- •Представление результатов
- •Краткие итоги
- •Контрольные вопросы
- •Литература
- •Лекция 8. Службы sql Server Analysis Services
- •Конструктор интеллектуального анализа данных
- •Мастер интеллектуального анализа данных
- •Создание структуры интеллектуального анализа
- •Краткие итоги
- •Контрольные вопросы
- •Литература
- •Создание и представление источника данных
- •Загрузка с применением Integration Services
- •Краткие итоги
- •Контрольные вопросы
- •Литература
- •Лекция 12. Основы языка Multidimensional Expressions
- •Оператор select
- •Алгебра множеств и операции с множествами
- •Функции языка mdx
- •Краткие итоги
- •Контрольные вопросы
- •Литература
- •Лекция 13. Язык операций Data Mining
- •Ключевые концепции и объекты dmx
- •Синтаксис запросов dmx
- •Создание моделей интеллектуального анализа
- •Краткие итоги
- •Контрольные вопросы
- •Литература
- •Раздел 5. Подготовка отчёта по итогам анализа Лекция 14. Служба отчетов Reporting Services
- •Архитектура службы отчётов
- •Средства проектирования запросов
- •Развёртывание Reporting Services
- •Краткие итоги
- •Контрольные вопросы
- •Литература
- •Лекция 15. Источники данных для отчётов
- •Общие источники данных
- •Источники поддерживаемые Reporting Services
- •Создание, изменение и удаление источников
- •Краткие итоги
- •Контрольные вопросы
- •Литература
- •Лекция 16. Конструирование и создание отчётов
- •Основы конструирования отчётов
- •Создание нерегламентированных отчётов
- •Создание отчётов с применением конструктора
- •Краткие итоги
- •Контрольные вопросы
- •Литература
- •Глоссарий
Платформа sql Server 2008
SQL Server 2008 является высокопроизводительной масштабируемой многофункциональной платформой, которая построена вокруг ядра, обеспечивающего работу реляционной базы данных (БД). Эта платформа включает большое количество сервисов и тесно интегрирована со всем комплексом программного обеспечения фирмы Microsoft (рисунок 3.1). СУБД и ряд ее сервисов являются ключевыми компонентами, обеспечивающими работу многих продуктов компании Microsoft.
О
сновными
компоненты SQL Server 2008 являются:
основная служба (SQL Server 2008 Database Engine, SSDE), предназначенная для хранения, обработки и защиты данных, обеспечения управляемого доступа к данным и быстрой обработки транзакций;
сервисы интеграции (SQL Server Integration Services, SSIS), обеспечивающие извлечения, преобразования, загрузку данных в хранилище данных (ХД) и их интеграцию в масштабе предприятия;
аналитические сервисы (SQL Server Analysis Services, SSAS), предназначенные для анализа больших и смешанных наборов данных с использованием многомерного хранения кубов, решение задач ИАД;
сервисы отчетов (SQL Server Reporting Services, SSRS), предназначенные для создания, управления и доставки как интерактивных отчетов, основанных на Web-технологиях, так и бумажных отчётов;
Инструментальные средства администрирования и управления, разработки систем анализа данных (среды):
инструмент администрирования и управления (SQL Server Management Studio, SSMS), предназначенный для администрирования БД и управления многомерными объектами, созданными разработчиками;
инструмент разработки систем бизнес-анализа (SQL Server Business Intelligence Development Studio, BI Dev Studio) на основе SSAS, SSRS, SSIS, который интегрирован в оболочку Microsoft Visual Studio 2008;
Система Management Studio
Инструмент администрирования SSMS предназначен для администрирования ядра SQL Server, служб Integration Services, Analysis Services, Reporting Services и обеспечивает управление многомерными объектами, созданными разработчиками БД. Система SSMS разработана в виде единой консоли, поддерживающей функции управления, редактирования запросов и настройки производительности системы. Кроме того, консоль можно использовать для написания многомерных запросов на языке MDX или SQL, отправки запросов XMLA в Analysis Services.
При запуске SSMS пользователем появляется диалоговое окно Connect to Server, приведённое на рисунке 3.2. Диалоговое окно содержит три выпадающих списка. Первый выпадающий список указание типов доступных серверов: Database Engine, Analysis service, Reporting service, Integration service. По умолчанию из списка выбирается сервер Database Engine, обеспечивающий управление реляционными БД.
Management Studio не поддерживает работу с несколькими серверами одновременно. При необходимости переключения между серверами необходимо открыть несколько окон этой утилиты. В окне Object Explorer утилиты Management Studio отображается структура выбранного сервера и информация об объектах БД. Management Studio поддерживает несколько редакторов:
редактор SQL Server запросов;
редактор Analysis запросов (MDX, DMX, XMLA);
редактор XML;
редактор обычного текста.
В настоящее время Structured Query Language (SQL) является стандартным языком определения и управления данными, хранящимися в реляционных БД. Этот язык содержит два подмножества инструкций. Первое подмножество инструкций называется языком определения данных (Data Definition Language, DDL), второе подмножество инструкция – языком манипулирования (обработки) данными (Data Manipulation Language, DML).
Инструкции DDL предназначены для создания объектов БД, построенных на основе реляционной модели. Инструкции DML предназначены для извлечения и обновления содержимого БД. Инструкция SELECT. Полный перечень инструкций рассматривается в работах [1, 2 ].
Одно из основных назначений языка XML состоит в обеспечении обмена данными между различными приложениями [1]. Большая популярность языка объясняется удобным форматом представления данных. Например, в тестовых файлах инструкция о структуре данных не хранится и небольшое изменение в формате может повлечь к некорректной работе приложения. С помощью XML можно создавать закрытые системы, обменивающиеся с внешней средой и не раскрывающие внутренней структуры данных в системе. Это достигается тем, что структура данных в файлах XML может не соответствовать структуре данных в системе.
Обозреватель объектов — компонент SQL Server Management Studio — может подключаться к экземплярам Database Engine, Analysis Services, Integration Services, Reporting Services и SQL Server Mobile. Он обеспечивает просмотр всех объектов сервера и предоставляет пользовательский интерфейс для управления ими. Возможности обозревателя объектов могут незначительно отличаться в зависимости от типа сервера, но в общем случае включают функции разработки для баз данных, а также функции управления для всех типов серверов.
В среде SQL Server Management Studio можно создавать различные типы проектов, предназначенные для сценариев служб Analysis Services и сценариев служб Database Engine. Сценарии служб Analysis Services содержат сценарии соединения с экземплярами служб Analysis Services, сценарии расширений интеллектуального анализа данных, многомерных выражений и выражений XML для служб Analysis Services. Сценарии Database Engine содержат сценарии Transact-SQL и XQuery для экземпляра компонента SQL Server 2008 Database Engine, сценарии соединения с экземплярами компонента SQL Server 2005 Database Engine.
