Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
kurs.rtf
Скачиваний:
0
Добавлен:
01.03.2025
Размер:
23.54 Mб
Скачать

Краткие итоги

  1. SQL Server 2008 является высокопроизводительной, масштабируемой, многофункциональной платформой с расширенным набором средств оперативного и интеллектуального анализа данных.

  2. Платформа SQL Server 2008 содержит службу хранения, обработки и защиты данных SSDE, сервисы интеграции SSIS, аналитические сервисы SSAS, сервисы отчётов SSRS, службу администрирования и управления SSMS, службу разработки систем бизнес-анализа BI Dev Studio.

  3. Служба SSMS предназначена для администрирования ядра SQL Server (SSDE), служб SSIS, SSAS, SSRS и создания проектов сценариев для служб SSAS и SSDE.

  4. Системы ETL извлекают информацию из исходной БД, преобразуют её в формат, поддерживаемый БД назначения, а затем загружает в неё преобразованную информацию.

  5. Служба SSIS представляет собой многофункциональную платформу (ETL-систему) для интеграции данных, обеспечивающую извлечение (extraction), преобразование (transformation) и загрузку данных (loading).

Контрольные вопросы

1. Потоком данных в службах SSIS называют:

а) множество данных, характеризующих объект анализа;

б) перемещение данных от источника к приёмнику;

в) файл с множеством данных, подготовленный для анализа;

г) множество данных, перемещаемых в многомерную модель данных.

2. Архитектура служб SSIS ориентирована на операции:

а) с множествами кортежей, характеризующих объекты анализа;

б) с объектами интеллектуального анализа данных;

в) оперативного и интеллектуального анализа данных;

г) извлечения, преобразования и загрузку данных.

3. Одно из основных назначений языка XML в системах анализа данных:

а) описание методов и алгоритмов анализа данных;

б) описание процесса обмена данными между приложениями;

в) разработка пользовательских приложений в системе анализа;

г) описание

4. Службы SQL Server Management Studio предназначены для:

а) администрирования и управления многомерными объектами;

б) осуществления оперативного анализа данных;

в) осуществления интеллектуального анализа данных;

г) извлечения, преобразования и загрузки данных.

5.Процессом перегрузки данных в ETL-системах называют:

а) реализацию потока данных от единственного набора данных источника до одного или нескольких наборов данных хранилища;

б) создание копии таблицы с данными в базе данных;

в) создание резервной копии базы данных на сервере;

г) реализацию потока данных из хранилища до одного набора данных в транзакционной БД.

Литература

1. Бергер А.Б. Microsoft SQL Server 2005 Analysis Services. OLAP и многомерный анализ данных / Бергер А.Б, Горбач И.В., Меломед Э.Л, Щербинин В.А., Степаненко В.П. / Под общ. Ред. А.Б. Бергера, И.В. Горбач. – СПб.: БХВ-Петербург, 2007. – 928 с.

2. Microsoft SQL Server 2008: Data mining – интеллектуальный анализ данных. Пер. с англ. / Дж. Макленнен, Чж. Танг, Б. Криват. – БХВ-Петербург. 2009. – 720 с.

3. Малыхина М.П. Базы данных: основы, проектирование, использование. – Спб.: БХВ-Петербург, 2004. – 512 с.

Раздел 3. Интеллектуальный анализ данных Лекция 8. Кластерный анализ данных

В лекции рассматривается постановка и решение задач кластерного анализа: исследования схем группирования объектов; представление гипотез на основе собранных данных; проверка гипотез о наличии кластеров в данных, выделенных пользователем.

Цель лекции – изучение формальной постановки задачи кластеризации, мер близости объектов, иерархических и неиерархических алгоритмов.

Кластерный анализ данных не требует выделения зависимой переменной и предполагает разделение множества объектов не кластеры (cluster) или классы, таксоны, сгущения, группы. Для задач кластеризации характерно отсутствие различий объектов по атрибутам (переменным). Термин кластерный анализ, впервые введён Трионом (Tryon) в 1939 году. При проведении кластерного анализа не строят априорных предположений о заданном наборе данных, не вводят ограничений на представление объектов анализа и типы данных. Кластерный анализ также можно использовать для сокращения размерности и визуализации данных. В настоящее время кластерный анализ развивается в направлениях, связанных с коммерческой деятельностью, техническими науками, биологией и психологией [1, 2].

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]