Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

3327

.pdf
Скачиваний:
0
Добавлен:
21.11.2023
Размер:
350.32 Кб
Скачать

Reader

Использование трассировки позволяет глубже разобраться вособенностях работы надстроек интеллектуального анализа, а привозникновении ошибок выявить их причины.

Задание 1. По аналогии с рассмотренным примером создайтемодель кластеризации. Изучите и проанализируйте полученные результаты. Отройте окно трассировки, проанализируйте отправляемые на сервер запросы.

Теперь рассмотрим инструмент перекрестной проверки CrossValidation (надо отметить, что перекрестная проверка доступна прииспользовании SQLServer версии Enterprise или Developer). Суть еезаключается в том, что множество вариантов, которое использует модель, разбивается на непересекающиеся подмножества (разделы). Длякаждого из разделов производится обработка модели и полученныерезультаты сравниваются с теми, что были на исходном множествевариантов. Если результаты близки, можно говорить об удачной модели интеллектуального анализа: исходных данных хватило, результат прогноза или анализа достаточно стабилен.

Вразделе Accuracy and Validation выбереминструментCrossValidation.

Первое окно мастера сообщает о сути выполняемой проверки. Во втором окне производится выбор модели для перекрестной проверки. Укажем нашу модель кластеризации – Table2-Clustering.

После выбора модели нужно указать параметры проводимой перекрестной проверки. В частности, указывается число разделов с данными для перекрестной проверки (FoldCount, по умолчанию 10),максимальное число вариантов, используемых при проверке (значение MaximumRows=0 указывает на то, что будут использоваться все;если исходных данных много, при использовании всех данных перекрестная проверка может занять продолжительное время),

целевойатрибут (TargetAttribute).

В качестве целевого атрибута (англ. TargetAttribute) выбран #Cluster, это номер кластера, к которому принадлежит вариант. Суть проверки будет заключаться в том, что выполняется кластеризация в рамках отдельного раздела и полученный номеркластера, к которому отнесен вариант, будет сравниваться с номеромкластера, полученным при обработке модели с использованием всегомножества вариантов. Совпадение говорит о том, что модель хорошая(правильно определены имеющиеся шаблоны).

По результатам выполнения перекрестной проверки формируется отчет. В нем показывается, сколько вариантов использовалось для проверки, какие разделы были сформированы (в нашем примере 10 разделов по 70 строк данных),

результаты проведенного анализа. На рисунке видно, что в среднем, результаты, полученные при анализе по разделам, более чем в 82% случаевсовпадают с результатами исходной модели. Небольшой разброс значений для разных разделов, указывает на стабильность получаемогорезультата, т.е. построенная модель интеллектуального анализа можетбыть признана удачной.

Задание 2. Выполните перекрестную проверку для созданноймодели интеллектуального анализа. Опишите и проанализируйте полученные результаты.

ЛАБОРАТОРНАЯ РАБОТА № 6

Тема: Построение моделикластеризации, трассировка и перекрестнаяпроверка

Цель работы: Изучить способы построения моделикластеризации, трассировки и перекрестной проверки.

Рассмотрим еще ряд возможностей, предоставляемых надстройками интеллектуального анализа данных. Пусть необходимо провестисегментацию клиентов Интернет-магазина, список которых находитсяв файле Excel. Если использовать TableAnalysisTools, для решенияэтой задачи надо применить инструмент DetectCategories. Также можно воспользоваться средствами

DataMiningClientforExcel, где выбрать инструмент Cluster.

Порядок выполнения работы

Откроем файл с образцами данных, идущий в поставке снадстройками

Список рекомендованной литературы

1.Нестеров С.А. Интеллектуальный анализ данных средствами MSSQL Server 2008: учеб.пособие. М.: Интернет-Универси-тетИнформацион-ных Технологий (ИНТУИТ), 2011 – 261 с.

2.Макленнен, Джеми. MicrosoftSQLServer 2008: Datamining –

интеллектуальный анализ данных: [пер. сангл.] / ДжемиМакленнен, Чжаохуэй Танг, Богдан Криват. – СПб.: БХВ-Петербург, 2009. –720с.

3. Барсегян А. А. Анализ данных и процессов: учеб. пособие /А.А. Барсегян, М.С. Куприянов, И.И. Холод, М.Д.Тесс, С.И. Елизаров. – 3-е изд., перераб. и доп.

– СПб.: БХВ-Петербург, 2009. – 512 с.

4. Службы AnalysisServices — видеоролики по интеллектуальному анализу данных (SQL Server 2008). URL:http://msdn.microsoft.com/ruru/library/dd776389(v=SQL.100).aspx

5. Чубукова И. А. DataMining. – М.: Интернет-университетинформационных технологий, Бином. Лаборатория знаний, 2008 –382 с.

Сафонов Константин Анатольевич

ОСНОВНЫЕ НАПРАВЛЕНИЯ РАЗВИТИЯ ИНФОРМАЦИОННЫХ СИСТЕМ И ТЕХНОЛОГИЙ

Учебно-методическое пособие

по выполнению лабораторных работ для обучающихся по дисциплине «Основные направления развития информационных систем и технологий»

по направлению подготовки 09.04.02 Информационные системы и технологии, направленность (профиль) - Технология разработки информационных систем

Федеральное государственное бюджетное образовательное учреждение высшего образования «Нижегородский государственный архитектурно-строительный университет»

603950, Нижний Новгород, ул. Ильинская, 65. http://www.nngasu.ru, srec@nngasu.ru

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]