Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
kurs.rtf
Скачиваний:
1
Добавлен:
01.03.2025
Размер:
23.54 Mб
Скачать

Создание моделей интеллектуального анализа

В отличие от структуры модель ИАД содержит столбцы, которые помечены как входы или выходы, и указание на алгоритм со всеми характерными параметрами [1]. Модель может содержать любое подмножество столбцов из структуры. Для этого в модель включается ключ структуры ИАД и ключи всех вложенных таблиц. Самый простой способ включения модели в структуру реализуется по умолчанию. Реализовать простой способ можно указанием названия и алгоритма в конструкции, приведённой в листинге 14.3

ALTER MINING STRUCTURE [TEACHER1]

ADD MINING MODEL [TeacherClasters]

USING Microsoft Clustering

В большинстве случае в конструкции DMX требуется указать список столбцов. Для указания принадлежности столбца к входу или выходу используются флаги PREDICT И PREDICT_ONLY. Столбцы без флагов автоматически относятся к входу. В листинге 14.4 приведено определение модели дерева решений, которая прогнозирует учёное звание (AcademStatus) на основе возраста преподавателя и наличия учёной степени (AcademDegree).

ALTER MINING STRUCTURE [Teacher2]

ADD MINING MODEL [PredictAcademStatus-Tree]

{

[TeacherID],

[AcademStatus] PREDICT

[Age],

[AcademDegree]

} USING Microsoft Decision Trees

Не все алгоритмы ИАД могут работать с непрерывными типами данных. Для решения этой проблемы в модель можно включить дополнительный столбец с типом содержимого DISCRETZED. Это позволяет представить один столбец с различными типами содержимого внутри структуры. Например, в листинге 14.5 применяется дополнительный столбец AgeDisc, имеющий связь со столбцом Age. За счёт этой связи поддерживается согласованность столбцов с остальными моделями структуры.

ALTER MINING STRUCTURE [Teacher2]

ADD MINING MODEL [PredictAcademStatus-Tree]

{

[TeacherID],

[AcademStatus] PREDICT

[Age],

[AgeDisc] AS [Age]

[AcademDegree]

} USING Microsoft Naive Bayes

После определения структур и модели ИАД выполняется процедура заполнения их данными. Доступ к данным осуществляется через именованный источник данных. При выполнении запроса служба SQL Server Analysis Services считывает данные в кэш. После этого исходные типы данных источника преобразуются к типам данных, указанным в структуре интеллектуального анализа данных.

Краткие итоги

  • Для задания структур и моделей для интеллектуального анализа данных компанией Microsoft разработан язык многомерных выражений Data Mining Extensions (DMX).

  • Разделение данных на обучающие и проверочные наборы выполняется автоматически, если в структуре интеллектуального анализа данных задать процента данных для проверки.

  • Не все алгоритмы интеллектуального анализа работают с непрерывными типами данных. Для решения этой проблемы в модель можно включить дополнительный столбец с типом содержимого DISCRETZED.

  • Модель ИАД содержит столбцы из структуры, которые помечены как входы или выходы, и указание на используемый алгоритм. Для этого в модель включается ключ структуры ИАД и ключи вложенных таблиц. Простейший способ включения модели в структуру реализуется по умолчанию.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]