Создание моделей интеллектуального анализа

В отличие от структуры модель ИАД содержит столбцы, которые помечены как входы или выходы, и указание на алгоритм со всеми характерными параметрами [1]. Модель может содержать любое подмножество столбцов из структуры. Для этого в модель включается ключ структуры ИАД и ключи всех вложенных таблиц. Самый простой способ включения модели в структуру реализуется по умолчанию. Реализовать простой способ можно указанием названия и алгоритма в конструкции, приведённой в листинге 14.3

ALTER MINING STRUCTURE [TEACHER1]

ADD MINING MODEL [TeacherClasters]

USING Microsoft Clustering

В большинстве случае в конструкции DMX требуется указать список столбцов. Для указания принадлежности столбца к входу или выходу используются флаги PREDICT И PREDICT_ONLY. Столбцы без флагов автоматически относятся к входу. В листинге 14.4 приведено определение модели дерева решений, которая прогнозирует учёное звание (AcademStatus) на основе возраста преподавателя и наличия учёной степени (AcademDegree).

ALTER MINING STRUCTURE [Teacher2]

ADD MINING MODEL [PredictAcademStatus-Tree]

{

[TeacherID],

[AcademStatus] PREDICT

[Age],

[AcademDegree]

} USING Microsoft Decision Trees

Не все алгоритмы ИАД могут работать с непрерывными типами данных. Для решения этой проблемы в модель можно включить дополнительный столбец с типом содержимого DISCRETZED. Это позволяет представить один столбец с различными типами содержимого внутри структуры. Например, в листинге 14.5 применяется дополнительный столбец AgeDisc, имеющий связь со столбцом Age. За счёт этой связи поддерживается согласованность столбцов с остальными моделями структуры.

ALTER MINING STRUCTURE [Teacher2]

ADD MINING MODEL [PredictAcademStatus-Tree]

{

[TeacherID],

[AcademStatus] PREDICT

[Age],

[AgeDisc] AS [Age]

[AcademDegree]

} USING Microsoft Naive Bayes

После определения структур и модели ИАД выполняется процедура заполнения их данными. Доступ к данным осуществляется через именованный источник данных. При выполнении запроса служба SQL Server Analysis Services считывает данные в кэш. После этого исходные типы данных источника преобразуются к типам данных, указанным в структуре интеллектуального анализа данных.

Краткие итоги

Для задания структур и моделей для интеллектуального анализа данных компанией Microsoft разработан язык многомерных выражений Data Mining Extensions (DMX).
Разделение данных на обучающие и проверочные наборы выполняется автоматически, если в структуре интеллектуального анализа данных задать процента данных для проверки.
Не все алгоритмы интеллектуального анализа работают с непрерывными типами данных. Для решения этой проблемы в модель можно включить дополнительный столбец с типом содержимого DISCRETZED.
Модель ИАД содержит столбцы из структуры, которые помечены как входы или выходы, и указание на используемый алгоритм. Для этого в модель включается ключ структуры ИАД и ключи вложенных таблиц. Простейший способ включения модели в структуру реализуется по умолчанию.

<<< < Предыдущая 20 21 22 23 24 25 26 27 28 29 30 31 3233 / 4433 34 35 36 37 38 39 40 41 42 43 44 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.07.2025442.37 Кб0kultorologia_ekzamen (1).doc
#
01.05.2025184.06 Кб1kultorologiya_tsila.docx
#
23.02.20161.22 Mб98kultura1.doc
#
23.02.20162.09 Mб122kulturologiyamarina.doc
#
23.02.20161.31 Mб21kult_lenina.pdf
#
01.03.202523.54 Mб1kurs.rtf
#
01.07.2025691.2 Кб0kursach_112.doc
#
01.05.20256.8 Mб3kursak_elektrikiv.doc
#
19.11.2019331.26 Кб5Kursova finish.doc
#
23.02.2016135.17 Кб15kursova.doc
#
01.05.2025333.31 Кб0Kursova.doc