Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Черновицкий национальный университет им. Ю. Федьковича

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

kurs.rtf

Скачиваний:

Добавлен:

01.03.2025

Размер:

23.54 Mб

Скачать

☆

<<< < Предыдущая 20 21 22 23 24 25 26 27 28 29 30 3132 / 4432 33 34 35 36 37 38 39 40 41 42 43 44 > Следующая >>>

Синтаксис запросов dmx

Процедура построения модели ИАД в целом похожа на процедуру создания таблиц данных в реляционной БД. Синтаксис языка более прост по сравнению с синтаксисом языка SQL. Рассмотрим листинг 13.1 создания структуры ИАД со столбцами TeacherID, FamilyName, Name, Age, AcademStatus, AcademDegree.

CREATE MINING STRUCTURE [Teacher1]

{

[TeacherID] LONG KEY,

[FamilyName] TEXT DISCRETE,

[Name] TEXT DISCRETE,

[Age] LONG CONTINUOUS,

[AcademStatus] TEXT DISCRETE,

[AcademDegree] TEXT DISCRETE

}

Столбец TeacherID является ключом структуры. Столбцы TeacherID, Age являются длинными целыми, а столбцы FamilyName, Name, AcademStatus, AcademDegree – строками с текстом. ИАД предполагает обязательное задание типа столбца. Тип содержимого столбца служит указанием движку ИАД об особенностях обработки данных столбца, который является либо категориальным, либо непрерывным. Существенными элементами рассматриваемой инструкции DMX являются имя структуры и список столбцов. Поддерживаемые типы данных и содержимого приведены в таблице 14.1

Таблица 14.1 Типы данных и содержимого

Типы данных	Типы содержимого
LONG	KEY
DOUBLE	DISCRETE
TEXT	CONTINUOUS
DATE	DISCRETIZED
BOOLEAN	KEY TIME
TABLE	KEY SEQUENCE

Тип содержимого KEY TIME используется в моделях временных рядов, KEY SEQUENCE – моделях кластеризации последовательностей во вложенных таблицах. Тип содержимого столбца DISCRETIZED является параметризированным. По умолчанию из данных с этим типом содержимого столбца создаётся пять сегментов. Если данных в столбце на пять сегментов не хватает, то осуществляется попытка создать сегментов меньше. Процессом формирования сегментов можно управлять с использованием методов:

EQUAL_AREAS – создаёт сегменты с равным количеством значений;
CLUSTERS – выявляет области сгруппированных точек посредством одномерной кластеризации;
AUTOMATIC – вначале задача решается методом EQUAL_AREAS, в случае отсутствия результата – методом CLUSTERS.

Разделение данных на обучающие и проверочные наборы может выполняться автоматически при задании в структуре ИАД процента данных для проверки. Данные, не используемые для проверки, применяют в процедуре обучения модели. В листинге 14.2 содержится определение структуры с резервированием для проверки 25 процентов данных, но не более 500.

CREATE MINING STRUCTURE [Teacher2]

{

[TeacherID] LONG KEY,

[FamilyName] TEXT DISCRETE,

[Name] TEXT DISCRETE,

[Age] LONG CONTINUOUS,

[AgeDisc] DISCRETIZED 9EQUAL AREAS, 3)

[AcademStatus] TEXT DISCRETE,

[AcademDegree] TEXT DISCRETE

} WITH HOLDOUT ( 25 PERCENT OR 500 CASES)

Случайный порядок отбора вариантов обеспечивается включением в конструкцию слова HOLDOUT.

Вложенные таблицы с типом данных TABLE позволяют реализовать более сложные сценарии ИАД. Вложенная таблица определяется также как и структура с использованием названия и списка столбцов. В отличие от структуры ИАД, вложенные таблицы содержат только один ключ (Листинг 14.3).

CREATE MINING STRUCTURE [Teacher3]

{

[TeacherID] LONG KEY,

[FamilyName] TEXT DISCRETE,

[Name] TEXT DISCRETE,

[Age] LONG CONTINUOUS,

[AgeDisc] DISCRETIZED (EQUAL AREAS, 3)

[AcademStatus] TEXT DISCRETE,

[AcademDegree] TEXT DISCRETE

[TeachingLoad] TABLE

{

[Discipline] TEXT KEY,

[Quantity] LONG CONTINUOUS

}

Вложенная таблица TeachingLoad (Учебная нагрузка) содержит вложенный ключ Discipline (Дисциплина), который указывает объект вложенной строки. Столбец Quantity (Количество часов), относится к объекту, упомянутому в этом столбце.

<<< < Предыдущая 20 21 22 23 24 25 26 27 28 29 30 3132 / 4432 33 34 35 36 37 38 39 40 41 42 43 44 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.07.2025442.37 Кб0kultorologia_ekzamen (1).doc
#
01.05.2025184.06 Кб1kultorologiya_tsila.docx
#
23.02.20161.22 Mб98kultura1.doc
#
23.02.20162.09 Mб122kulturologiyamarina.doc
#
23.02.20161.31 Mб21kult_lenina.pdf
#
01.03.202523.54 Mб1kurs.rtf
#
01.07.2025691.2 Кб0kursach_112.doc
#
01.05.20256.8 Mб3kursak_elektrikiv.doc
#
19.11.2019331.26 Кб5Kursova finish.doc
#
23.02.2016135.17 Кб15kursova.doc
#
01.05.2025333.31 Кб0Kursova.doc