Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Казахский национальный технический университет им. К. И. Сатпаева

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

LR_IAD_rus_2016.docx

Скачиваний:

Добавлен:

01.07.2025

Размер:

606.78 Кб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 1213 / 2113 14 15 16 17 18 19 20 21 > Следующая >>>

Контрольные вопросы

1. В чем состоит задача кластеризации? Приведите практический пример?

2. Что такое обучение с учителем и без учителя? К какому типу относится задача кластеризации?

3. Задача кластеризации относится к описательным или предсказательным и почему?

4. Чем определяется «схожесть» объектов при решении задачи кластеризации?

5. Что такое одноуровневая и иерархическая кластеризация?

6. Что такое четкая и нечеткая кластеризация?

7. Какие есть подходы к расчету расстояния между кластерами?

8. Алгомеративная и дивизимная иерархическая кластеризация?

9. Опишите один из рассмотренных методов, решающих задачу кластеризации?

10. Как оценить качество построенной модели для задачи кластеризации?

Содержание отчета

1. Тема и цель работы

2. Задание к работе.

3. Результаты выполнения заданий раздела 4.3.

4. Ответы на контрольные вопросы.

5. Выводы, отображающие критический анализ результатов выполнения работы.

Поиск ассоциативных правил

Цель работы

На практике изучить работу алгоритмов поиска ассоциативных правил и научиться интерпретировать результаты их работы.

Основные теоретические сведения

В лабораторной работе рассматриваются два метода поиска ассоциативных правил:

алгоритм Apriori;
алгоритм FPGrowth.

Параметры настройки алгоритмов

Рассмотрим параметры настройки используемых алгоритмов поиска ассоциативных правил в WEKA (табл. 5.1).

Таблица 5.1 – Параметры настройки методов кластеризации

Метод	Параметры
Apriori	car – поиск классовых (со значением целевого атрибута в правой части) или обычных ассоциативных правил. classIndex – индекс целевого атрибута. Если установлено значение -1, будет выбран последний атрибут. delta – итеративно уменьшать значение порога поддержки на данное значение. Уменьшение будет происходить до тех пор, пока не будет достигнуто минимальное значение поддержки или не будет сгенерировано заданное количество правил lowerBoundMinSupport – нижняя граница порога поддержки. metricType – устанавливает тип метрики, по которой будут ранжироваться правила (Confidence, Lift, Leverage, Conviction). minMetric – минимальное пороговое значение для выбранной метрики. numRules – количество правил, которые необходимо найти. outputItemSets – выводить ли частые наборы. removeAllMissingCols – убирать ли колонки (атрибуты) в которых все значения отсутствуют. significanceLevel – уровень значимости (только для достоверности). upperBoundMinSupport – верхняя граница минимальной поддержки. Итеративное уменьшение поддержки начинается с этого значения.
FPGrowth	delta – итеративно уменьшать значение порога поддержки на данное значение. Уменьшение будет происходить до тех пор, пока не будет достигнуто минимальное значение поддержки или не будет сгенерировано заданное количество правил findAllRulesForSupportLevel – найти все правила, которые удовлетворяют нижней границе минимального значения поддержки и минимального значения метрики. Включение этого режима отменить выполнение итеративного уменьшения поддержки для нахождения заданного количества правил. lowerBoundMinSupport - нижняя граница порога поддержки как доля количества экземляров. maxNumberOfItems – максимальное количество экземпляров в частом наборе; значение -1 означает без ограничений. metricType – устанавливает тип метрики, по которой будут ранжироваться правила. minMetric – минимальное пороговое значение для выбранной метрики. numRulesToFind – количество правил, которые необходимо найти. positiveIndex – устанавливает индекс бинарного атрибута, который будет рассматриваться как позитивный. rulesMustContain – выводить правила, которые содержат заданные объекты (список объектов, разделенных запятой). transactionsMustContain – для работы алгоритма использовать транзакции (экземпляры), которые содержат заданные объекты . upperBoundMinSupport – верхняя граница минимальной поддержки. Итеративное уменьшение поддержки начинается с этого значения. useORForMustContainList – использовать логическую связку «или» вместо «и» для списков обязательных элементов в транзакциях и правилах.

Метод

Параметры

Apriori

car – поиск классовых (со значением целевого атрибута в правой части) или обычных ассоциативных правил.

classIndex – индекс целевого атрибута. Если установлено значение -1, будет выбран последний атрибут.

delta – итеративно уменьшать значение порога поддержки на данное значение. Уменьшение будет происходить до тех пор, пока не будет достигнуто минимальное значение поддержки или не будет сгенерировано заданное количество правил

lowerBoundMinSupport – нижняя граница порога поддержки.

metricType – устанавливает тип метрики, по которой будут ранжироваться правила (Confidence, Lift, Leverage, Conviction).

minMetric – минимальное пороговое значение для выбранной метрики.

numRules – количество правил, которые необходимо найти.

outputItemSets – выводить ли частые наборы.

removeAllMissingCols – убирать ли колонки (атрибуты) в которых все значения отсутствуют.

significanceLevel – уровень значимости (только для достоверности).

upperBoundMinSupport – верхняя граница минимальной поддержки. Итеративное уменьшение поддержки начинается с этого значения.

FPGrowth

findAllRulesForSupportLevel – найти все правила, которые удовлетворяют нижней границе минимального значения поддержки и минимального значения метрики. Включение этого режима отменить выполнение итеративного уменьшения поддержки для нахождения заданного количества правил.

lowerBoundMinSupport - нижняя граница порога поддержки как доля количества экземляров.

maxNumberOfItems – максимальное количество экземпляров в частом наборе; значение -1 означает без ограничений.

metricType – устанавливает тип метрики, по которой будут ранжироваться правила.

minMetric – минимальное пороговое значение для выбранной метрики.

numRulesToFind – количество правил, которые необходимо найти.

positiveIndex – устанавливает индекс бинарного атрибута, который будет рассматриваться как позитивный. rulesMustContain – выводить правила, которые содержат заданные объекты (список объектов, разделенных запятой).

transactionsMustContain – для работы алгоритма использовать транзакции (экземпляры), которые содержат заданные объекты .

useORForMustContainList – использовать логическую связку «или» вместо «и» для списков обязательных элементов в транзакциях и правилах.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 1213 / 2113 14 15 16 17 18 19 20 21 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.07.2025493.99 Кб1Lektsii_Ocnovy_Ekonomicheskoy_Teorii_1-8_R_O (1).docx
#
13.03.20151.52 Mб308lektsii_po_metod_issled_i_kontr_mater.doc
#
01.07.20253.05 Mб28Lektsionny_material.doc
#
01.07.202530.99 Кб1lektsiya 4.docx
#
13.03.2015107.01 Кб30lessons_darbuka.doc
#
01.07.2025606.78 Кб1LR_IAD_rus_2016.docx
#
01.07.2025104.69 Кб0Lukach_Struktura_oborotnikh_koshtiv_turistichno...docx
#
13.03.20153.42 Mб14M-u_KhOiVMS_rus.doc
#
01.05.20251.15 Mб0Macromedia Flash .docx
#
13.03.2015410.14 Кб81Mad bounce II.pdf
#
01.05.2025206.85 Кб1Malik Dastin.doc