- •Лабораторна робота №3 з дисципліни:
- •Перевірив:
- •1. Створений файл Roma.Arff для роботи з визначення товарів, які необхідно закупити супермаркетом.
- •Побудова моделі Decision Tree Mining Model:
- •Побудова моделі Hierarchical Clustering Mining Model
- •Контрольні питання
- •1. Які проблеми виникають з вхідними даними.
- •2. Чому для одних і тих же даних не можуть бути побудовані всі види моделей.
- •3. Які вимоги на вхідні дані накладають різні алгоритми data mining.
- •4. Які параметри необхідно налаштувати для побудови асоціативних правил. Як від них залежить результат (побудована модель).
- •5. Які параметри необхідно налаштувати для побудови дерева рішень. Як від них залежить результат (побудована модель).
- •6. Які параметри необхідно налаштувати для виконання кластеризації. Як від них залежить результат (побудована модель).
МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИ
КИЇВСЬКИЙ НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ ІМЕНІ ВАДИМА ГЕТЬМАНА
Кафедра інформаційних систем в економіці
Лабораторна робота №3 з дисципліни:
«Інтелектуальний аналіз даних»
Використання інструменту Xelopes для аналізу та рішень щодо отримання іпотечного кредиту
Виконав:
Студент 4 курсу, ФІСІТ,
6101, групи
Прасад А.Н.
Перевірив:
к.т.н., доц. Іванченко Г.Ф.
Київ 2011
Задача:
Аналіз та облік надання кредиту.
Мета:
Так, як ми маємо дані про відсоткову ставку, період надання , прописка, кредитна історія необхідно визначити, які особи можуть отримати кредит.
1. Створений файл Roma.Arff для роботи з визначення товарів, які необхідно закупити супермаркетом.
Файл поділяється на 2 часті заголовок і дані.
@relation systema_pogshennya.symbolic
@attribute процентная_ставка {высокая, средняя, низкая}
@attribute период_предоставления{десять_лет,двадцать_лет,тридцать_лет}
@attribute прописка {киевская, не_киевская}
@attribute история_клиента {позитивная,негативная,отсутствует}
@attribute ипотечный_кредит {давать,не_давать}
Дані
@data
высокая,десять_лет,не_киевская,негативная,не_давать
высокая,двадцать_лет,киевская,негативная,не_давать
высокая,тридцать_лет,киевская,позитивная,давать
средняя,двадцать_лет, не_киевская,негативная,не_давать
средняя,десять_лет,не_киевская,отсутствует,не_давать
средняя,тридцать_лет,киевская,позитивная,давать
низкая,тридцать_лет,киевская,позитивная,давать
низкая,двадцать_лет,не_киевская,негативная,не_давать
низкая,десять_лет,не_киевская,негативная,не_давать
высокая,десять_лет,киевская,позитивная,давать
высокая,двадцать_лет,киевская,позитивная,давать
средняя,тридцать_лет,киевская,позитивная,давать
средняя,тридцать_лет,не_киевская,отсутствует,не_давать
низкая,десять_лет,не_киевская,негативная,не_давать
-
Результат завантаження даних з файлу Roma.arff в Xelopes:
Рис. Відображення даних з файлу Ro,a.arff при використанні Display Data Grid в табличному вигляді
-
Інформація про атрибути даних
Рис. Інформація категоріальному атрибуті
-
Статистична інформація про дані:
-
Побудова моделі модель Association Rules Mining Model.
Рис. Налаштування для побудови моделі - Association Rules Mining Model
Рис. Association Rules Mining Model
Представлення моделі в PMML форматі:
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE PMML PUBLIC "pmml20.dtd" "pmml20.dtd">
<PMML version="2.0">
<Header copyright="Copyright (c) 2003 prudsys AG" description="Xelopes mining model. See www.zsoft.ru or www.prudsys.com">
<Application version="1.1" name="Xelopes" />
<Timestamp>2011-11-29 10:20:15 GMT</Timestamp>
</Header>
<DataDictionary numberOfFields="5">
<DataField displayName="процентная_ставка" name="процентная_ставка" isCyclic="0" optype="categorical">
<Value displayValue="высокая" property="valid" value="высокая" />
<Value displayValue="средняя" property="valid" value="средняя" />
<Value displayValue="низкая" property="valid" value="низкая" />
</DataField>
<DataField displayName="период_предоставления" name="период_предоставления" isCyclic="0" optype="categorical">
<Value displayValue="десять_лет" property="valid" value="десять_лет" />
<Value displayValue="двадцать_лет" property="valid" value="двадцать_лет" />
<Value displayValue="тридцать_лет" property="valid" value="тридцать_лет" />
</DataField>
<DataField displayName="прописка" name="прописка" isCyclic="0" optype="categorical">
<Value displayValue="киевская" property="valid" value="киевская" />
<Value displayValue="не_киевская" property="valid" value="не_киевская" />
</DataField>
<DataField displayName="история_клиента" name="история_клиента" isCyclic="0" optype="categorical">
<Value displayValue="позитивная" property="valid" value="позитивная" />
<Value displayValue="негативная" property="valid" value="негативная" />
<Value displayValue="отсутствует" property="valid" value="отсутствует" />
</DataField>
<DataField displayName="ипотечный_кредит" name="ипотечный_кредит" isCyclic="0" optype="categorical">
<Value displayValue="давать" property="valid" value="давать" />
<Value displayValue="не_давать" property="valid" value="не_давать" />
</DataField>
</DataDictionary>
<AssociationModel minimumConfidence="0.0" numberOfRules="12" minimumSupport="0.0" itemIdName="период_предоставления" numberOfTransactions="3" algorithmName="associationRules" numberOfItemsets="7" modelName="Association rules" functionName="associationRules" transactIdName="процентная_ставка" numberOfItems="3">
<MiningSchema>
<MiningField missingValueTreatment="asIs" name="процентная_ставка" outliers="asIs" usageType="active" />
<MiningField missingValueTreatment="asIs" name="период_предоставления" outliers="asIs" usageType="active" />
<MiningField missingValueTreatment="asIs" name="прописка" outliers="asIs" usageType="supplementary" />
<MiningField missingValueTreatment="asIs" name="история_клиента" outliers="asIs" usageType="supplementary" />
<MiningField missingValueTreatment="asIs" name="ипотечный_кредит" outliers="asIs" usageType="supplementary" />
</MiningSchema>
<Item value="десять_лет" id="0" />
<Item value="двадцать_лет" id="1" />
<Item value="тридцать_лет" id="2" />
<Itemset numberOfItems="1" support="1.0" id="id1">
<ItemRef itemRef="0" />
</Itemset>
<Itemset numberOfItems="2" support="1.0" id="id2">
<ItemRef itemRef="0" />
<ItemRef itemRef="1" />
</Itemset>
<Itemset numberOfItems="3" support="1.0" id="id3">
<ItemRef itemRef="0" />
<ItemRef itemRef="1" />
<ItemRef itemRef="2" />
</Itemset>
<Itemset numberOfItems="2" support="1.0" id="id4">
<ItemRef itemRef="0" />
<ItemRef itemRef="2" />
</Itemset>
<Itemset numberOfItems="1" support="1.0" id="id5">
<ItemRef itemRef="1" />
</Itemset>
<Itemset numberOfItems="2" support="1.0" id="id6">
<ItemRef itemRef="1" />
<ItemRef itemRef="2" />
</Itemset>
<Itemset numberOfItems="1" support="1.0" id="id7">
<ItemRef itemRef="2" />
</Itemset>
<AssociationRule confidence="1.0" support="1.0" consequent="id1" antecedent="id5" />
<AssociationRule confidence="1.0" support="1.0" consequent="id5" antecedent="id1" />
<AssociationRule confidence="1.0" support="1.0" consequent="id1" antecedent="id6" />
<AssociationRule confidence="1.0" support="1.0" consequent="id2" antecedent="id7" />
<AssociationRule confidence="1.0" support="1.0" consequent="id4" antecedent="id5" />
<AssociationRule confidence="1.0" support="1.0" consequent="id5" antecedent="id4" />
<AssociationRule confidence="1.0" support="1.0" consequent="id6" antecedent="id1" />
<AssociationRule confidence="1.0" support="1.0" consequent="id7" antecedent="id2" />
<AssociationRule confidence="1.0" support="1.0" consequent="id1" antecedent="id7" />
<AssociationRule confidence="1.0" support="1.0" consequent="id7" antecedent="id1" />
<AssociationRule confidence="1.0" support="1.0" consequent="id5" antecedent="id7" />
<AssociationRule confidence="1.0" support="1.0" consequent="id7" antecedent="id5" />
</AssociationModel>