Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лабораторные ИтУ BI.doc
Скачиваний:
3
Добавлен:
01.04.2025
Размер:
329.22 Кб
Скачать

3. Порядок выполнения работы

Продолжим пример, рассмотренный в первой лабораторной, посвященной нейронным сетям. Всех заемщиков можно разделить на два класса – кредитоспособных и некредитоспособных. Очевидно, существуют некоторые правила отнесения заемщиков к тому или иному классу. Но при достаточно большом числе выбранных характеристик вручную практически невозможно определить эти правила.

Решить эту задачу позволяют деревья решений.

1. Обучающая выборка, а так же правила получения обучающего и тестового множества будут теми же, что и в примере с нейросетями. Нормализацию полей оставим заданной по умолчанию в программе.

2. При построении правил зададим минимальное количество примеров, при котором будет создан новый узел равным 10. Будем строить дерево с более достоверными правилами в ущерб сложности.

3. Полученное дерево решений содержит 20 узлов и 11 правил (рис.4).

Рисунок 4. Дерево решений

Такое дерево содержит в себе правила, следуя которым можно отнести заемщика в одну из групп риска и сделать вывод о выдаче кредита. Правила читаются с узлов, расположенных правее. Например, если сумма кредита меньше 24000 и срок проживания меньше 11, тогда выдать кредит.

Следует заметить, что характеристики, лежащие ближе к вершине дерева, то есть левее, являются более значимыми.

Выполните команды Показать источник данных (F4) и показать информацию по узлу (F12).

4. Построенные правила можно также просмотреть в виде списка правил (таблица 6).

Таблица 6

Условие

Решение (Давать кредит)

Поддержка

Достоверность

%

Кол-во

%

Кол-во

1

Сумма кредита < 24000 И Срок проживания < 11

Да

10,56

15

86,67

13

2

Сумма кредита < 24000 И Срок проживания >= 11 И Сумма кредита < 13750 И Сумма кредита < 6250

Нет

9,86

14

57,14

8

3

Сумма кредита < 24000 И Срок проживания >= 11 И Сумма кредита < 13750 И Сумма кредита >= 6250 И

Сумма кредита < 9250

Да

7,75

11

100

11

5. Как и для нейросети, общее количество правильно классифицированных примеров можно посмотреть в таблице сопряженности.

4. Содержание отчёта

  1. Название и цель работы.

  2. Исходные данные.

  3. Параметры обучения дерева решений.

  4. Дерево решений с источником данных и информацией по узлу.

  5. Форма «Что-если» с графиком.

  6. Таблица сопряжённости.

  7. Значимость атрибутов.

  8. Правила.

  9. Интерпретация полученной модели.

5. Вопросы

1. В чём суть метода дерева решений?

2. Как влияют параметры обучения дерева решений на результаты?

3. Для чего служит визуализатор Значимость атрибутов?

4. Какие задачи можно решать с помощью дерева решений?

6. Литература

  1. Deductor Studio Руководство аналитика

  2. Нечёткие гибридные системы. Теория и практика / Под ред. Н.Г. Ярушкиной –М.:ФИЗМАТЛИТ, 2007.