
- •Информационные технологии управления
- •Лабораторная работа №1. Нейронные сети.
- •1. Цель работы
- •2. Общие сведения
- •3. Порядок выполнения работы
- •4. Содержание отчёта
- •5. Вопросы
- •6. Литература
- •Лабораторная работа №2. Деревья решений.
- •1. Цель работы
- •2. Общие сведения
- •3. Порядок выполнения работы
- •4. Содержание отчёта
- •5. Вопросы
- •6. Литература
- •Лабораторная работа №3. Карты Кохонена.
- •1. Цель работы
- •2. Общие сведения
- •3. Порядок выполнения работы
- •4. Содержание отчета
- •5. Вопросы
- •6. Литература
- •Лабораторная работа №4. Ассоциативные правила.
- •1. Цель работы
- •2. Общие сведения
- •3. Порядок выполнения
- •4. Содержание отчета
- •5. Вопросы
- •6. Литература
- •Информационные технологии управления: Методические рекомендации к лабораторным работам.
3. Порядок выполнения работы
Продолжим пример, рассмотренный в первой лабораторной, посвященной нейронным сетям. Всех заемщиков можно разделить на два класса – кредитоспособных и некредитоспособных. Очевидно, существуют некоторые правила отнесения заемщиков к тому или иному классу. Но при достаточно большом числе выбранных характеристик вручную практически невозможно определить эти правила.
Решить эту задачу позволяют деревья решений.
1. Обучающая выборка, а так же правила получения обучающего и тестового множества будут теми же, что и в примере с нейросетями. Нормализацию полей оставим заданной по умолчанию в программе.
2. При построении правил зададим минимальное количество примеров, при котором будет создан новый узел равным 10. Будем строить дерево с более достоверными правилами в ущерб сложности.
3. Полученное дерево решений содержит 20 узлов и 11 правил (рис.4).
Рисунок 4. Дерево решений
Такое дерево содержит в себе правила, следуя которым можно отнести заемщика в одну из групп риска и сделать вывод о выдаче кредита. Правила читаются с узлов, расположенных правее. Например, если сумма кредита меньше 24000 и срок проживания меньше 11, тогда выдать кредит.
Следует заметить, что характеристики, лежащие ближе к вершине дерева, то есть левее, являются более значимыми.
Выполните команды Показать источник данных (F4) и показать информацию по узлу (F12).
4. Построенные правила можно также просмотреть в виде списка правил (таблица 6).
Таблица 6
№ |
Условие |
Решение (Давать кредит) |
Поддержка |
Достоверность |
||
% |
Кол-во |
% |
Кол-во |
|||
1 |
Сумма кредита < 24000 И Срок проживания < 11 |
Да |
10,56 |
15 |
86,67 |
13 |
2 |
Сумма кредита < 24000 И Срок проживания >= 11 И Сумма кредита < 13750 И Сумма кредита < 6250 |
Нет |
9,86 |
14 |
57,14 |
8 |
3 |
Сумма кредита < 24000 И Срок проживания >= 11 И Сумма кредита < 13750 И Сумма кредита >= 6250 И Сумма кредита < 9250 |
Да |
7,75 |
11 |
100 |
11 |
5. Как и для нейросети, общее количество правильно классифицированных примеров можно посмотреть в таблице сопряженности.
4. Содержание отчёта
Название и цель работы.
Исходные данные.
Параметры обучения дерева решений.
Дерево решений с источником данных и информацией по узлу.
Форма «Что-если» с графиком.
Таблица сопряжённости.
Значимость атрибутов.
Правила.
Интерпретация полученной модели.
5. Вопросы
1. В чём суть метода дерева решений?
2. Как влияют параметры обучения дерева решений на результаты?
3. Для чего служит визуализатор Значимость атрибутов?
4. Какие задачи можно решать с помощью дерева решений?
6. Литература
Deductor Studio Руководство аналитика
Нечёткие гибридные системы. Теория и практика / Под ред. Н.Г. Ярушкиной –М.:ФИЗМАТЛИТ, 2007.