
ИИС_5
.docxГУАП
КАФЕДРА № 82
ОТЧЕТ ЗАЩИЩЕН С ОЦЕНКОЙ
ПРЕПОДАВАТЕЛЬ
доцент, канд. техн. наук |
|
|
|
А.Д. Державина |
должность, уч. степень, звание |
|
подпись, дата |
|
инициалы, фамилия |
ОТЧЕТ О ЛАБОРАТОРНОЙ РАБОТЕ №5 |
ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ. МЕТОД ДЕРЕВЬЕВ ПРИНЯТИЯ РЕШЕНИЙ |
по курсу: ИНТЕЛЛЕКТУАЛЬНЫЕ ИНФОРМАЦИОННЫЕ СИСТЕМЫ |
|
РАБОТУ ВЫПОЛНИЛ
СТУДЕНТ гр. № |
4116 |
|
|
|
|
|
|
|
подпись, дата |
|
инициалы, фамилия |
Санкт-Петербург 2024
Цель работы: изучить пример предложенного разработчиками RM по использованию модели метода деревьев решений для анализа данных. Построить модель дерева решений для своего набора данных.
Ход работы
Запущен процесс создание дерева принятия решения на основе встроенного набора данных Golf (Рисунок 1-4).
Рисунок 1 - Набор данных Golf
Рисунок 2 – Процесс создания модели дерева принятия решений
Рисунок 3 – Описание модели
Рисунок 4 – Результат запущенного процесса
Исходя из полученного дерева решений можно сказать, что корневой узел - признак Outlook (погода). Если погода пасмурная, то игра состоится. Если погода дождливая, то проводится дальнейшее разделение, ветра нет - игра будет, ветер есть – игры не будет. Если погода солнечная рассматривается уровень влажности, если Humidity > 77.5%, игры не будет, если Humidity ≤ 77.5%, игра будет.
Далее выбран набор данных для прогнозирования кликов по рекламе (Рисунок 5). К выбранному набору данных применен метод принятия решений (Рисунок 6-8).
Рисунок 5– Набор данных click
Рисунок 6- Процесс создания дерева принятия решений
Рисунок 7 – Полученное дерево принятия решений
Рисунок 8- Описание дерева принятия решений
Дерево помогает понять, какие факторы больше влияют на целевой результат.
Вывод: исследована работа метода построения деревьев принятия решений для анализа данных. Построена модель дерева решений для импортированного набора данных.
Ответы на контрольные вопросы:
Что такое дерево решений?
Деревья решений – это способ представления правил в иерархической, последовательной структуре, где каждому объекту соответствует единственный узел, дающий решение.
Какие три типа задач решаются методом деревьев решений?
Описание данных, регрессия, классификация
Какие существуют алгоритмы, реализующие деревья решений?
CART, C4.5, NewId, ITrule, CHAID, CN2
Какие критерии разбиения узлов дерева вам известны?
Теоретико-информационный критерий, статистический критерий
Преимущества использования деревьев решений?
быстрый процесс обучения;
генерация правил в областях, где эксперту трудно формализовать свои знания;
извлечение правил на естественном языке;
интуитивно понятная классификационная модель;
высокая точность прогноза, сопоставимая с другими методами (статистика, нейронные сети);
построение непараметрических моделей.