Лаба_3_2
.docxМИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
Федеральное государственное автономное образовательное учреждение высшего образования
«САНКТ-ПЕТЕРБУРГСКИЙ УНИВЕРСИТЕТ АЭРОКОСМИЧЕСКОГО ПРИБОРОСТРОЕНИЯ»
КАФЕДРА № 82
ОТЧЕТ ЗАЩИЩЕН С ОЦЕНКОЙ
ПРЕПОДАВАТЕЛЬ
доцент |
|
|
|
В.С. Блюм |
должность, уч. степень, звание |
|
подпись, дата |
|
инициалы, фамилия |
ОТЧЕТ О ЛАБОРАТОРНОЙ РАБОТЕ №3 |
Метод деревьев принятия решений
|
по курсу: Интеллектуальные информационные системы |
|
|
РАБОТУ ВЫПОЛНИЛ
СТУДЕНТ ГР. № |
4616 |
|
|
|
А.В.Павлов |
|
|
|
подпись, дата |
|
инициалы, фамилия |
Санкт-Петербург 2019
Цель работы: Метод деревьев принятия решений
Ход работы:
Деревья решений – это способ представления правил в иерархической, последовательной структуре, где каждому объекту соответствует единственный узел, дающий решение
Рисунок 1 – Схема дерева решений
Рассмотрим готовый пример с Decision Tree.
Рисунок 2 – Decision Tree
Далее используем таблицу deals для создания дерева решений.
Рисунок 3 – Таблица deals
Рисунок 4 – Процесс создания
Рисунок 5 – Результат работы Decision Tree для таблицы продуктов
Рисунок 6 – Описательный результат
Из полученных результатов можно сделать вывод о том что, покупатели вне зависимости от пола, которые покупают с помощью кредитной карты чаще становиться будущими посетителями. В то время как при использование наличными или чеком, женщины меньше 31 года, не становиться будущими посетителями в отличии от мужчин
Далее рассмотрим ID3 для наших данных, а именно таблицы со списком покупок в разных городах и со значениями пола, категории продукта, типа оплаты и цены товара, является ли он членом магазина(есть ли карта магазина)
Оставим в ней только нужные данные с помощью Select Attributes и отсортируем их
Рисунок 7 - Таблица со списком покупок
Рисунок 8 – Настройка процесса ID3
Рисунок 9 – Результат работы ID3
Из полученного графа можно сделать следующий вывод. Для города Naypyitaw. Для людей которые имеют членство в магазине ( карту магазина ), цена продуктовой корзины отличается во много раз в зависимости от типа оплаты. Например. Мужчина участник потратил 56 у.е в то время как другом мужчина обычный покупатель купил на 30 у.е за наличные. Для кредитной карты показатели очень похожее. Таким образом можно сделать вывод, что покупатели с членской картой тратят в магазине гораздо больше чем обычные покупатели.
Вывод: В ходе лабораторной работы мы ознакомились с методами деревьев принятий решений. Посмотрели встроенные данные, которые есть по умолчанию в RapidMiner, а так же загрузили свои данные и обработали их с помощью деревьев принятий решений, сделали вывод из полученных решений.
Контрольные вопросы:
-
Деревья решений – это способ представления правил в иерархической, последовательной структуре, где каждому объекту соответствует единственный узел, дающий решение
-
Задачи классификации(отнесения объектов к одному из заранее известных классов), задачи численного прогнозирования (предсказания значений целевой переменной) – решаются методом деревьев решений и хранение данных в сжатом виде
-
Существуют следующие алгоритмы для построения деревьев решений - разделения и захвата, обучением с учителем, CART, C4.5, NewId, ITrule, CHAID, CN2 и т.д.
-
Разбиение узлом может происходит по следующим критериям – теоретико-информационный и статический
-
Преимущества использования деревьев решений следующие – высокая точность прогноза, быстрый процесс обучения, генерация правил в областях, где эксперту трудно формализовать свои знания, извлечение правил на естественном языке, интуитивно понятная классификационная модель.