Отчет_Лаба4_ИИ_и_МО_Алексеева
.docУфимский государственный авиационный технический университет
ОТЧЕТ по лабораторной работе №4
по дисциплине:
«Искусственный интеллект и машинное обучение»
на тему:
«Методы классификации.»
Выполнил: бакалавр гр. ПРО-223
Алексеева А.В.
Исламгареев И. Д.
Проверил: Юдинцев Богдан Сергеевич
1. Цель работы
Получить следующие знания, умения и навыки:
изучить понятие и методы классификации;
научиться реализовывать метод классификации с помощью логистической регрессии, используя различные инструменты (например, ПП «Deductor Studio»)
2. Задание
Реализовать бинарную классификацию с помощью логистической регрессии. Исходные данные должны иметь не менее 300 наблюдений, зависимая переменная должна принимать бинарные значения (0 и 1), независимые данные могут быть как количественными, так и
качественными. Проанализировать изменения в классификации в зависимости от способа разделения исходного множества на тестовое и обучающее и параметров метода, параметров отбора переменных в регрессионные модели, параметров построения регрессионной модели, параметров калибровки лог-регрессионной модели, параметров преобразования. Реализация метода в ПП «Deductor Studio» представлена в методических указаниях.
3. Теоретические основы
Решение задач предсказательной аналитики требует высокой квалификации от пользователя. Требуется хорошо владеть не только методами преобразования данных, но и знать аналитические алгоритмы. Довольно много бизнес-задач сводятся к построению модели бинарного классификатора (будут просрочки по кредиту или нет, покинет клиент компанию или останется и т. д.). Популярным и хорошо изученным математическим инструментом для создания бинарных классификаторов является логистическая регрессии. Кроме того, данный инструмент позволяет получать вероятностные оценки наступления интересующего события и оценивать качество модели специальными метрикам - AUC, KS, Gini и другие.
4. Результат выполнения работы
Рисунок 1 Импорт данных
Рисунок 2 Формирование целевой переменной
Рисунок 3 Настройка наборов данных (статистика)
Рисунок 4 Оценка качества данных
Рисунок 5 Заполнение пропущенных данных
Рисунок 6 Разбиение на множества
Рисунок 7 Разбиение на множества
Рисунок 8 Корреляционный анализ
Рисунок 9 настройка набора данных ( признак тестового множества)
Рисунок 10 Фильтр с условием Признак тестового множества = ложь
Рисунок 11 Настройка узла Конечные классы
Рисунок 12 Фильтр признак тестового множества = истина
Рисунок 13 Скрипт
Рисунок 14 Объединение
Рисунок 15 Логистическая регрессия (отчет)
Рисунок 16 Коэффициенты регрессии
Рисунок 17 Качество классификации
5. Вывод
Получили следующие знания, умения и навыки:
• изучили понятие и методы классификации;
• научились реализовывать метод классификации с помощью логистической регрессии, используя различные инструменты (например, ПП «Deductor Studio»)
Уфа – 2020