Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Отчет_Лаба4_ИИ_и_МО_Алексеева

.doc
Скачиваний:
12
Добавлен:
19.01.2023
Размер:
5.65 Mб
Скачать

Уфимский государственный авиационный технический университет

ОТЧЕТ по лабораторной работе №4

по дисциплине:

«Искусственный интеллект и машинное обучение»

на тему:

«Методы классификации.»

Выполнил: бакалавр гр. ПРО-223

Алексеева А.В.

Исламгареев И. Д.

Проверил: Юдинцев Богдан Сергеевич

1. Цель работы

Получить следующие знания, умения и навыки:

  • изучить понятие и методы классификации;

  • научиться реализовывать метод классификации с помощью логистической регрессии, используя различные инструменты (например, ПП «Deductor Studio»)

2. Задание

Реализовать бинарную классификацию с помощью логистической регрессии. Исходные данные должны иметь не менее 300 наблюдений, зависимая переменная должна принимать бинарные значения (0 и 1), независимые данные могут быть как количественными, так и

качественными. Проанализировать изменения в классификации в зависимости от способа разделения исходного множества на тестовое и обучающее и параметров метода, параметров отбора переменных в регрессионные модели, параметров построения регрессионной модели, параметров калибровки лог-регрессионной модели, параметров преобразования. Реализация метода в ПП «Deductor Studio» представлена в методических указаниях.

3. Теоретические основы

Решение задач предсказательной аналитики требует высокой квалификации от пользователя. Требуется хорошо владеть не только методами преобразования данных, но и знать аналитические алгоритмы. Довольно много бизнес-задач сводятся к построению модели бинарного классификатора (будут просрочки по кредиту или нет, покинет клиент компанию или останется и т. д.). Популярным и хорошо изученным математическим инструментом для создания бинарных классификаторов является логистическая регрессии. Кроме того, данный инструмент позволяет получать вероятностные оценки наступления интересующего события и оценивать качество модели специальными метрикам - AUC, KS, Gini и другие.

4. Результат выполнения работы

Рисунок 1 Импорт данных

Рисунок 2 Формирование целевой переменной

Рисунок 3 Настройка наборов данных (статистика)

Рисунок 4 Оценка качества данных

Рисунок 5 Заполнение пропущенных данных

Рисунок 6 Разбиение на множества

Рисунок 7 Разбиение на множества

Рисунок 8 Корреляционный анализ

Рисунок 9 настройка набора данных ( признак тестового множества)

Рисунок 10 Фильтр с условием Признак тестового множества = ложь

Рисунок 11 Настройка узла Конечные классы

Рисунок 12 Фильтр признак тестового множества = истина

Рисунок 13 Скрипт

Рисунок 14 Объединение

Рисунок 15 Логистическая регрессия (отчет)

Рисунок 16 Коэффициенты регрессии

Рисунок 17 Качество классификации

5. Вывод

Получили следующие знания, умения и навыки:

• изучили понятие и методы классификации;

• научились реализовывать метод классификации с помощью логистической регрессии, используя различные инструменты (например, ПП «Deductor Studio»)

Уфа – 2020