Лабораторная работа №7
.docxМинистерство цифрового развития, связи и массовых коммуникаций
Российской Федерации Ордена Трудового Красного Знамени
федеральное государственное бюджетное образовательное
учреждение высшего образования
Московский технический университет связи и информатики
Кафедра «Математическая кибернетика и информационные технологии»
Лабораторная работа №7
по дисциплине
«Управление данными»
Москва 2023
Оглавление
Цель работы 2
Ход лабораторной работы 3
Вывод 18
Цель работы
Ознакомиться с методами классификации модуля Sklearn
Ход лабораторной работы
Создадим Python скрипт и загрузим данные в датафрейм. Загрузим данные в датафрейм
Рисунок 1 – Загрузка данных в датафрейм
Выделим данные и их метки
Рисунок 2 – Код
Преобразуем тексты меток к числам
Рисунок 3 – Код
Разобьём выборку на обучающую и тестовую
Рисунок 4 – Код
Проведем классификацию наблюдений наивным байесовским методом
Рисунок 5 – Полученный результат
Используя функцию score() выведем точность классификации
Рисунок 6 – Полученный результат
Проведем классификацию используя MultinomialNB, ComplementNB, BernoulliNB. Опишем особенности методов.
Рисунок 7 – Код
Рисунок 8 – Полученный результат
Рисунок 9 – Полученный результат
Классификацию при помощи деревьях на тех же данных
Рисунок 10 – Полученный результат
Используя функцию score() выведем точность классификации
Рисунок 11 – Полученный результат
Выведем характеристики дерева, количество листьев и глубину, используя функции get_n_leaves и get_depth
Рисунок 12 – Полученный результат
Выведем изображение полученного дерева
Рисунок 13 – Полученный результат
Построим график зависимости неправильно классифицированных наблюдений и точности классификации от размера тестовой выборки. Размер тестовой выборки изменяем от 0.05 до 0.95 с шагом 0.05. Параметр random_state сделайте равным номеру своей зачетной книжки. Обоснуем полученные результаты
Рисунок 14 – Полученный результат
Исследуем работу классифицирующего дерева при различных параметрах criterion, splitter, max_depth, min_samples_split, min_samples_leaf
Рисунок 15 – Полученный результат
Рисунок 16 – Полученный результат
Рисунок 17 – Полученный результат
Рисунок 17 – Полученный результат
Рисунок 18 – Полученный результат
Рисунок 19 – Полученный результат
Рисунок 20 – Полученный результат
Рисунок 21 – Полученный результат
Рисунок 22 – Полученный результат
Рисунок 23 – Полученный результат
Рисунок 24 – Полученный результат
Рисунок 25 – Полученный результат
Вывод
Ознакомиться с методами классификации модуля Sklearn