
Лабораторная 3 / Отчет по 3 Уд
.docxМИНИСТЕРСТВО ЦИФРОВОГО РАЗВИТИЯ, СВЯЗИ И МАССОВЫХ КОММУНИКАЦИЙ РОССИЙСКОЙ ФЕДЕРАЦИИ
Ордена Трудового Красного Знамени федеральное государственное бюджетное образовательное учреждение высшего образования
«Московский технический университет связи и информатики»
Кафедра «Математическая кибернетика и информационные технологии»
Дисциплина «Управление данными»
Отчет по лабораторной работе 3
Выполнил:
студент группы БСТ21
Проверила: Тимофеева А. И.
Москва, 2024 г.
Содержание
Цель работы 3
Ход выполнения 3
Цель работы 3
Ход выполнения 3
Цель работы
Получить навыки работы с NB, LR, SVM.
Ход выполнения
Рис.1 – Импорт библиотек, чтение датасета, вывод на экран
Рис.2 – Подсчет количества объектов в датафреймах
Рис.3 – Проверка на наличие пропущенных значений
Рис.4 – Код для нахождения медианы и среднего значения а также для построения гистограммы
Рис.5 – Вывод к коду из рис.4
Рис.6 – Подсчет процентов пропущенных значений и копирование датафрейма
Рис.7 – Внесение изменений в данные и проверка на наличие пустых значений
Рис.8 – Объединение влияния переменных в один категориальный предиктор, удаление столбцов, вывод датасета
Рис.9 – Создание категориальной переменной, вывод датасета
Рис.10 – Замена пустых значений, оценка выживаемости, включение в набор категориальной переменной
Рис.11 – Определение, в каком классе выжили больше всего и состав туристической группы
Рис.12 – Импорт библиотек, создание логистической регрессии и модели рекурсивного исключения функций
Рис.13 – Создание тепловой карты
Рис.14 - Оценка модели на основе простого разделения train/test с использованием функции train_test_split()
Рис.15 - Оценки моделей на основе K-fold cross-validation с использованием функций cross_val_score() и cross_validate()
Рис.16 – Импорт библиотек, создание classifier
Рис.17 – Вывод метрик модели
Рис.18 – Вывод точности модели на тренировочном и тестовом датасетах