
Архангельский М.В. 2154 УД л.р
.1.pdfМинистерство цифрового развития, связи и массовых коммуникаций Российской Федерации Ордена Трудового Красного Знамени федеральное государственное бюджетное образовательное учреждение высшего образования
Московский технический университет связи и информатики
Кафедра «Математическая кибернетика и информационные технологии»
Лабораторная работа №1
по дисциплине «Управление данными»
Выполнил: студент 4 курса группы БСТ2154
Архангельский Максим Вячеславович Проверил:
Иевлев К.О.
Москва
2024
Цель работы: Изучить и применить методы аналитики данных для исследования набора данных о пассажирах Титаника, используя Python и библиотеки pandas, matplotlib, seaborn. Анализ зависимостей между выживаемостью пассажиров и различными факторами, такими как возраст, пол, класс обслуживания и стоимость билета. Выявить значимые закономерности и визуализировать результаты анализа для облегчения интерпретации данных.
Задание:
1.Подготовка данных:
2.Анализ данных
3.Визуализация данных
4.Исследование имен
5.Выполнить домашнее задание часть вторая

Ход работы:
Рис. 1 – импорт, создание датафрейма
Вывод содержимого DataFrame и его статистической информации.
Рис. 2 – вывод датафрейма

Сортировка данных в соответствии с условиями.
Рис. 3 – сортировка данных
Создание признака и его применение к DataFrame продемонстрировано на рисунках 4.1 – 4.10.

Рис. 4.1 – создание признака и применение

Подсчёт количества мужчин и женщин на борту. Правильный вариант ответа: 577 мужчин и 314 женщин.
Рис. 4.2 – работа с признаком
Вывод распределения переменной Pclass. Подсчёт количества мужчин второго класса с использованием сортировки. Правильный ответ: 108 мужчин.
Рис. 4.3 – работа с признаком

Подсчёт медианы и стандартного отклонения платежей. Ответ: медиана 14.45, стандартное отклонение 49.69.
Рис. 4.4 – работа с признаком Подсчёт доли выживших среди людей моложе 30 и старше 60.
Рис. 4.5 – работа с признаком

Подсчёт доли выживших среди мужчин и женщин.
Рис. 4.6 – работа с признаком Подсчёт самого популярного мужского имени .
Рис. 4.7 – работа с признаком

Анализ с использованием гистограммы.
Рис. 4.8 – работа с признаком
Полученная гистограмма.
Рис. 4.9 – вывод графиков Вывод: средний возраст погибших выше, чем у спасенных.

Подсчет среднего возраста мужчин и женщин в зависимости от класса обслуживания с использованием сортировки.
Рис. 4.10 – работа с признаком