Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Архангельский М.В. 2154 УД л.р

.1.pdf
Скачиваний:
0
Добавлен:
07.04.2025
Размер:
1.29 Mб
Скачать

Министерство цифрового развития, связи и массовых коммуникаций Российской Федерации Ордена Трудового Красного Знамени федеральное государственное бюджетное образовательное учреждение высшего образования

Московский технический университет связи и информатики

Кафедра «Математическая кибернетика и информационные технологии»

Лабораторная работа №1

по дисциплине «Управление данными»

Выполнил: студент 4 курса группы БСТ2154

Архангельский Максим Вячеславович Проверил:

Иевлев К.О.

Москва

2024

Цель работы: Изучить и применить методы аналитики данных для исследования набора данных о пассажирах Титаника, используя Python и библиотеки pandas, matplotlib, seaborn. Анализ зависимостей между выживаемостью пассажиров и различными факторами, такими как возраст, пол, класс обслуживания и стоимость билета. Выявить значимые закономерности и визуализировать результаты анализа для облегчения интерпретации данных.

Задание:

1.Подготовка данных:

2.Анализ данных

3.Визуализация данных

4.Исследование имен

5.Выполнить домашнее задание часть вторая

Ход работы:

Рис. 1 – импорт, создание датафрейма

Вывод содержимого DataFrame и его статистической информации.

Рис. 2 – вывод датафрейма

Сортировка данных в соответствии с условиями.

Рис. 3 – сортировка данных

Создание признака и его применение к DataFrame продемонстрировано на рисунках 4.1 – 4.10.

Рис. 4.1 – создание признака и применение

Подсчёт количества мужчин и женщин на борту. Правильный вариант ответа: 577 мужчин и 314 женщин.

Рис. 4.2 – работа с признаком

Вывод распределения переменной Pclass. Подсчёт количества мужчин второго класса с использованием сортировки. Правильный ответ: 108 мужчин.

Рис. 4.3 – работа с признаком

Подсчёт медианы и стандартного отклонения платежей. Ответ: медиана 14.45, стандартное отклонение 49.69.

Рис. 4.4 – работа с признаком Подсчёт доли выживших среди людей моложе 30 и старше 60.

Рис. 4.5 – работа с признаком

Подсчёт доли выживших среди мужчин и женщин.

Рис. 4.6 – работа с признаком Подсчёт самого популярного мужского имени .

Рис. 4.7 – работа с признаком

Анализ с использованием гистограммы.

Рис. 4.8 – работа с признаком

Полученная гистограмма.

Рис. 4.9 – вывод графиков Вывод: средний возраст погибших выше, чем у спасенных.

Подсчет среднего возраста мужчин и женщин в зависимости от класса обслуживания с использованием сортировки.

Рис. 4.10 – работа с признаком