Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
еще примеры курсачей / курсач другой.docx
Скачиваний:
0
Добавлен:
15.07.2025
Размер:
627.43 Кб
Скачать

Заключение

В наше время, вопросы качества воды становятся все более актуальными и критически важными для нашего здоровья и жизни в целом. Обеспечение качественной питьевой воды становится одним из основных приоритетов в сфере общественного здравоохранения и экологии. Необходимость предобработки данных и анализа показателей качества воды является критически важной задачей для обеспечения безопасности водоснабжения и предотвращения заболеваний, связанных с употреблением загрязненной воды. Модернизация инструментов анализа данных и внедрение современных технологий визуализации и обработки информации позволяют эффективнее выявлять угрозы и проблемы, связанные с качеством воды, что способствует лучшему контролю и управлению водными ресурсами. Язык программирования Python, благодаря своему богатому набору библиотек и инструментов, предоставляет мощные возможности для решения этих задач. В ходе данной курсовой работы мы продемонстрировали, как современные методы и средства Python могут быть использованы для предобработки и анализа на примере набора данных о качестве воды. Таким образом, продвижение методов анализа данных в области качества воды является ключевым шагом в обеспечении безопасного и здорового окружающего нас мира.

В ходе выполнения данной курсовой работы я приобрёл и развил следующие знания, умения и навыки:

  1. Работа с библиотеками Python: Я научился эффективно использовать библиотеки Pandas, NumPy, Matplotlib и Seaborn. Эти навыки позволили мне обрабатывать данные, выполнять анализ и визуализацию на высоком уровне.

  2. Предобработка данных: Я освоил методы очистки данных, обработки пропущенных значений и создания новых признаков, что является критически важным этапом в любом аналитическом проекте.

  3. Визуализация данных: Я приобрёл навыки создания информативных визуализаций, что важно для интерпретации и представления результатов анализа

Таким образом, выполнение этой курсовой работы не только углубило мои знания в области предобработки, анализа и визуализации данных с использованием Python, но и дало практические навыки, которые будут полезны в моей дальнейшей профессиональной деятельности.

Список использованных источников

  1. Документация языка программирования Python. [Электронный ресурс] – URL: https://www.python.org/doc/ (дата обращения 25.05.2024)

  2. Документация библиотеки Pandas. [Электронный ресурс] – URL: https://pandas.pydata.org/ (дата обращения 25.05.2024)

  3. Документация библиотеки NumPy. [Электронный ресурс] – URL: https://numpy.org/ (дата обращения 25.05.2024)

  4. Python. Справочник [Электронный ресурс] – URL: https://www.python.org/doc/about/help/ (дата обращения 25.05.2024)

  5. Документация библиотеки Matplotlib. [Электронный ресурс] – URL: https://matplotlib.org/stable/tutorials/index/ (дата обращения 25.05.2024)

Приложение

Листинг 1:

import numpy as np

import pandas as pd

import seaborn as sns

import matplotlib.pyplot as plt

import missingno as msno

import seaborn as sns

import matplotlib.pyplot as plt

import matplotlib as mlb

from matplotlib.offsetbox import AnnotationBbox, OffsetImage import warnings

warnings.filterwarnings("ignore")

theme = ["#DEF5E5", "#459E97", "#4B9ABB","#0A4361","#E68193",]

print('THEME')

sns.palplot(sns.color_palette(theme))

Листинг 2:

print('****'*10)

print(f'Dataframe has {water_df.shape[0]} Rows, {water_df.shape[1]} Columns')

print('****'*10)

water_df.head().style.set_properties(**{'background-color': '#A2DBFA', 'color': 'black',

'border': '1.5px solid black'}).bar(color='#F3F1F5',

vmin=100_000,

subset=['Potability'])

Листинг 3:

names = ["Не пригодна", "Пригодна"]

#подсчет количества значений в столбце 'Potability' набора данных

values = water_df['Potability'].value_counts()

colors = ["#E68193","#459E97"]

explode = (0.001, 0.001

#Создание объекта fig, ax для построения графика

fig, ax = plt.subplots(figsize=(11, 11))\

#построение круговой диаграммы с заданными параметрами (значения, метки, цвета, формат процентов, выделение)

ax.pie(x= values,labels =names, colors=colors,autopct='%1.0f%%', pctdistance=0.8,explode=explode)

centre_circle = plt.Circle((0,0),0.62,fc='white')

ax.add_artist(centre_circle)

#задание равных масштабов по осям для сохранения круглой формы

ax.axis('equal')

ax.set_title('Пригодность для питья', size = 18, color = '#459E97', weight='bold', pad=20)

Листинг 4:

# Фильтруем данные на два датасета: один для непитьевой воды, другой для питьевой

non_potable = water_df.query("Potability == 0")

potable = water_df.query("Potability == 1")

# Создаем график для отображения распределения признаков

plt.figure(figsize = (15,15))

# Перебираем столбцы датасета

for ax, col in enumerate(water_df.columns[:9]):

# Добавляем subplot

plt.subplot(3,3, ax + 1)

plt.title(col)

# Строим графики плотности для непитьевой и питьевой воды

plotting = sns.kdeplot(x = non_potable[col], label = "Non Potable",fill=True, common_norm=False, color="#E68193",alpha=.9, linewidth=3)

plotting = sns.kdeplot(x = potable[col], label = "Potable",fill=True, common_norm=False, color="#459E97",alpha=.9, linewidth=3)

plt.legend()

# Оптимизируем расположение графиков

plt.tight_layout()

# Добавляем заголовок

plt.title('Distribution')

plotting.figure.suptitle(' Distribution of features ',y=1.08, size = 26, color = theme[3], weight='bold')

Соседние файлы в папке еще примеры курсачей