Графики рассеивания
Программа для создания матрицы графиков рассеивания
target_column = df.columns[-1]df_clean = df.rename(columns={target_column: 'Compressive_Strength'})df_clean['Strength_Category'] = pd.qcut(df_clean['Compressive_Strength'],
q=3,
labels=['Низкая', 'Средняя', 'Высокая'])
plt.figure(figsize=(15, 12))sns.pairplot(df_clean, hue='Strength_Category', palette='viridis',
vars=df_clean.columns[:-1], # Все столбцы кроме последнего (категория)
diag_kind='hist',
plot_kws={'alpha': 0.7, 's': 30},
corner=True) plt.suptitle('МАТРИЦА ГРАФИКОВ РАССЕИВАНИЯ С РАСКРАСКОЙ ПО КАТЕГОРИЯМ ПРОЧНОСТИ',
y=1.02, fontsize=16, fontweight='bold')plt.show()
<Figure size 1500x1200 with 0 Axes>
Результат работы программы:
1. КЛЮЧЕВЫЕ ФАКТОРЫ ПРОЧНОСТИ:
Цемент - сильная положительная (r=0.50)
Возраст - умеренная положительная (r=0.33)
Суперпластификатор - умеренная положительная (r=0.29)
2. ВАЖНЫЕ ВЗАИМОСВЯЗИ:
Суперпластификатор и Зола-унос: сильная отрицательная
Цемент и Вода: умеренная отрицательная
Вода и Прочность: умеренная отрицательная
Таким образом, можем отметить:
Чем больше цемента в смеси - тем прочнее бетон
Чем дольше твердеет бетон - тем он прочнее
Специальные добавки (суперпластификаторы) увеличивают прочность
Лишняя вода в смеси делает бетон менее прочным
Добавки и зола-унос обычно не используются вместе
Все остальные компоненты почти не влияют на прочность
ВЫВОД
В ходе лабораторной работы был проведён комплексный анализ датасета о прочности бетона. Основные выводы заключаются в следующем.
Датасет демонстрирует высокое качество, о чём свидетельствует полное отсутствие пропущенных значений. Статистический анализ выявил особенности распределения компонентов, такие как асимметрия для золы-уноса и шлака. Метод IQR показал, что выбросы в большинстве параметров минимальны, а значительное их количество для возраста объясняется долгосрочными испытаниями образцов.
Ключевым результатом корреляционного анализа стало подтверждение технологически значимых взаимосвязей. Обнаружена сильная положительная корреляция между содержанием цемента и прочностью (r=0.50), а также умеренная положительная связь с возрастом и содержанием суперпластификатора. Наиболее важной с практической точки зрения является умеренная отрицательная корреляция (r=-0.657) между водой и суперпластификатором, что отражает принцип работы этой химической добавки.
Таким образом, датасет оказался полностью готов для последующего машинного обучения. Выявленные зависимости имеют чёткое физическое обоснование и задают основу для прогнозирования свойств бетона.
