- •Добавление нового атрибута
- •Пропущенные значения
- •Удаление выбросов
- •Построение графиков для поиска кластеров
- •Анализ кластеров
- •Методы локтя и силуэта для определения оптимального числа кластеров
- •Применение k-Means
- •Графики для визуализации результатов кластеризации
- •Анализ характристик кластеров
- •Визуализация средних значений по кластерам
Визуализация средних значений по кластерам
Программа:
plt.figure(figsize=(12, 6))cluster_means.T.plot(kind='bar', figsize=(12, 6))plt.title('Средние значения признаков по кластерам')plt.xlabel('Признаки')plt.ylabel('Среднее значение')plt.xticks(rotation=45)plt.legend(title='Кластер')plt.grid(True, alpha=0.3)plt.tight_layout()plt.show()
<Figure size 1200x600 with 0 Axes>
Результат:
Успешно создано 3 кластера бетонных смесей
Качество кластеризации (Silhouette Score): 0.362
ХАРАКТЕРИСТИКИ КЛАСТЕРОВ:
Кластер 0 (585 зап.): Низкопрочные смеси
- Прочность: 26.7 МПа
- Мало цемента: 216 кг/м³
- Высокое водоцементное отношение
Кластер 1 (331 зап.): Высокопрочные смеси
- Прочность: 47.0 МПа
- Много цемента: 367 кг/м³
- Оптимальное водоцементное отношение
Кластер 2 (65 зап.): Среднепрочные смеси
- Прочность: 43.1 МПа
- Средние показатели по всем параметрам
ПРАКТИЧЕСКОЕ ЗНАЧЕНИЕ:
- Кластеризация выявила технологические группы бетонов
- Можно оптимизировать составы для каждой группы
- Метод K-means хорошо подошел для данного датасета
- Отношение цемент/вода оказалось важным признаком
ВЫВОД
В ходе лабораторной работы был применён алгоритм K-Means для кластеризации бетонных смесей. Для повышения информативности данных был создан новый инженерный признак — отношение «Цемент/Вода», который является ключевым параметром в технологии бетона. Перед кластеризацией данные были масштабированы, а для определения оптимального числа кластеров использованы методы локтя и силуэта, которые согласованно указали на k=3.
Анализ выявил три технологически интерпретируемые группы смесей. Кластер 0 (59.6% образцов) представляет экономичные низкопрочные составы с минимальным содержанием цемента. Кластер 1 (33.7%) — это высокопрочные смеси с максимальным расходом цемента и оптимальным водоцементным отношением. Наиболее показательным оказался Кластер 2 (6.6%), где высокая прочность достигнута не за счёт состава, а благодаря длительному сроку твердения (в среднем 241 день), что иллюстрирует важность фактора времени.
Таким образом, кластеризация не только автоматически разделила образцы по составу и свойствам, но и выявила различные стратегии достижения прочности: экономию материалов, оптимизацию состава и использование времени.
