- •Распределение классов прочности
- •Визуализация распределения классов прочности бетона
- •Анализ сбалансированных классов
- •Визуализация взаимосвязей между признаками
- •Предобработка данных
- •Разделение данных и масштабирование
- •Визуализация распределения признаков:
- •Метод kNn для классификации прочности бетона
- •Метод дерева решений для классификации прочности бетона
- •Обучение и оценка дерева решений для классификации бетона
- •Обучение и оценка дерева решений
- •Визуализация дерева решений
- •Кривые для оценки качества классификации бетона
- •Визуализация roc-кривых для классификации прочности бетона
Визуализация roc-кривых для классификации прочности бетона
Дерево - Класс 1 (AUC = 0.8885)
Дерево - Класс 2 (AUC = 0.7893)
ВИЗУАЛИЗАЦИЯ ROC-КРИВЫХ:
СРАВНИТЕЛЬНЫЙ АНАЛИЗ AUC:
Класс kNN AUC Дерево AUC Разница
Высокая 0.857 0.901 -0.044 Дерево
Низкая 0.834 0.888 -0.054 Дерево
Средняя 0.749 0.789 -0.040 Дерево
Средний AUC 0.813 0.859 -0.046
Сравнительный анализ AUC по классам показывает последовательное и значительное превосходство дерева решений. Для каждого из трёх классов прочности модель дерева демонстрирует более высокую площадь под ROC-кривой, причём наибольшее преимущество (+0.054) наблюдается для класса "Низкая" прочность. Это означает, что дерево решений не только выигрывает в среднем, но и обеспечивает более качественное разделение для каждого конкретного типа бетона. Разница в 0.04-0.05 пункта AUC является статистически и практически значимой, особенно в контексте инженерных задач.
ИНТЕРПРЕТАЦИЯ AUC:
kNN (средний AUC = 0.813): Хорошее качество
Дерево (средний AUC = 0.859): Хорошее качество
Обе модели показывают "хорошее" качество согласно шкале AUC, однако дерево решений (0.859) находится в верхней части этого диапазона, вплотную приближаясь к границе "отличного" уровня (0.9). Средний AUC модели kNN (0.813), хотя и формально попадает в ту же категорию, существенно отстаёт. Это подтверждает, что дерево решений обладает более сбалансированной и эффективной дискриминационной способностью в рамках многоклассовой задачи.
ДОПОЛНИТЕЛЬНЫЙ АНАЛИЗ:
Микро-усредненный AUC:
kNN: 0.8131
Дерево: 0.8589
ВЫВОДЫ И РЕКОМЕНДАЦИИ ДЛЯ БЕТОНА:
Дерево решений показывает лучшее качество по ROC-кривым
Модель лучше разделяет классы по пороговым значениям
Рекомендуется использовать дерево для интерпретируемости
ПРАКТИЧЕСКОЕ ПРИМЕНЕНИЕ:
• AUC > 0.9: Модель отлично подходит для контроля качества бетона
• AUC 0.8-0.9: Модель можно использовать в производстве
• AUC 0.7-0.8: Требуется дополнительная настройка или данные
• AUC < 0.7: Модель не рекомендуется для практического применения
ВЫВОД
В результате исследования двух алгоритмов классификации было установлено, что для задачи прогнозирования класса прочности бетона по его составу метод дерева решений показал себя предпочтительнее, продемонстрировав более высокую точность и лучшее разделение классов (AUC = 0.86). Хотя kNN также даёт приемлемый результат, дерево решений предлагает лучший баланс между точностью, устойчивостью и возможностью интерпретации решающих правил, что важно для инженерной практики.
