Санкт-Петербургский государственный электротехнический университет им. В.И. Ульянова (Ленина)
ТЕХНОЛОГИИ DATA MINING. АЛГОРИТМЫ КЛАССИФИКАЦИИ И РЕГРЕССИИ
Группа: 1302
ЦЕЛЬ РАБОТЫ
•Цель: Анализ алгоритмов обучения с учителем.
•Задачи:
•Изучить процесс KDD (Knowledge Discovery in Databases).
•Рассмотреть методы предобработки.
•Сравнить алгоритмы классификации.
•Проанализировать методы регрессии.
ПРОЦЕСС ОБНАРУЖЕНИЯ ЗНАНИЙ (KDD)
• KDD (Knowledge Discovery in Databases) — процесс поиска полезных знаний
ПОДГОТОВКА ДАННЫХ
•Очистка от шума и пропусков.
•Кодирование категорий.
•Масштабирование
признаков.
(2)
(1)
АЛГОРИТМЫ КЛАССИФИКАЦИИ: ЛОГИЧЕСКИЕ МЕТОДЫ
•Деревья решений (Decision Trees).
•Критерий: Энтропия.
(3)
АЛГОРИТМЫ КЛАССИФИКАЦИИ: МЕТРИЧЕСКИЕ И ГЕОМЕТРИЧЕСКИЕ
•k-ближайших соседей (k-NN).
•Метод опорных векторов (SVM).
(6)
ОЦЕНКА КАЧЕСТВА КЛАССИФИКАЦИИ
•Матрица ошибок (Confusion Matrix).
(9)
АЛГОРИТМЫ РЕГРЕССИИ
•Линейная регрессия.
•Метод наименьших квадратов (МНК).
(10)
МЕТРИКИ КАЧЕСТВА РЕГРЕССИИ
•Оценка отклонения прогноза от факта.
(15)