Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
реферат / Наволоцкий_1302_DATA-MINING-классификация-регрессия_v1.docx
Скачиваний:
0
Добавлен:
27.12.2025
Размер:
255.12 Кб
Скачать

Заключение

В ходе выполнения реферата были рассмотрены теоретические основы технологий Data Mining и подробно проанализированы два ключевых класса задач обучения с учителем: классификация и регрессия.

  • Классификация применяется для отнесения объектов к заранее известным категориям. Среди рассмотренных методов (деревья решений, наивный Байес, k-NN, SVM) нет универсального алгоритма. Выбор зависит от размера выборки, размерности данных и требований к интерпретируемости. Например, деревья решений легко интерпретировать, а SVM обеспечивает высокую точность на сложных данных.

  • Регрессия позволяет прогнозировать числовые показатели. Линейная регрессия является базовым инструментом аналитика благодаря своей простоте и скорости, однако для сложных зависимостей требуются нелинейные методы или ансамбли моделей.

Успех применения описанных алгоритмов в распределенных информационных системах зависит не только от математического аппарата, но и от качества предварительной обработки данных. Современные тенденции в Data Mining направлены на автоматизацию этих процессов и использование комбинированных (гибридных) моделей для повышения точности прогнозов.

Список используемых источников

  1. Барсегян А. А., Куприянов М. С., Степаненко В. В., Холод И. И. Технологии анализа данных: Data Mining, Visual Mining, Text Mining, OLAP. — 2-е изд. — СПб.: БХВ-Петербург, 2008. — 384 с.

  2. Горячев А. В., Новакова Н. Е. Управление знаниями в распределенной информационной среде: Учеб. пособие. — СПб.: Изд-во СПбГЭТУ «ЛЭТИ», 2009.

  3. Новакова Н. Е. Модели и методы принятия проектных решений в сложноструктурированных предметных областях: Монография. — СПб.: Изд-во СПбГЭТУ «ЛЭТИ», 2010.

  4. Вьюгин В. В. Математические основы теории машинного обучения и прогнозирования. — М.: МЦНМО, 2013. — 387 с.

  5. Флах П. Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных. — М.: ДМК Пресс, 2015. — 400 с.

  6. Рашка С. Python и машинное обучение. — М.: ДМК Пресс, 2017. — 418 с.

  7. Хасти Т., Тибширани Р., Фридман Дж. Основы статистического обучения. — М.: Вильямс, 2020. — 768 с.

  8. Воронцов К. В. Математические методы обучения по прецедентам (Теория обучения машин). — М.: МФТИ, 2011.

  9. Breiman L. Random Forests // Machine Learning. — 2001. — Vol. 45, No. 1. — P. 5–32.

  10. Chapman P., Clinton J., Kerber R. et al. CRISP-DM 1.0: Step-by-step data mining guide. — SPSS Inc., 2000.