Добавил:
связь https://discord.gg/sRPpSvnP Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Экзамен УД билеты + мои ответы 2024.docx
Скачиваний:
30
Добавлен:
11.07.2024
Размер:
613.65 Кб
Скачать
  1. Алгоритм Градиентного Бустинга. Для решения каких задач применяется алгоритм? Объясните принцип работы алгоритма. Основные параметры при работе алгоритма. Популярные реализации алгоритма.

Алгоритм Градиентного Бустинга – это метод, который помогает улучшать прогнозы, используя несколько моделей, которые работают вместе. Много маленьких моделей работают лучше, чем одна большая. Можно представить это как команду спортсменов, где каждый новый участник команды старается исправить ошибки предыдущих, делая общий результат лучше.

Этот метод подходит для множества задач:

  • Определение цен на что-то (как дома или товары)

  • Предсказание, сможет ли человек выплатить кредит

  • Распознавание объектов на фотографиях

Принцип работы алгоритма

  1. Начальное предсказание. Если это задача предсказания цен, он может начать с предсказания средней цены всех предыдущих наблюдений.

  2. Оценка ошибок. Алгоритм смотрит, насколько он ошибся -> вычисляет разницу между реальными значениями и предсказанными.

  3. Построение новой модели. Алгоритм строит новую маленькую модель (обычно это дерево решений), которая пытается предсказать эти ошибки.

  4. Когда новая модель построена, она используется для коррекции предыдущих предсказаний. То есть, алгоритм добавляет результаты этой новой модели к первоначальным предсказаниям, пытаясь сделать итоговые предсказания точнее.

  5. Повторяем процесс

  6. Суммируем вклады всех маленьких моделей и получаем финальное предсказание

Основные параметры

  • Скорость обучения. Это насколько сильно каждая новая маленькая модель влияет на общий результат.

  • Количество моделей. Сколько раз алгоритм будет пытаться улучшить предсказание.

  • Глубина деревьев. Это насколько сложные решения может принимать каждая маленькая модель.

  • Минимальное количество данных для разделения. Сколько примеров нужно, чтобы начать делать новые предсказания внутри маленькой модели.

Популярные реализации алгоритма

1. XGBoost

2. LightGBM

3. CatBoost

4. H2O