Алгоритм Градиентного Бустинга. Для решения каких задач применяется алгоритм? Объясните принцип работы алгоритма. Основные параметры при работе алгоритма. Популярные реализации алгоритма.

Добавил:

AliceIlina связь https://discord.gg/sRPpSvnP Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Московский технический университет связи и информатики

Предмет:

Управление данными

Файл:

Экзамен УД билеты + мои ответы 2024.docx

Скачиваний:

Добавлен:

11.07.2024

Размер:

613.65 Кб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 89 / 99

Алгоритм Градиентного Бустинга. Для решения каких задач применяется алгоритм? Объясните принцип работы алгоритма. Основные параметры при работе алгоритма. Популярные реализации алгоритма.

Алгоритм Градиентного Бустинга – это метод, который помогает улучшать прогнозы, используя несколько моделей, которые работают вместе. Много маленьких моделей работают лучше, чем одна большая. Можно представить это как команду спортсменов, где каждый новый участник команды старается исправить ошибки предыдущих, делая общий результат лучше.

Этот метод подходит для множества задач:

Определение цен на что-то (как дома или товары)
Предсказание, сможет ли человек выплатить кредит
Распознавание объектов на фотографиях

Принцип работы алгоритма

Начальное предсказание. Если это задача предсказания цен, он может начать с предсказания средней цены всех предыдущих наблюдений.
Оценка ошибок. Алгоритм смотрит, насколько он ошибся -> вычисляет разницу между реальными значениями и предсказанными.
Построение новой модели. Алгоритм строит новую маленькую модель (обычно это дерево решений), которая пытается предсказать эти ошибки.
Когда новая модель построена, она используется для коррекции предыдущих предсказаний. То есть, алгоритм добавляет результаты этой новой модели к первоначальным предсказаниям, пытаясь сделать итоговые предсказания точнее.
Повторяем процесс
Суммируем вклады всех маленьких моделей и получаем финальное предсказание

Основные параметры

Скорость обучения. Это насколько сильно каждая новая маленькая модель влияет на общий результат.
Количество моделей. Сколько раз алгоритм будет пытаться улучшить предсказание.
Глубина деревьев. Это насколько сложные решения может принимать каждая маленькая модель.
Минимальное количество данных для разделения. Сколько примеров нужно, чтобы начать делать новые предсказания внутри маленькой модели.

Популярные реализации алгоритма

1. XGBoost

2. LightGBM

3. CatBoost

4. H2O

<<< < Предыдущая 1 2 3 4 5 6 7 89 / 99

Соседние файлы в предмете Управление данными

#
11.07.20241.18 Mб26Отчёт 1 лабораторная.docx
#
11.07.20241.41 Mб22Отчёт 2 лабораторная.docx
#
11.07.20241.01 Mб14Отчёт 3 лабораторная.docx
#
11.07.20242.78 Mб8Отчёт 4 лабораторная.docx
#
11.07.20246.04 Mб3Отчёт 5(курсовая) лабораторная.docx
#
11.07.2024613.65 Кб30Экзамен УД билеты + мои ответы 2024.docx
#
11.07.202417.71 Кб7Экзамен УД билеты 2024.docx