Чем XGBoost/LightGBM лучше Random Forest для табличных данных?
MLmediummiddle
Варианты ответа
Gradient boosting строит деревья последовательно, каждое исправляет ошибки предыдущих. Обычно точнее Random Forest, поддерживает missing values, имеет встроенную регуляризацию
XGBoost всегда строго точнее Random Forest на любых табличных задачах по определению — это следует из того, что boosting по своей природе превосходит bagging
Random Forest разработан для работы только с изображениями и текстом через sklearn pipelines, а для классических табличных данных требуется использовать XGBoost или LightGBM
XGBoost всегда обучается быстрее любого другого алгоритма — благодаря оптимизированной имплементации на C++ и hardware-ускорению через GPU для любого типа данных
Разбор ответа
Подробный разбор с объяснением «почему правильный ответ верный» и почему остальные неверны — после регистрации.
2475 вопросов с разбором, quiz-режим с проверкой, AI-собес и подготовка к интервью аналитика.