Метод оценки модели: данные делятся на K складок (folds), модель обучается на K-1 и тестируется на оставшейся, повторяется K раз. Средний score — оценка качества
Этап подготовки данных: проверка на пропуски, выбросы, дубликаты и некорректные типы перед обучением — валидация качества входных данных на всех признаках
Обучение K различных моделей (random forest, XGBoost, neural network и т.д.) на одних данных с последующим выбором лучшей по метрике качества на holdout
Дополнительная валидация уже обученной модели на внешнем независимом датасете, полученном из другого источника данных, для проверки обобщающей способности
Разбор ответа
Подробный разбор с объяснением «почему правильный ответ верный» и почему остальные неверны — после регистрации.
2475 вопросов с разбором, quiz-режим с проверкой, AI-собес и подготовка к интервью аналитика.