Чтобы оценить, как модель будет работать на новых данных: train — для обучения, test — для проверки обобщающей способности. Без разделения — overfitting: модель заучит ответы
Чтобы ускорить процесс обучения модели за счёт уменьшения объёма данных, на которых нужно рассчитывать градиенты: train — это половина от полного датасета по объёму
Test-выборка используется для дообучения модели финальными данными, а train — только для первоначальной проверки архитектуры нейросети или дерева решений
Разделение не нужно если данных достаточно много (10M+ примеров) — в таком случае модель не сможет переобучиться по определению и оценка корректна без splits
Разбор ответа
Подробный разбор с объяснением «почему правильный ответ верный» и почему остальные неверны — после регистрации.
2475 вопросов с разбором, quiz-режим с проверкой, AI-собес и подготовка к интервью аналитика.