**Данные:** DataFrame `users` (`user_id`, `registered_at`, `churned`), DataFrame `transactions` (`user_id`, `tx_date`, `amount`, `tx_type`), DataFrame `logins` (`user_id`, `login_date`).
**Задание:**
1. Создайте фичи: recency, frequency, monetary, tenure, login_frequency, avg_tx_amount, tx_type_diversity
2. Обучите LogisticRegression с train/test split
3. Оцените ROC-AUC, precision, recall
4. Интерпретируйте feature importance через коэффициенты модели
Структура для ориентира — реальные значения из эталонного решения.
users = pd.DataFrame({
'user_id': range(n_users),
'registered_at': pd.date_range('2023-01-01', '2024-06-01', periods=n_users),
'churned': np.random.binomial(1, 0.25, n_users),
})
pandas sklearn churn LogisticRegression ROC-AUC feature importance
Это задание для уровня Senior. Senior-уровень — глубокое понимание темы, опыт решения нестандартных задач, обсуждение trade-off на собеседовании.
Подобные задания в категории «Python» регулярно дают на собеседованиях аналитика данных в Яндекс, Сбер, Ozon, Авито, Тинькофф, Wildberries, T-Bank, X5, ВТБ и других крупных IT-компаниях. Тематика: pandas, sklearn, churn, LogisticRegression, ROC-AUC.
На реальном собеседовании на подобную задачу отводится 30-60 минут с обсуждением подходов, оптимизаций и trade-off. Для тренировки рекомендуем сначала решить самостоятельно, потом сверить с эталонным решением и подсказками.
На zasqlpython.ru есть 482 Python задачи с проверкой через Pyodide, конспекты Python и pandas, AI мок-собеседование с разбором ваших ответов.
← Все задания