**Данные:** DataFrame `orders` с колонками: `customer_id`, `order_date`, `order_id`, `amount`.
**Задание:**
1. Рассчитайте R (дней с последнего заказа), F (число заказов), M (сумма покупок) для каждого клиента
2. Разбейте каждую метрику на квантили (1-4), присвойте RFM-скор
3. Создайте бизнес-сегменты (Champions, Loyal, At Risk, Hibernating, Lost)
4. Визуализируйте: распределение клиентов по сегментам и средний M по сегментам
Структура для ориентира — реальные значения из эталонного решения.
orders = pd.DataFrame({
'customer_id': np.random.randint(1, n_customers + 1, n_orders),
'order_date': pd.date_range('2023-06-01', '2024-06-01', periods=n_orders),
'order_id': range(n_orders),
'amount': np.random.lognormal(6.5, 1.2, n_orders).round(2),
})
pandas qcut RFM сегментация matplotlib treemap
Это задание для уровня Middle. Для middle-аналитиков с опытом 1-3 года, требует уверенного владения темой и понимания edge cases.
Подобные задания в категории «Python» регулярно дают на собеседованиях аналитика данных в Яндекс, Сбер, Ozon, Авито, Тинькофф, Wildberries, T-Bank, X5, ВТБ и других крупных IT-компаниях. Тематика: pandas, qcut, RFM, сегментация, matplotlib.
На реальном собеседовании на подобную задачу отводится 15-30 минут — оцениваются подход, корректность, обработка edge cases. Для тренировки рекомендуем сначала решить самостоятельно, потом сверить с эталонным решением и подсказками.
На zasqlpython.ru есть 482 Python задачи с проверкой через Pyodide, конспекты Python и pandas, AI мок-собеседование с разбором ваших ответов.
← Все задания