Когортный анализ retention

Middle Python Fintech

Условие задания

**Задание по мотивам реального тестового в Альфа-Банке.**

**Данные:** CSV с транзакциями клиентов:
[см. код в задании]
- `DIGITAL_30_CNT` — количество цифровых операций за последние 30 дней
- `BRANCH_30_CNT` — количество визитов в отделение за 30 дней

**Задание:**
1. Определите когорту клиента по месяцу первой транзакции
2. Постройте retention-матрицу: % клиентов когорты, совершивших транзакцию в месяце N+1, N+2, ...
3. Визуализируйте retention heatmap
4. Сравните retention digital-active (DIGITAL_30_CNT > 5) vs остальных
5. Найдите «спящих цифровых»: клиенты с высоким DIGITAL_30_CNT, но без транзакций 2+ месяца

Пример данных

Структура для ориентира — реальные значения из эталонного решения.

sleeping = pd.DataFrame({
    'months_inactive': months_since,
    'avg_digital': avg_digital,
})

Темы

python pandas retention когорты heatmap Альфа-Банк

Подсказки

Все тестовые задания →

Частые вопросы

Какой уровень знаний нужен для задачи "Когортный анализ retention"?

Это задание для уровня Middle. Для middle-аналитиков с опытом 1-3 года, требует уверенного владения темой и понимания edge cases.

На каких собеседованиях встречается такая задача?

Подобные задания в категории «Python» регулярно дают на собеседованиях аналитика данных в Яндекс, Сбер, Ozon, Авито, Тинькофф, Wildberries, T-Bank, X5, ВТБ и других крупных IT-компаниях. Тематика: python, pandas, retention, когорты, heatmap.

Сколько времени даётся на решение?

На реальном собеседовании на подобную задачу отводится 15-30 минут — оцениваются подход, корректность, обработка edge cases. Для тренировки рекомендуем сначала решить самостоятельно, потом сверить с эталонным решением и подсказками.

Где ещё потренироваться по теме «Python»?

На zasqlpython.ru есть 482 Python задачи с проверкой через Pyodide, конспекты Python и pandas, AI мок-собеседование с разбором ваших ответов.

← Все задания