**Контекст:** Игровая студия анализирует retention игроков в разрезе платформ и каналов привлечения.
**Данные:**
- Таблица `game_sessions` — колонки: `player_id`, `session_start`, `session_duration_sec`
- Таблица `players` — колонки: `player_id`, `install_date`, `platform` (ios/android), `acquisition_source` (organic/paid)
**Задание:**
1. Постройте retention Day 1, 3, 7, 14, 30 по платформам и каналам привлечения
2. Визуализируйте результат heatmap-ом (seaborn)
Структура для ориентира — реальные значения из эталонного решения.
players = pd.DataFrame({
'player_id': range(n_players),
'install_date': pd.to_datetime(
np.random.choice(pd.date_range('2024-01-01', '2024-01-31'), n_players)
),
'platform': np.random.choice(['ios', 'android'], n_players, p=[0.45, 0.55]),
'acquisition_source': np.random.choice(['organic', 'paid'], n_players, p=[0.6, 0.4]),
})
pandas seaborn retention когорты heatmap
Это задание для уровня Middle. Для middle-аналитиков с опытом 1-3 года, требует уверенного владения темой и понимания edge cases.
Подобные задания в категории «Python» регулярно дают на собеседованиях аналитика данных в Яндекс, Сбер, Ozon, Авито, Тинькофф, Wildberries, T-Bank, X5, ВТБ и других крупных IT-компаниях. Тематика: pandas, seaborn, retention, когорты, heatmap.
На реальном собеседовании на подобную задачу отводится 15-30 минут — оцениваются подход, корректность, обработка edge cases. Для тренировки рекомендуем сначала решить самостоятельно, потом сверить с эталонным решением и подсказками.
На zasqlpython.ru есть 482 Python задачи с проверкой через Pyodide, конспекты Python и pandas, AI мок-собеседование с разбором ваших ответов.
← Все задания