**Данные:** таблица `events` (`user_id`, `event_date`) и таблица `users` (`user_id`, `registration_date`).
**Задание:**
1. Постройте когортную таблицу retention по месяцу регистрации
2. Для каждой когорты рассчитайте процент вернувшихся пользователей в месяцы 0, 1, 2, ..., 6
Структура для ориентира — реальные значения из эталонного решения.
users = pd.DataFrame({
'user_id': range(n_users),
'registration_date': pd.date_range('2024-01-01', periods=n_users, freq='3h'),
})
pandas pivot_table когорты retention groupby
Это задание для уровня Middle. Для middle-аналитиков с опытом 1-3 года, требует уверенного владения темой и понимания edge cases.
Подобные задания в категории «Python» регулярно дают на собеседованиях аналитика данных в Яндекс, Сбер, Ozon, Авито, Тинькофф, Wildberries, T-Bank, X5, ВТБ и других крупных IT-компаниях. Тематика: pandas, pivot_table, когорты, retention, groupby.
На реальном собеседовании на подобную задачу отводится 15-30 минут — оцениваются подход, корректность, обработка edge cases. Для тренировки рекомендуем сначала решить самостоятельно, потом сверить с эталонным решением и подсказками.
На zasqlpython.ru есть 482 Python задачи с проверкой через Pyodide, конспекты Python и pandas, AI мок-собеседование с разбором ваших ответов.
← Все задания