**Данные:** `df` событий с колонками `user_id`, `ts` (datetime). Новая сессия начинается, если между соседними событиями пользователя прошло **больше 30 минут**.
**Задание:** проставьте каждому событию `session_id` (уникальный в рамках пользователя) и посчитайте число сессий на пользователя.
pandas сессионизация diff cumsum time-series
Это задание для уровня Senior. Senior-уровень — глубокое понимание темы, опыт решения нестандартных задач, обсуждение trade-off на собеседовании.
Подобные задания в категории «Python» регулярно дают на собеседованиях аналитика данных в Яндекс, Сбер, Ozon, Авито, Тинькофф, Wildberries, T-Bank, X5, ВТБ и других крупных IT-компаниях. Тематика: pandas, сессионизация, diff, cumsum, time-series.
На реальном собеседовании на подобную задачу отводится 30-60 минут с обсуждением подходов, оптимизаций и trade-off. Для тренировки рекомендуем сначала решить самостоятельно, потом сверить с эталонным решением и подсказками.
На zasqlpython.ru есть 530+ Python задачи с проверкой через Pyodide, конспекты Python и pandas, AI мок-собеседование с разбором ваших ответов.
← Все задания