**Компания:** Яндекс Поиск
**Позиция:** Senior Data Analyst (продуктовая аналитика поисковика)
**Контекст:** есть лог поисковых запросов `searches(user_id, query, ts)`. Задача — определить «сессии»: события одного юзера с интервалом меньше 30 минут считаются одной сессией.
**Задание:**
1. Напиши SQL-запрос который для каждой строки добавит `session_id` (уникальный в рамках юзера).
2. Посчитай распределение длины сессий (число запросов в сессии) — сколько сессий из 1, 2, 3+ запросов.
3. Какова средняя сессия в минутах для тех у кого ≥3 запросов?
**Гипотеза для собеса:** «Если средняя сессия меньше 5 минут — юзеры быстро находят ответ или быстро уходят. Что значит для product-метрик поиска?»
sessionization window functions gaps and islands PostgreSQL
Это задание для уровня Senior. Senior-уровень — глубокое понимание темы, опыт решения нестандартных задач, обсуждение trade-off на собеседовании.
Подобные задания в категории «SQL» регулярно дают на собеседованиях аналитика данных в Яндекс, Сбер, Ozon, Авито, Тинькофф, Wildberries, T-Bank, X5, ВТБ и других крупных IT-компаниях. Тематика: sessionization, window functions, gaps and islands, PostgreSQL.
На реальном собеседовании на подобную задачу отводится 30-60 минут с обсуждением подходов, оптимизаций и trade-off. Для тренировки рекомендуем сначала решить самостоятельно, потом сверить с эталонным решением и подсказками.
На zasqlpython.ru есть 425 SQL задач в песочнице с автопроверкой кода, конспекты SQL для аналитика, AI мок-собеседование с разбором ваших ответов.
← Все задания