**Данные:** таблица событий приложения:
[см. код в задании]
**Задание:**
1. Рассчитать **D7 retention** для когорты пользователей, зарегистрированных на прошлой неделе
2. D7 retention = % юзеров, которые вернулись через 7±1 дня после первого визита
3. Используй ClickHouse-специфичные функции **`groupArray()`** + **`arrayExists()`**
4. Один SELECT, без CTE
Структура для ориентира — реальные значения из эталонного решения.
CREATE TABLE events (
user_id UInt64,
event_time DateTime,
event_type LowCardinality(String)
) ENGINE = MergeTree
ORDER BY (event_time, user_id)
PARTITION BY toYYYYMM(event_time);
ClickHouse retention groupArray arrayExists cohort
Это задание для уровня Junior. Подходит для начинающих аналитиков, проверяет базовые знания SQL/Python/статистики.
Подобные задания в категории «SQL» регулярно дают на собеседованиях аналитика данных в Яндекс, Сбер, Ozon, Авито, Тинькофф, Wildberries, T-Bank, X5, ВТБ и других крупных IT-компаниях. Тематика: ClickHouse, retention, groupArray, arrayExists, cohort.
На реальном собеседовании на подобную задачу отводится 5-10 минут — проверяется скорость и базовая грамотность. Для тренировки рекомендуем сначала решить самостоятельно, потом сверить с эталонным решением и подсказками.
На zasqlpython.ru есть 520+ SQL задач в песочнице с автопроверкой кода, конспекты SQL для аналитика, AI мок-собеседование с разбором ваших ответов.
← Все задания