**Данные:** таблица events с user_id, event_time. Зарегистрированных юзеров можно вычислить по min(event_time).
[см. код в задании]
**Задание:**
Построить **cohort retention table** в формате:
| cohort_week | week_0 | week_1 | week_2 | week_3 | week_4 |
|---|---|---|---|---|---|
| 2026-W10 | 1000 | 450 | 280 | 200 | 180 |
| 2026-W11 | 1100 | 480 | 290 | 210 | NULL |
| ... | ... | ... | ... | ... | ... |
- **cohort_week** — неделя первого визита
- **week_N** — сколько юзеров активны через N недель после первой
Используй **ARRAY JOIN** для разворачивания массива активности.
Структура для ориентира — реальные значения из эталонного решения.
CREATE TABLE events (
user_id UInt64,
event_time DateTime,
event_type LowCardinality(String)
) ENGINE = MergeTree
ORDER BY (event_time, user_id)
PARTITION BY toYYYYMM(event_time);
ClickHouse cohort ARRAY JOIN retention groupArray
Это задание для уровня Middle. Для middle-аналитиков с опытом 1-3 года, требует уверенного владения темой и понимания edge cases.
Подобные задания в категории «SQL» регулярно дают на собеседованиях аналитика данных в Яндекс, Сбер, Ozon, Авито, Тинькофф, Wildberries, T-Bank, X5, ВТБ и других крупных IT-компаниях. Тематика: ClickHouse, cohort, ARRAY JOIN, retention, groupArray.
На реальном собеседовании на подобную задачу отводится 15-30 минут — оцениваются подход, корректность, обработка edge cases. Для тренировки рекомендуем сначала решить самостоятельно, потом сверить с эталонным решением и подсказками.
На zasqlpython.ru есть 520+ SQL задач в песочнице с автопроверкой кода, конспекты SQL для аналитика, AI мок-собеседование с разбором ваших ответов.
← Все задания