Cohort retention с argMaxIf для multi-step events

Senior SQL product

Условие задания

**Данные:** events с разными event_type:

[см. код в задании]

**Задание:**

Построить **cohort retention table со step-level milestones**:

Для каждой когорты (week of signup):
- Cohort size
- % достигших activation (D1-D7)
- % достигших first_purchase (D7-D30)
- % churned (last activity > 30 дней назад)
- Average days to activation
- Average revenue per activated user

Используй `argMaxIf`, `countDistinctIf`, `avgIf` для multi-step aggregation в одном scan.

Пример данных

Структура для ориентира — реальные значения из эталонного решения.

CREATE TABLE events (
    user_id UInt64,
    event_time DateTime,
    event_type LowCardinality(String),
    -- ∈ ('signup', 'activation', 'first_purchase', 'churn')
    revenue Decimal(18, 2) DEFAULT 0
) ENGINE = MergeTree
ORDER BY (event_time, user_id);

Темы

ClickHouse cohort argMaxIf retention multi-step

Подсказки

Все тестовые задания →

Частые вопросы

Какой уровень знаний нужен для задачи "Cohort retention с argMaxIf для multi-step events"?

Это задание для уровня Senior. Senior-уровень — глубокое понимание темы, опыт решения нестандартных задач, обсуждение trade-off на собеседовании.

На каких собеседованиях встречается такая задача?

Подобные задания в категории «SQL» регулярно дают на собеседованиях аналитика данных в Яндекс, Сбер, Ozon, Авито, Тинькофф, Wildberries, T-Bank, X5, ВТБ и других крупных IT-компаниях. Тематика: ClickHouse, cohort, argMaxIf, retention, multi-step.

Сколько времени даётся на решение?

На реальном собеседовании на подобную задачу отводится 30-60 минут с обсуждением подходов, оптимизаций и trade-off. Для тренировки рекомендуем сначала решить самостоятельно, потом сверить с эталонным решением и подсказками.

Где ещё потренироваться по теме «SQL»?

На zasqlpython.ru есть 520+ SQL задач в песочнице с автопроверкой кода, конспекты SQL для аналитика, AI мок-собеседование с разбором ваших ответов.

← Все задания