TTL: авто-удаление сырых событий + rollup в агрегаты

Middle SQL Общие

Условие задания

**Задача:** сырые события занимают терабайты. Нужно: хранить сырьё только 90 дней, но **не терять историю** — агрегированные дневные метрики должны жить вечно.

[см. код в задании]

**Задание:**
1. Настрой TTL: удалять сырые строки старше 90 дней.
2. Объясни, как сохранить агрегаты навсегда (паттерн с отдельной таблицей или TTL ... GROUP BY).

Пример данных

Структура для ориентира — реальные значения из эталонного решения.

ALTER TABLE events MODIFY TTL event_date + INTERVAL 90 DAY;

-- Дневные агрегаты живут вечно, наполняются через MV:
CREATE TABLE daily_revenue (
    event_date Date,
    revenue AggregateFunction(sum, Decimal(18, 2)),
    dau AggregateFunction(uniq, UInt64)
) ENGINE = AggregatingMergeTree
ORDER BY event_date;   -- TTL НЕТ → хранится навсегда

CREATE MATERIALIZED VIEW daily_mv TO daily_revenue AS
SELECT event_date, sumState(amount) AS revenue, uniqState(user_id) AS dau
FROM events GROUP BY event_date;

Темы

ClickHouse TTL retention rollup storage lifecycle

Подсказки

Все тестовые задания →

Частые вопросы

Какой уровень знаний нужен для задачи "TTL: авто-удаление сырых событий + rollup в агрегаты"?

Это задание для уровня Middle. Для middle-аналитиков с опытом 1-3 года, требует уверенного владения темой и понимания edge cases.

На каких собеседованиях встречается такая задача?

Подобные задания в категории «SQL» регулярно дают на собеседованиях аналитика данных в Яндекс, Сбер, Ozon, Авито, Тинькофф, Wildberries, T-Bank, X5, ВТБ и других крупных IT-компаниях. Тематика: ClickHouse, TTL, retention, rollup, storage lifecycle.

Сколько времени даётся на решение?

На реальном собеседовании на подобную задачу отводится 15-30 минут — оцениваются подход, корректность, обработка edge cases. Для тренировки рекомендуем сначала решить самостоятельно, потом сверить с эталонным решением и подсказками.

Где ещё потренироваться по теме «SQL»?

На zasqlpython.ru есть 520+ SQL задач в песочнице с автопроверкой кода, конспекты SQL для аналитика, AI мок-собеседование с разбором ваших ответов.

← Все задания