**Данные:** широкая таблица логов (50+ колонок, среди них тяжёлая `payload String` с большими JSON).
[см. код в задании]
**Задание:**
1. Запрос «вернуть payload всех 5xx за последний час» тормозит. Объясни почему и оптимизируй через `PREWHERE`.
2. В чём разница PREWHERE и WHERE и когда ClickHouse сам её делает?
Структура для ориентира — реальные значения из эталонного решения.
CREATE TABLE logs (
event_time DateTime,
status_code UInt16,
service LowCardinality(String),
payload String -- большие JSON, читать дорого
) ENGINE = MergeTree
ORDER BY event_time;
ClickHouse PREWHERE оптимизация columnar
Это задание для уровня Middle. Для middle-аналитиков с опытом 1-3 года, требует уверенного владения темой и понимания edge cases.
Подобные задания в категории «SQL» регулярно дают на собеседованиях аналитика данных в Яндекс, Сбер, Ozon, Авито, Тинькофф, Wildberries, T-Bank, X5, ВТБ и других крупных IT-компаниях. Тематика: ClickHouse, PREWHERE, оптимизация, columnar.
На реальном собеседовании на подобную задачу отводится 15-30 минут — оцениваются подход, корректность, обработка edge cases. Для тренировки рекомендуем сначала решить самостоятельно, потом сверить с эталонным решением и подсказками.
На zasqlpython.ru есть 520+ SQL задач в песочнице с автопроверкой кода, конспекты SQL для аналитика, AI мок-собеседование с разбором ваших ответов.
← Все задания