PREWHERE vs WHERE: ускорить запрос по широкой таблице

Middle SQL Общие

Условие задания

**Данные:** широкая таблица логов (50+ колонок, среди них тяжёлая `payload String` с большими JSON).

[см. код в задании]

**Задание:**
1. Запрос «вернуть payload всех 5xx за последний час» тормозит. Объясни почему и оптимизируй через `PREWHERE`.
2. В чём разница PREWHERE и WHERE и когда ClickHouse сам её делает?

Пример данных

Структура для ориентира — реальные значения из эталонного решения.

CREATE TABLE logs (
    event_time DateTime,
    status_code UInt16,
    service LowCardinality(String),
    payload String           -- большие JSON, читать дорого
) ENGINE = MergeTree
ORDER BY event_time;

Темы

ClickHouse PREWHERE оптимизация columnar

Подсказки

Все тестовые задания →

Частые вопросы

Какой уровень знаний нужен для задачи "PREWHERE vs WHERE: ускорить запрос по широкой таблице"?

Это задание для уровня Middle. Для middle-аналитиков с опытом 1-3 года, требует уверенного владения темой и понимания edge cases.

На каких собеседованиях встречается такая задача?

Подобные задания в категории «SQL» регулярно дают на собеседованиях аналитика данных в Яндекс, Сбер, Ozon, Авито, Тинькофф, Wildberries, T-Bank, X5, ВТБ и других крупных IT-компаниях. Тематика: ClickHouse, PREWHERE, оптимизация, columnar.

Сколько времени даётся на решение?

На реальном собеседовании на подобную задачу отводится 15-30 минут — оцениваются подход, корректность, обработка edge cases. Для тренировки рекомендуем сначала решить самостоятельно, потом сверить с эталонным решением и подсказками.

Где ещё потренироваться по теме «SQL»?

На zasqlpython.ru есть 520+ SQL задач в песочнице с автопроверкой кода, конспекты SQL для аналитика, AI мок-собеседование с разбором ваших ответов.

← Все задания