**Компания:** Tinkoff (Cards Tech)
**Позиция:** Senior Data Engineer / SQL-аналитик
**Контекст:** есть запрос:
[см. код в задании]
users — 5M rows, transactions — 100M rows. Запрос выполняется **47 секунд**. Нужно <2 сек.
**Задание:**
1. Какие индексы посоветуешь? (PostgreSQL)
2. Какие проблемы с этим запросом помимо индексов?
3. Если бы это был ClickHouse — как переписать?
4. Когда materialized view имеет смысл?
Структура для ориентира — реальные значения из эталонного решения.
-- Schema для ClickHouse
CREATE TABLE transactions_ch (
id UInt64,
user_id UInt64,
amount Decimal(18, 2),
created_at DateTime
) ENGINE = MergeTree
PARTITION BY toYYYYMM(created_at)
ORDER BY (user_id, created_at);
-- Запрос
SELECT u.email,
count() AS tx_count,
sum(amount) AS total
FROM transactions_ch t
GLOBAL JOIN users u ON u.id = t.user_id
WHERE t.created_at >= '2026-04-01'
AND u.created_at >= '2024-01-01'
GROUP BY u.email
ORDER BY total DESC
LIMIT 100;
SQL optimization EXPLAIN indexes PostgreSQL ClickHouse
Это задание для уровня Senior. Senior-уровень — глубокое понимание темы, опыт решения нестандартных задач, обсуждение trade-off на собеседовании.
Подобные задания в категории «SQL» регулярно дают на собеседованиях аналитика данных в Яндекс, Сбер, Ozon, Авито, Тинькофф, Wildberries, T-Bank, X5, ВТБ и других крупных IT-компаниях. Тематика: SQL optimization, EXPLAIN, indexes, PostgreSQL, ClickHouse.
На реальном собеседовании на подобную задачу отводится 30-60 минут с обсуждением подходов, оптимизаций и trade-off. Для тренировки рекомендуем сначала решить самостоятельно, потом сверить с эталонным решением и подсказками.
На zasqlpython.ru есть 425 SQL задач в песочнице с автопроверкой кода, конспекты SQL для аналитика, AI мок-собеседование с разбором ваших ответов.
← Все задания