**Контекст:** в компании есть 2 источника данных:
1. **MySQL** (catalog `mysql` в Trino) — транзакционная база с orders:
[см. код в задании]
2. **Hive on S3** (catalog `hive` в Trino) — data warehouse с user-аналитикой:
[см. код в задании]
**Задание:**
Напиши **один federated SQL** который:
1. Берёт orders за последние 7 дней из MySQL
2. JOIN с user_profile из Hive
3. Группирует по `segment` + `country`
4. Возвращает: число orders, общая выручка, AVG order amount
Это типичная задача self-service analytics через Trino — без ETL pipeline.
Trino federated MySQL Hive JOIN
Это задание для уровня Middle. Для middle-аналитиков с опытом 1-3 года, требует уверенного владения темой и понимания edge cases.
Подобные задания в категории «SQL» регулярно дают на собеседованиях аналитика данных в Яндекс, Сбер, Ozon, Авито, Тинькофф, Wildberries, T-Bank, X5, ВТБ и других крупных IT-компаниях. Тематика: Trino, federated, MySQL, Hive, JOIN.
На реальном собеседовании на подобную задачу отводится 15-30 минут — оцениваются подход, корректность, обработка edge cases. Для тренировки рекомендуем сначала решить самостоятельно, потом сверить с эталонным решением и подсказками.
На zasqlpython.ru есть 520+ SQL задач в песочнице с автопроверкой кода, конспекты SQL для аналитика, AI мок-собеседование с разбором ваших ответов.
← Все задания