Federated query: JOIN orders из MySQL с user_profile из Hive

Middle SQL data_engineering

Условие задания

**Контекст:** в компании есть 2 источника данных:

1. **MySQL** (catalog `mysql` в Trino) — транзакционная база с orders:
[см. код в задании]

2. **Hive on S3** (catalog `hive` в Trino) — data warehouse с user-аналитикой:
[см. код в задании]

**Задание:**

Напиши **один federated SQL** который:

1. Берёт orders за последние 7 дней из MySQL
2. JOIN с user_profile из Hive
3. Группирует по `segment` + `country`
4. Возвращает: число orders, общая выручка, AVG order amount

Это типичная задача self-service analytics через Trino — без ETL pipeline.

Темы

Trino federated MySQL Hive JOIN

Подсказки

Все тестовые задания →

Частые вопросы

Какой уровень знаний нужен для задачи "Federated query: JOIN orders из MySQL с user_profile из Hive"?

Это задание для уровня Middle. Для middle-аналитиков с опытом 1-3 года, требует уверенного владения темой и понимания edge cases.

На каких собеседованиях встречается такая задача?

Подобные задания в категории «SQL» регулярно дают на собеседованиях аналитика данных в Яндекс, Сбер, Ozon, Авито, Тинькофф, Wildberries, T-Bank, X5, ВТБ и других крупных IT-компаниях. Тематика: Trino, federated, MySQL, Hive, JOIN.

Сколько времени даётся на решение?

На реальном собеседовании на подобную задачу отводится 15-30 минут — оцениваются подход, корректность, обработка edge cases. Для тренировки рекомендуем сначала решить самостоятельно, потом сверить с эталонным решением и подсказками.

Где ещё потренироваться по теме «SQL»?

На zasqlpython.ru есть 520+ SQL задач в песочнице с автопроверкой кода, конспекты SQL для аналитика, AI мок-собеседование с разбором ваших ответов.

← Все задания