Дедупликация связанных контактов (Transitive Closure)

Senior SQL E-commerce

Условие задания

**Контекст:** Маркетплейс обнаружил дубли аккаунтов. Два контакта считаются «одним человеком», если у них совпадает телефон или email. Связь транзитивна: если A связан с B, а B с C, то A, B и C — один человек.

**Данные:**

[см. код в задании]

Пример:
- id=1: phone='111', email='a@x.ru'
- id=2: phone='111', email='b@x.ru' — связан с 1 по телефону
- id=3: phone='222', email='b@x.ru' — связан с 2 по email
- → Все трое — один человек.

**Задание:**

1. Найдите все группы связанных контактов (transitive closure)
2. Для каждой группы выведите минимальный id как canonical_id
3. Результат: id контакта, canonical_id группы, имя

Пример данных

Структура для ориентира — реальные значения из эталонного решения.

CREATE TABLE contacts (
    id SERIAL PRIMARY KEY,
    phone VARCHAR(20),
    email VARCHAR(200),
    name VARCHAR(200) NOT NULL
);

Темы

RECURSIVE CTE дедупликация граф transitive closure

Подсказки

Все тестовые задания →

Частые вопросы

Какой уровень знаний нужен для задачи "Дедупликация связанных контактов (Transitive Closure)"?

Это задание для уровня Senior. Senior-уровень — глубокое понимание темы, опыт решения нестандартных задач, обсуждение trade-off на собеседовании.

На каких собеседованиях встречается такая задача?

Подобные задания в категории «SQL» регулярно дают на собеседованиях аналитика данных в Яндекс, Сбер, Ozon, Авито, Тинькофф, Wildberries, T-Bank, X5, ВТБ и других крупных IT-компаниях. Тематика: RECURSIVE CTE, дедупликация, граф, transitive closure.

Сколько времени даётся на решение?

На реальном собеседовании на подобную задачу отводится 30-60 минут с обсуждением подходов, оптимизаций и trade-off. Для тренировки рекомендуем сначала решить самостоятельно, потом сверить с эталонным решением и подсказками.

Где ещё потренироваться по теме «SQL»?

На zasqlpython.ru есть 425 SQL задач в песочнице с автопроверкой кода, конспекты SQL для аналитика, AI мок-собеседование с разбором ваших ответов.

← Все задания