**Компания:** ВК
**Контекст:** Нужно построить витрину retention по когортам (месяц регистрации) с возможностью инкрементального обновления. Витрина должна обновляться ежедневно, но не пересчитывать все данные с нуля.
[см. код в задании]
**Задание:**
1. Напишите SQL для создания retention-витрины (когорта x месяц жизни → процент активных)
2. Реализуйте инкрементальное обновление: пересчитывать только затронутые когорты
3. Объясните, какие когорты нужно пересчитывать при ежедневном обновлении
Структура для ориентира — реальные значения из эталонного решения.
CREATE TABLE mart_retention (
cohort_month DATE,
lifetime_month INT, -- 0, 1, 2, ...
cohort_size INT,
active_users INT,
retention_pct NUMERIC(5,2),
calculated_at TIMESTAMP DEFAULT NOW(),
PRIMARY KEY (cohort_month, lifetime_month)
);
retention витрина инкремент когорта CTE
Это задание для уровня medium. Senior-уровень — глубокое понимание темы, опыт решения нестандартных задач, обсуждение trade-off на собеседовании.
Подобные задания в категории «data_engineering» регулярно дают на собеседованиях аналитика данных в Яндекс, Сбер, Ozon, Авито, Тинькофф, Wildberries, T-Bank, X5, ВТБ и других крупных IT-компаниях. Тематика: retention, витрина, инкремент, когорта, CTE.
На реальном собеседовании на подобную задачу отводится 30-60 минут с обсуждением подходов, оптимизаций и trade-off. Для тренировки рекомендуем сначала решить самостоятельно, потом сверить с эталонным решением и подсказками.
На zasqlpython.ru есть другие задания в категории «data_engineering», продуктовые кейсы, справочник метрик, AI мок-собеседование с разбором ваших ответов.
← Все задания