**Контекст:** Социальная сеть хочет выявлять вирусные посты в реальном времени. Пост считается вирусным, если количество репостов за каждый час в течение 24 часов после публикации растёт (каждый следующий час >= предыдущего) и общее число репостов > 1 000.
**Данные:**
[см. код в задании]
**Задание:**
1. Для постов, опубликованных за последние 7 дней, разбейте первые 24 часа на часовые интервалы
2. Посчитайте количество репостов в каждом часовом интервале и кумулятивную сумму
3. Определите, был ли рост монотонным (каждый час >= предыдущего) хотя бы первые 6 часов
4. Выведите вирусные посты (монотонный рост + > 1 000 репостов за 24 часа)
Структура для ориентира — реальные значения из эталонного решения.
CREATE TABLE posts (
id SERIAL PRIMARY KEY,
author_id INT NOT NULL,
content TEXT NOT NULL,
published_at TIMESTAMP NOT NULL
);
CREATE TABLE reposts (
id SERIAL PRIMARY KEY,
post_id INT REFERENCES posts(id),
user_id INT NOT NULL,
reposted_at TIMESTAMP NOT NULL
);
рекурсивный CTE window functions каскады виральность
Это задание для уровня Middle. Для middle-аналитиков с опытом 1-3 года, требует уверенного владения темой и понимания edge cases.
Подобные задания в категории «SQL» регулярно дают на собеседованиях аналитика данных в Яндекс, Сбер, Ozon, Авито, Тинькофф, Wildberries, T-Bank, X5, ВТБ и других крупных IT-компаниях. Тематика: рекурсивный CTE, window functions, каскады, виральность.
На реальном собеседовании на подобную задачу отводится 15-30 минут — оцениваются подход, корректность, обработка edge cases. Для тренировки рекомендуем сначала решить самостоятельно, потом сверить с эталонным решением и подсказками.
На zasqlpython.ru есть 425 SQL задач в песочнице с автопроверкой кода, конспекты SQL для аналитика, AI мок-собеседование с разбором ваших ответов.
← Все задания