**Контекст:** Телеком-оператор мониторит потребление трафика абонентами. Нужно автоматически выявлять аномальное потребление (возможная утечка, взлом или мошенничество).
**Данные:**
[см. код в задании]
**Задание:**
1. Для каждого пользователя рассчитайте скользящее среднее и стандартное отклонение трафика за последние 30 дней
2. Вычислите **z-score** текущего дня: $$z = \frac{x - \mu}{\sigma}$$
3. Отметьте как аномалию дни, где |z-score| > 3
4. Выведите только аномальные записи с деталями: user_id, дата, фактический трафик, среднее, стдев, z-score, тарифный план
Структура для ориентира — реальные значения из эталонного решения.
CREATE TABLE daily_traffic (
user_id INT NOT NULL,
traffic_date DATE NOT NULL,
data_mb NUMERIC(12,2) NOT NULL, -- потреблённый трафик в MB
tariff_plan VARCHAR(50) NOT NULL,
PRIMARY KEY (user_id, traffic_date)
);
z-score оконные функции аномалии STDDEV статистика
Это задание для уровня Senior. Senior-уровень — глубокое понимание темы, опыт решения нестандартных задач, обсуждение trade-off на собеседовании.
Подобные задания в категории «SQL» регулярно дают на собеседованиях аналитика данных в Яндекс, Сбер, Ozon, Авито, Тинькофф, Wildberries, T-Bank, X5, ВТБ и других крупных IT-компаниях. Тематика: z-score, оконные функции, аномалии, STDDEV, статистика.
На реальном собеседовании на подобную задачу отводится 30-60 минут с обсуждением подходов, оптимизаций и trade-off. Для тренировки рекомендуем сначала решить самостоятельно, потом сверить с эталонным решением и подсказками.
На zasqlpython.ru есть 425 SQL задач в песочнице с автопроверкой кода, конспекты SQL для аналитика, AI мок-собеседование с разбором ваших ответов.
← Все задания