Time Series: детектим пропуски в DAU и заполняем правильно

Middle Python product

Условие задания

**Контекст:** Задача от продуктовой команды. Утром продакт прислал график DAU — видно «провалы» в случайные дни. Нужно понять где реальные провалы (метрика просела), а где просто отсутствуют данные (ETL сломался).

**Данные:** `daily_metrics.csv`

[см. код в задании]

Диапазон: 2026-01-01 – 2026-04-20 (110 дней).
В данных может быть 5-10 пропущенных дат (отсутствуют строки целиком).

**Задание:**

1. Загрузи данные, найди **какие даты пропущены** в диапазоне.
2. Reindex на полный диапазон дат (заполни пропуски NaN).
3. Детектируй **«подозрительные» даты**: где DAU упал в 3+ раза относительно 7-дневного rolling median. Это либо реальный инцидент, либо обрезка данных.
4. Для пропущенных дат (NaN) заполни значения через линейную интерполяцию **только если gap ≤ 2 дня**. Длиннее — оставь NaN и пометь как «требуется ручной разбор».

Верни обогащённый DataFrame с дополнительными колонками `is_missing`, `is_anomaly`, `needs_review`.

Темы

pandas time-series resample missing-data interpolation

Подсказки

Все тестовые задания →

Частые вопросы

Какой уровень знаний нужен для задачи "Time Series: детектим пропуски в DAU и заполняем правильно"?

Это задание для уровня Middle. Для middle-аналитиков с опытом 1-3 года, требует уверенного владения темой и понимания edge cases.

На каких собеседованиях встречается такая задача?

Подобные задания в категории «Python» регулярно дают на собеседованиях аналитика данных в Яндекс, Сбер, Ozon, Авито, Тинькофф, Wildberries, T-Bank, X5, ВТБ и других крупных IT-компаниях. Тематика: pandas, time-series, resample, missing-data, interpolation.

Сколько времени даётся на решение?

На реальном собеседовании на подобную задачу отводится 15-30 минут — оцениваются подход, корректность, обработка edge cases. Для тренировки рекомендуем сначала решить самостоятельно, потом сверить с эталонным решением и подсказками.

Где ещё потренироваться по теме «Python»?

На zasqlpython.ru есть 482 Python задачи с проверкой через Pyodide, конспекты Python и pandas, AI мок-собеседование с разбором ваших ответов.

← Все задания