Pandas: временные ряды — даты, resample, rolling

51 задач Pyodide в браузере С эталонными решениями 2026 — с реальных собесов

Временные ряды — обязательная тема для product-аналитика: DAU/MAU по дням, недельный retention, скользящие средние выручки. В pandas всё это делается через resample (ресемплинг по периодам), rolling (скользящие окна) и dt-accessor (.dt.year, .dt.weekday). На собесе ждут что ты не только знаешь синтаксис, но и понимаешь когда использовать resample("W").mean() vs rolling(7).mean() — это разные операции, и путают часто.

Начать решать задачи →

Все задачи на «Pandas: временные ряды» (51)

Скользящее среднее за 3 дня Лёгкая Яндекс rolling mean
Скользящее стандартное отклонение Средняя Тинькофф rolling std volatility
Преобразование строки в datetime Лёгкая Яндекс to_datetime dt_accessor
Ресемплирование по месяцам Средняя Ozon resample datetime
Фильтрация по диапазону дат Лёгкая Тинькофф datetime filter between
Разница в днях между датами Средняя Avito timedelta dt_days
Генерация диапазона рабочих дней Лёгкая Сбер bdate_range date_range
Округление дат (floor) Средняя VK dt_floor datetime
Ресемплирование по неделям Средняя Яндекс resample weekly
Добавление timedelta Лёгкая Ozon timedelta to_timedelta
Retention Day 7 Сложная VK retention cohort multi_step
RFM-скоринг клиентов Сложная Ozon rfm segmentation qcut
Когортный анализ Сложная Тинькофф cohort retention pivot
Признаки для предсказания оттока Сложная Тинькофф churn feature_engineering agg
DAU / WAU / MAU Средняя VK dau wau mau engagement
Сегментация клиентов по поведению Сложная Wildberries segmentation feature_engineering multi_step
Временной ряд со скользящим средним Средняя Яндекс line rolling_average matplotlib timeseries
Retention Day 1 Средняя Яндекс retention D1 cohort
Rolling Retention D7 Средняя Тинькофф rolling_retention D7 cohort
Resample временного ряда по неделям Средняя VK resample timeseries mean
Rolling mean для сглаживания метрик Лёгкая VK rolling moving_average smoothing
Строковые методы: парсинг логов Средняя VK str split extract parsing
Скользящее среднее заказов за 7 дней Лёгкая Wildberries rolling moving_average timeseries
Pipe: цепочка трансформаций DataFrame Средняя Самокат pipe method_chaining clean_code
Кросс-табуляция: распределение заказов по дню и часу Лёгкая Самокат crosstab datetime distribution
Resample: дневные продажи → недельная сумма с moving average Средняя X5 Group resample rolling time_series
Группировка timestamps в часовые корзины Средняя Wildberries algorithms python datetime analytics
Resample заказов по дням Лёгкая Ozon resample datetime aggregation
7-дневное скользящее среднее DAU Средняя VK rolling moving-average time-series
Day-over-day прирост через shift Средняя Tinkoff shift pct_change DoD time-series
Заполнение пропусков forward-fill Лёгкая Купер ffill fillna missing-values
Группировка по дню недели Средняя Самокат dt dayofweek groupby
Cumulative sum revenue Лёгкая Lamoda cumsum expanding running-total
Discretize timestamps в часовые корзины Средняя Я.Драйв dt groupby hour-buckets
Сравнение MoM-метрик через resample Сложная Wildberries resample pct_change MoM YoY
Парсинг nginx-логов через regex Сложная VK regex logs parsing
Парсинг datetime с разными форматами Средняя Сбер to_datetime parsing mixed-format real-world
Maximum Average Subarray I Лёгкая Yandex / Wildberries algorithms python sliding-window
Sliding Window Maximum Средняя Yandex / VK / Tinkoff algorithms python sliding-window deque
Rolling 7-day retention без pandas Средняя Tinkoff / Ozon (DA-real) algorithms python real-da hash-map
Z-score аномалий во временном ряду Средняя Сбер / VK (DA-real) algorithms python real-da statistics
Resample: дневные продажи в недельные Средняя WB / Ozon pandas resample time-series
Rolling 7-day average Средняя Yandex.Метрика pandas rolling time-series
Expanding median: статистика накопительно Средняя HH.ru pandas expanding time-series
Anomaly detection через скользящее стандартное отклонение Сложная мониторинг сервиса pandas rolling anomaly detection z-score
Resample: daily → weekly revenue Лёгкая WB pandas resample time-series
Rolling 7-day average с пропусками Средняя T-Bank pandas rolling resample fillna
Resample в месяц + rolling 3M moving average Средняя Сбер pandas resample rolling time-series
Скользящее среднее DAU за 3 дня Средняя Ozon pandas rolling moving-average timeseries
Помесячная выручка и рост MoM Средняя Ozon pandas timeseries resample pct_change
Последний заказ каждого клиента Средняя Ozon pandas groupby idxmax дедупликация

FAQ: частые вопросы про pandas: временные ряды

resample vs rolling — в чём разница?

resample меняет частоту индекса (например, дневные данные в недельные через .resample("W").sum()). rolling сохраняет частоту, но добавляет окно (последние N точек): .rolling(7).mean() — 7-дневная скользящая средняя.

Как сгруппировать события по дням?

df["date"] = pd.to_datetime(df["timestamp"]); df.groupby(df["date"].dt.date).size() — count по дням. Или через resample, если timestamp уже индекс.

Как посчитать неделю / месяц от даты?

.dt-accessor: df["date"].dt.isocalendar().week, df["date"].dt.month, df["date"].dt.weekday (0=Пн). Для агрегации по неделе чаще используется resample("W") или groupby(pd.Grouper(freq="W")).

Что такое pd.Grouper?

Альтернатива resample внутри groupby. df.groupby([pd.Grouper(key="date", freq="W"), "category"]).agg(...) — группировка по неделе + категории одновременно. Удобно для cohort-анализа.

Как рассчитать day-N retention в pandas?

Через merge с self-join: для каждого юзера найти все даты активности → merge с первой датой → diff в днях → groupby cohort_date, count where diff==7. Подробный пример — в задачах раздела.

Связанные темы Python

Pandas: основы · Pandas groupby · Pandas merge / join · NumPy векторизация · scipy: A/B-тесты · sklearn для аналитика · Графики: matplotlib / seaborn

Связанные темы SQL

Работа с датами · Оконные функции

Открыть весь Python-тренажёр (561 задач) →