Ситуация: A/B показал +12% CTR на recsys в неделю 1, но +3% в неделю 2-3. Что происходит и как анализировать.
Команда recsys уверена в победе. Старший аналитик: «вы поймали novelty effect, не реальный uplift».
ab_logs: user_id, variant, ts, event_typesessions: session_id, user_id, tspre_period: те же юзеры до тестаЖанр кейса: A/B-тест: design + анализ — все кейсы этого типа.
Дизайн теста (primary metric, guardrails, sample size, длительность), анализ результатов (significance, segments, novelty effect) и interpretation для бизнеса.
Peeking (стоп при «явной победе»), без guardrails, без power analysis, игнорирование novelty effect, SRM не проверяется, p-hacking при extend.
Variance reduction: используем pre-experiment данные юзера для корректировки в-experiment метрики. Сокращает sample size в 1.5-2 раза при тех же MDE.