Ситуация: Команда хочет тестировать dark theme. Spread metric: time-on-app. Сколько юзеров и времени надо?
Baseline time-on-app = 28 min/session. Standard deviation = 18 min (сильно разлог).
sessions: session_id, user_id, ts, duration_min, app_version, themehistorical_data: 6 months of sessions, для variance estimationusers: user_id, registration_ts, prefer_dark, last_activetheme_preference_log: user_id, theme, ts_set (для split-stratification)Жанр кейса: A/B-тест: design + анализ — все кейсы этого типа.
Дизайн теста (primary metric, guardrails, sample size, длительность), анализ результатов (significance, segments, novelty effect) и interpretation для бизнеса.
Peeking (стоп при «явной победе»), без guardrails, без power analysis, игнорирование novelty effect, SRM не проверяется, p-hacking при extend.
Variance reduction: используем pre-experiment данные юзера для корректировки в-experiment метрики. Сокращает sample size в 1.5-2 раза при тех же MDE.