Ситуация: Только 1200 риелторов в pilot. Как валидно тестировать?
B2B-сегмент, низкий traffic. Стандартные frequentist методы не работают.
agents: agent_id, ts_active, region, tier (junior/middle/senior)leads_processed: agent_id, ts, count, sourcebot_interactions: agent_id, ts, action_type (search/respond/notify)ab_assignments: agent_id, variant, assigned_tsЖанр кейса: A/B-тест: design + анализ — все кейсы этого типа.
Дизайн теста (primary metric, guardrails, sample size, длительность), анализ результатов (significance, segments, novelty effect) и interpretation для бизнеса.
Peeking (стоп при «явной победе»), без guardrails, без power analysis, игнорирование novelty effect, SRM не проверяется, p-hacking при extend.
Variance reduction: используем pre-experiment данные юзера для корректировки в-experiment метрики. Сокращает sample size в 1.5-2 раза при тех же MDE.