Yandex Музыка: новый player UI — sample ratio mismatch

Сложный Медиа UX 50 мин A/B-test analysis

Ситуация: A/B test: 50/50 split. По факту в DB: 52.3 / 47.7. Тест продлили — расходимость. SRM detected.

Команда хочет ignore SRM и анализировать. Senior data scientist: «нельзя — system bias делает результат невалидным».

Доступные данные

Задачи

Все кейсы для подготовки →

Жанр кейса: A/B-тест: design + анализ — все кейсы этого типа.

Как разбирать A/B-тест: design + анализ кейсы

Что спрашивают на A/B-кейсах?

Дизайн теста (primary metric, guardrails, sample size, длительность), анализ результатов (significance, segments, novelty effect) и interpretation для бизнеса.

Какие типичные ошибки в A/B?

Peeking (стоп при «явной победе»), без guardrails, без power analysis, игнорирование novelty effect, SRM не проверяется, p-hacking при extend.

Что такое CUPED?

Variance reduction: используем pre-experiment данные юзера для корректировки в-experiment метрики. Сокращает sample size в 1.5-2 раза при тех же MDE.

← Все кейсы