**Контекст:** Стриминговый сервис сравнивает два алгоритма рекомендаций фильмов. Классический A/B-тест требует миллионы пользователей (MDE по CTR < 0.5%), длится 4+ недели. Команда предлагает **interleaving** — метод, который в 10-100× чувствительнее.
**Данные:**
Interleaving-эксперимент (3 дня, 50 000 пользователей):
Каждому пользователю показывается одна лента из смешанных рекомендаций алгоритмов A и B. Клик на элемент «засчитывается» соответствующему алгоритму.
**Team Draft Interleaving:**
| Метрика | Алгоритм A | Алгоритм B |
|---------|-----------|-----------|
| Общее число «побед» (wins) | 21 300 | 28 700 |
| Win rate | 42.6% | 57.4% |
| Среднее кликов на алгоритм/сессия | 2.1 | 2.8 |
| Позиция среднего клика | 4.2 | 3.1 |
**Balanced Interleaving:**
| Метрика | Алгоритм A | Алгоритм B |
|---------|-----------|-----------|
| Win rate | 43.8% | 56.2% |
| Credit score (normalized) | 0.438 | 0.562 |
| Tie sessions | 12.4% | |
**Параллельный классический A/B (для валидации, 500 000 на группу):**
- CTR_A = 8.2%, CTR_B = 8.5%
- Δ CTR = +0.3 п.п. (+3.7%), p-value = 0.142
**Задание:**
1. Объясните, как работает Team Draft Interleaving.
2. Проведите биномиальный тест для результатов interleaving.
3. Почему interleaving в 10-100× чувствительнее классического A/B?
4. Какие ограничения у interleaving?
A/B-тест interleaving рекомендации Team Draft sensitivity ранжирование
Это задание для уровня Senior. Senior-уровень — глубокое понимание темы, опыт решения нестандартных задач, обсуждение trade-off на собеседовании.
Подобные задания в категории «A/B-тесты» регулярно дают на собеседованиях аналитика данных в Яндекс, Сбер, Ozon, Авито, Тинькофф, Wildberries, T-Bank, X5, ВТБ и других крупных IT-компаниях. Тематика: A/B-тест, interleaving, рекомендации, Team Draft, sensitivity.
На реальном собеседовании на подобную задачу отводится 30-60 минут с обсуждением подходов, оптимизаций и trade-off. Для тренировки рекомендуем сначала решить самостоятельно, потом сверить с эталонным решением и подсказками.
На zasqlpython.ru есть другие задания в категории «A/B-тесты», продуктовые кейсы, справочник метрик, AI мок-собеседование с разбором ваших ответов.
← Все задания