**Контекст:** Реальная задача с собеса в Яндекс / Сбер. Тестируется новая ранжировка ленты, метрика — **CTR (click-through rate) per session**.
Чаще всего аналитики делают наивно:
[см. код в задании]
**Проблема:** `CTR = Σclicks / Σimpressions` — это **ratio metric** (отношение двух случайных величин). Дисперсия такого отношения **не равна** дисперсии среднего per-user CTR. Наивный t-test даёт **завышенный Type I error** (ложные позитивные).
**Задание:** реализовать корректный тест для ratio metrics через **Delta method**.
**Данные:**
[см. код в задании]
**Задание:**
1. Наивный t-test на per-user CTR (`clicks / impressions`). Вывести p-value и оценку.
2. Правильный delta-method t-test. Вывести p-value и CI для разницы CTR.
3. Симулировать 1000 A/A экспериментов и посчитать false positive rate для обоих методов — показать что наивный > 5%, delta-method ≈ 5%.
ratio-metrics delta-method ab-test statistics python
Это задание для уровня Senior. Senior-уровень — глубокое понимание темы, опыт решения нестандартных задач, обсуждение trade-off на собеседовании.
Подобные задания в категории «A/B-тесты» регулярно дают на собеседованиях аналитика данных в Яндекс, Сбер, Ozon, Авито, Тинькофф, Wildberries, T-Bank, X5, ВТБ и других крупных IT-компаниях. Тематика: ratio-metrics, delta-method, ab-test, statistics, python.
На реальном собеседовании на подобную задачу отводится 30-60 минут с обсуждением подходов, оптимизаций и trade-off. Для тренировки рекомендуем сначала решить самостоятельно, потом сверить с эталонным решением и подсказками.
На zasqlpython.ru есть другие задания в категории «A/B-тесты», продуктовые кейсы, справочник метрик, AI мок-собеседование с разбором ваших ответов.
← Все задания