**Контекст:** Аналитик соцсети обнаружил, что пользователи, заполнившие профиль полностью (фото + био + место работы), имеют `D30 retention` = 65%, тогда как пользователи с пустым профилем — лишь 18%. PM хочет сделать заполнение профиля обязательным для всех.
**Данные:**
| Группа | Кол-во | `D30 retention` | Ср. сессий/нед | Ср. друзей |
|---|---|---|---|---|
| Полный профиль | 120 000 | 65% | 12.3 | 45 |
| Частичный профиль | 280 000 | 35% | 5.8 | 12 |
| Пустой профиль | 100 000 | 18% | 2.1 | 3 |
Дополнительно: из 50 000 пользователей, заполнивших профиль по промпту (push-уведомление), retention через 30 дней = 28%.
**Задание:**
1. Объясните, почему корреляция «полный профиль → высокий retention» не означает причинно-следственную связь.
2. Какой confounding variable здесь действует?
3. Как данные про «промпт-группу» (28%) помогают оценить истинный каузальный эффект?
4. Какой эксперимент нужно провести, чтобы измерить реальный эффект заполнения профиля?
корреляция причинность confounding самоселекция каузальный вывод
Это задание для уровня Senior. Senior-уровень — глубокое понимание темы, опыт решения нестандартных задач, обсуждение trade-off на собеседовании.
Подобные задания в категории «Метрики» регулярно дают на собеседованиях аналитика данных в Яндекс, Сбер, Ozon, Авито, Тинькофф, Wildberries, T-Bank, X5, ВТБ и других крупных IT-компаниях. Тематика: корреляция, причинность, confounding, самоселекция, каузальный вывод.
На реальном собеседовании на подобную задачу отводится 30-60 минут с обсуждением подходов, оптимизаций и trade-off. Для тренировки рекомендуем сначала решить самостоятельно, потом сверить с эталонным решением и подсказками.
На zasqlpython.ru есть другие задания в категории «Метрики», продуктовые кейсы, справочник метрик, AI мок-собеседование с разбором ваших ответов.
← Все задания