Что такое Simpson's Paradox и как он может обмануть продуктового аналитика при сравнении групп?
Метрикиmediummiddle
Варианты ответа
Тренд в агрегированных данных противоречит тренду внутри подгрупп из-за неравного распределения третьей переменной. Классика: A лучше B в среднем, но B лучше A во всех сегментах
Когда маленькая выборка показывает большой эффект, исчезающий при увеличении n. Это следствие высокой дисперсии — с ростом выборки эффект регрессирует к нулю и значимость исчезает
Ошибка множественных сравнений: при одновременной проверке многих гипотез одна случайно окажется значимой. Simpson доказал это математически для любой α выше нуля процентов
Когда метрика кажется растущей, но это артефакт изменения знаменателя, а не числителя. Например, CTR вырос потому что упали показы, не потому что стало больше кликов по баннеру
Разбор ответа
Подробный разбор с объяснением «почему правильный ответ верный» и почему остальные неверны — после регистрации.
2475 вопросов с разбором, quiz-режим с проверкой, AI-собес и подготовка к интервью аналитика.