**Данные:** DataFrame `daily_sales` с колонками: `date`, `region`, `revenue`. Промо-акция запущена в одном регионе (treatment), остальные — контроль.
**Задание:**
1. Постройте synthetic control из линейной комбинации контрольных регионов (до промо)
2. Спрогнозируйте counterfactual (что было бы без промо) на период после запуска
3. Оцените causal impact: разницу между фактом и counterfactual
4. Рассчитайте кумулятивный эффект и доверительный интервал
Структура для ориентира — реальные значения из эталонного решения.
post_df = pd.DataFrame({
'date': post.index,
'actual': y_post,
'counterfactual': counterfactual_post,
'impact': impact_daily,
'impact_pct': impact_pct,
})
pandas causal inference synthetic control sklearn LinearRegression
Это задание для уровня Senior. Senior-уровень — глубокое понимание темы, опыт решения нестандартных задач, обсуждение trade-off на собеседовании.
Подобные задания в категории «Python» регулярно дают на собеседованиях аналитика данных в Яндекс, Сбер, Ozon, Авито, Тинькофф, Wildberries, T-Bank, X5, ВТБ и других крупных IT-компаниях. Тематика: pandas, causal inference, synthetic control, sklearn, LinearRegression.
На реальном собеседовании на подобную задачу отводится 30-60 минут с обсуждением подходов, оптимизаций и trade-off. Для тренировки рекомендуем сначала решить самостоятельно, потом сверить с эталонным решением и подсказками.
На zasqlpython.ru есть 482 Python задачи с проверкой через Pyodide, конспекты Python и pandas, AI мок-собеседование с разбором ваших ответов.
← Все задания