**Данные:** DataFrame `daily_txn` с колонками: `date`, `transaction_count`, `avg_amount`, `error_rate`.
**Задание:**
1. Реализуйте обнаружение аномалий методом z-score (`|z| > 3`)
2. Реализуйте обнаружение аномалий методом IQR (`< Q1 - 1.5*IQR` или `> Q3 + 1.5*IQR`)
3. Сравните результаты двух методов
Структура для ориентира — реальные значения из эталонного решения.
daily = pd.DataFrame({
'date': dates,
'transaction_count': txn_count.astype(int),
'avg_amount': np.random.normal(1200, 150, n).round(2),
'error_rate': np.random.beta(2, 50, n).round(4),
})
pandas z-score IQR аномалии numpy
Это задание для уровня Middle. Для middle-аналитиков с опытом 1-3 года, требует уверенного владения темой и понимания edge cases.
Подобные задания в категории «Python» регулярно дают на собеседованиях аналитика данных в Яндекс, Сбер, Ozon, Авито, Тинькофф, Wildberries, T-Bank, X5, ВТБ и других крупных IT-компаниях. Тематика: pandas, z-score, IQR, аномалии, numpy.
На реальном собеседовании на подобную задачу отводится 15-30 минут — оцениваются подход, корректность, обработка edge cases. Для тренировки рекомендуем сначала решить самостоятельно, потом сверить с эталонным решением и подсказками.
На zasqlpython.ru есть 482 Python задачи с проверкой через Pyodide, конспекты Python и pandas, AI мок-собеседование с разбором ваших ответов.
← Все задания