Детектор аномалий через Isolation Forest

Senior Python Fintech

Условие задания

**Контекст:** Задание с собеса в финтех (antifraud). Дано: таблица транзакций с несколькими фичами. Нужно написать детектор, который помечает подозрительные транзакции — многомерные аномалии, которые классический z-score не ловит (например, нормальная сумма + нормальный мерчант + необычный merchant+сумма+время вместе).

**Данные:**

[см. код в задании]

**Задание:**

1. Написать функцию `detect_anomalies(df, contamination=0.02)` возвращающую df с колонкой `anomaly_score` (float) и `is_anomaly` (bool).
2. Использовать Isolation Forest из sklearn.
3. One-hot encode категориальную `merchant_cat`.
4. Контаминация по умолчанию 2% — ожидаем что ~2% транзакций аномальны.
5. Возвращать отсортированный по score DataFrame (самые подозрительные сверху).

Темы

anomaly-detection isolation-forest sklearn fraud

Подсказки

Все тестовые задания → ← Все задания