Ситуация: Ложноположительные срабатывания модерации — 18% (удалены нормальные посты). Ложноотрицательные — 7% (пропущен harmful content). Авторы подают 50 000 апелляций/день.
Платформа использует ML-модель + человеческую модерацию. ML обрабатывает 95% контента, 5% — ручная проверка. Бюджет модерации — $20 млн/год. Регуляторы требуют удалять harmful content за 24 часа.
moderation_decisions: content_id, model_score, model_decision, human_decision, final_decision, categoryappeals: appeal_id, content_id, appeal_date, review_date, outcome, reviewer_idcontent_reports: report_id, content_id, reporter_id, reason, timestampmoderator_performance: moderator_id, date, reviewed_count, accuracy_pct, avg_review_time_sec