Есть два датафрейма: `orders` (100k строк) и `users` (500k строк). Нужно приджойнить users к orders по user_id. Что лучше: `orders.merge(users, on="user_id")` или `orders.join(users.set_index("user_id"), on="user_id")`?
Pythonmediummiddle
Варианты ответа
Оба варианта работают, но второй (.join с set_index) обычно быстрее на больших данных — индекс ускоряет lookup
Всегда быстрее .merge, потому что он оптимизирован в C
Всегда быстрее .join, потому что это нативный pandas метод
Разницы нет вообще — под капотом один и тот же код
Разбор ответа
Подробный разбор с объяснением «почему правильный ответ верный» и почему остальные неверны — после регистрации.
2475 вопросов с разбором, quiz-режим с проверкой, AI-собес и подготовка к интервью аналитика.