df имеет 5M строк с колонкой category (~20 уникальных значений: "electronics", "books", ...). Что сэкономит больше памяти: df["category"] = df["category"].astype("category") или сохранить как object?
Pythonhardsenior
Варианты ответа
category — экономит ~80% памяти для low-cardinality колонок (хранится как int8/int16 + словарь категорий)
object — быстрее работает на pandas, всегда лучший выбор для строковых данных независимо от cardinality
Они одинаковы по памяти, просто разный API — pandas под капотом приводит оба типа к одному формату хранения
category ломает merge и groupby операции из-за internal type mismatch — не использовать в продакшн pipelines
Разбор ответа
Подробный разбор с объяснением «почему правильный ответ верный» и почему остальные неверны — после регистрации.
2475 вопросов с разбором, quiz-режим с проверкой, AI-собес и подготовка к интервью аналитика.