С базовых операций: pd.read_csv, df.head/info/describe, фильтрация df[df.col > 0], сортировка sort_values, базовые агрегации (sum, mean, count). Освоить эти 6 операций — 70% типовых задач джуниор-собеса.
SQL первым: его спросят на любом собесе аналитика, а в pandas есть всё то же самое плюс ещё. Освоил SQL — pandas даётся за 2-3 недели через прямые аналогии (SELECT → df[col], WHERE → df[df.col==x], JOIN → df.merge).
50-70 задач разной сложности достаточно для уверенного прохождения первого раунда. На сайте 190+ pandas-задач с компаниями (Ozon, Yandex, T-Bank, Avito) — фильтр по difficulty покажет что подходит твоему уровню.
Series — одномерный массив с индексом (как один столбец). DataFrame — двумерная таблица (несколько столбцов с общим индексом). df["col"] возвращает Series, df[["col"]] — DataFrame из одной колонки.
.loc[row_label, col_label] — доступ по меткам (имена строк/столбцов). .iloc[row_index, col_index] — доступ по числовым позициям (как в numpy). На собесе спросят оба варианта.
Pandas groupby · Pandas merge / join · Pandas time series · NumPy векторизация · scipy: A/B-тесты · sklearn для аналитика · Графики: matplotlib / seaborn