Освой pandas с нуля: что такое Series и DataFrame, как создавать данные из dict, списков и numpy. База для аналитики данных.
Это часть 1 из 10 курса «Pandas с нуля для аналитика». Здесь ты разберёшься, что вообще такое pandas, чем Series отличается от DataFrame и как собрать данные руками из словаря, списка или numpy-массива. Это фундамент — без него остальные 9 частей будут магией, а не инструментом.
Series — это одномерный массив с индексом (фактически одна колонка), а DataFrame — двумерная таблица из нескольких Series с общим индексом строк. Колонка DataFrame, взятая через df['col'], возвращается как Series.
Передайте структуру в конструктор: pd.DataFrame({'a': [1,2], 'b': [3,4]}) создаст колонки из ключей словаря, а pd.DataFrame([[1,3],[2,4]], columns=['a','b']) — из списка списков, где каждый вложенный список это строка.
Передайте параметр index в конструктор: pd.DataFrame(data, index=['x','y','z']). Уже готовому DataFrame индекс меняют через df.set_index('col') или df.index = [...].