Сохраните сводную таблицу pandas, чтобы включить имена индексов и столбцов

#python #pandas #pivot-table #export-to-csv

#python #pandas #сводная таблица #экспорт в csv

Вопрос:

Я хочу сохранить сводную таблицу pandas для чтения человеком, но DataFrame.to_csv не включает DataFrame.columns.name . Как я могу это сделать?

Пример:

Для следующей сводной таблицы:

 >>> import pandas as pd
>>> df = pd.DataFrame([[1, 2, 3], [6, 7, 8]])
>>> df.columns = list("ABC")
>>> df.index = list("XY")
>>> df
   A  B  C
X  1  2  3
Y  6  7  8
>>> p = pd.pivot_table(data=df, index="A", columns="B", values="C")
  

При просмотре сводной таблицы у нас есть как имя индекса («A»), так и имя столбцов («B»).

 >>> p
B    2    7
A
1  3.0  NaN
6  NaN  8.0
  

Но при экспорте в формате csv мы теряем имена столбцов:

 >>> p.to_csv("temp.csv")

===temp.csv===
A,2,7
1,3.0,
6,,8.0
  

Как я могу получить какой-то удобочитаемый формат вывода, который содержит всю сводную таблицу, включая .columns.name («B»)?

Что-то вроде этого было бы прекрасно:

 B,2,7
A,,
1,3.0,
6,,8.0
  

Комментарии:

1. сохраните затем в Excel

2. @Wen-Ben Не могли бы вы быть более конкретным?

3. pandas.pydata.org/pandas-docs/stable/reference/api/…

4. @Wen-Ben Это дает мне то же самое, что и .xls , не включая «B».

5. Как работает p.to_csv('temp.csv', index_label=[p.index.name, p.columns.name]) ?

Ответ №1:

Да, это возможно путем добавления вспомогательного фрейма данных, но чтение файла немного затруднено:

 p1 = pd.DataFrame(columns=p.columns, index=[p.index.name]).append(p)
p1.to_csv('temp.csv',index_label=p.columns.name)
B,2,7
A,,
1,3.0,
6,,8.0

#set first column to index
df = pd.read_csv('temp.csv', index_col=0)
#set columns and index names
df.columns.name = df.index.name
df.index.name = df.index[0]
#remove first row of data
df = df.iloc[1:]
print (df)
B    2    7
A          
1  3.0  NaN
6  NaN  8.0