将dataframe保存并加载到csv会导致未命名列

2024-06-25 05:30:21 发布

您现在位置:Python中文网/ 问答频道 /正文

标题中的问题。例如:

x=[('a','a','c') for i in range(5)]
df = DataFrame(x,columns=['col1','col2','col3'])
df.to_csv('test.csv')
df1 = read_csv('test.csv')

   Unnamed: 0 col1 col2 col3
0           0    a    a    c
1           1    a    a    c
2           2    a    a    c
3           3    a    a    c
4           4    a    a    c

原因似乎是,在保存数据帧时,索引列也会被写入,而头部没有名称。然后,当您再次加载csv时,它将与索引列一起作为未命名列加载。这是虫子吗?如何避免使用索引编写csv,或在读取时删除未命名的列?


Tags: columnscsvtointest标题dataframedf
3条回答

可以使用cols参数显式指定要写入的列。

这些不是对称的,因为在csv格式中由于位置的原因存在歧义。您需要在回读时指定index_col

In [1]: x=[('a','a','c') for i in range(5)]

In [2]: df = DataFrame(x,columns=['col1','col2','col3'])

In [3]: df.to_csv('test.csv')

In [4]: !cat test.csv
,col1,col2,col3
0,a,a,c
1,a,a,c
2,a,a,c
3,a,a,c
4,a,a,c

In [5]: pd.read_csv('test.csv',index_col=0)
Out[5]: 
  col1 col2 col3
0    a    a    c
1    a    a    c
2    a    a    c
3    a    a    c
4    a    a    c

这看起来与上面非常相似,所以“foo”是列还是索引?

In [6]: df.index.name = 'foo'

In [7]: df.to_csv('test.csv')

In [8]: !cat test.csv
foo,col1,col2,col3
0,a,a,c
1,a,a,c
2,a,a,c
3,a,a,c
4,a,a,c

您可以通过indexindex_labelparameters of to_csv删除行标签。

相关问题 更多 >