我有一个CSV文件,看起来像这样:
# data.csv (this line is not there in the file)
Names, Age, Names
John, 5, Jane
Rian, 29, Rath
当我用Python通过Pandas阅读时,我得到了如下结果:
import pandas as pd
data = pd.read_csv("data.csv")
print(data)
程序的输出为:
Names Age Names
0 John 5 Jane
1 Rian 29 Rath
有没有办法得到:
Names Age
0 John 5
1 Rian 29
2 Jane
3 Rath
首先,我建议为每一列指定唯一的名称。进入csv文件并更改列标题的名称,或者在pandas中进行更改
使用
'Names2'
作为第二次出现相同列名的列的标题,尝试以下操作:从
我们有
因此,请使用:
为了得到你想要的结果
由内而外:
}的结果与数据帧的其余部分合并
df.append
组合列pd.concat( ... )
将{要了解其他命令的作用,我建议逐个删除它们并查看结果
请原谅
dff
的格式设置。我试图从教育的角度把一切都说清楚。 调整缩进,使代码能够编译您可以使用:
使用cols,这有助于只读取选定的列
使用低内存,以便我们在内部分块处理文件
请在csv中使用唯一的列名
相关问题 更多 >
编程相关推荐