我有一个pandas.DataFrame,它有以下列:['agent', 'agentid', 'agentname', 'agentaddress']
当我将此数据帧与另一个具有相同基数的数据帧合并时,它会在末尾附加一个具有相同名称的额外列
>>> print(df1)
agent agentid agentname agentaddress
0 1 1001 test delhi
>>> print(df2)
agent agentid agentname agentaddress
0 2 1002 test1 vadodara
当我计算这两个数据帧时,它给出以下结果:
>>> print(pd.concat([df1, df2], sort=False))
agent agentid agentname agentaddress agentid
0 1 1001.0 test delhi NaN
0 2 NaN test1 vadodara 1002.0
在df1和df2中,列名“agentid”不同,因此您可以得到这个结果。请重新检查列名“agentid”,确保它们是相同的字符串
尝试检查两个数据帧中整个列的数据类型。有时ID可以是分类数据类型
我创建了单独的csv文件,并尝试了您在这里所做的工作:它工作得非常好,检查两个文件中列的名称是否正确
相关问题 更多 >
编程相关推荐