我需要用相同的ID更新本地文件夹中预先存在的CSV。让我详细说明这个问题
df1:
Item_id Country Compay
1 Germany sitz.co
2 likrds.co
3 Denmark Axitr.co
4 Italy
这是我的df1,我想在我的文件夹中将此文件导出为CSV。所以我这样做了
df1.to_csv(r'folder_path\df1.csv',index=False)
现在,我的文件夹中有df1。假设我有一个带有新item_ID的df2,以及df1中的一些item_ID。我想将df2附加到同一个文件中,如果该文件包含类似的item_id,它应该更新预先存在的记录,并将新的item_id记录附加到该CSV中
df2:
Item_id Country Compay
11 Argentina sitz.co
2 Russia likrds.co
13 Denmark Axitr.co
4 Italy ghrx.co
df2.to_csv(r'folder_path\df1.csv',mode='a',index=False)
当我运行上述代码时,CSV将附加重复的记录,但我需要根据项目ID使用新记录更新这些记录
所需的_csv:
Item_id Country Compay
1 Germany sitz.co
2 Russia likrds.co
3 Denmark Axitr.co
4 Italy ghrx.co
11 Argentina sitz.co
13 Denmark Axitr.co
下面是一个使用
glob
和groupby+last
的解决方案:如果只有2个数据帧:
使用^{} 将} :
df1
和df2
的索引设置为Item_id
,然后使用^{结果:
相关问题 更多 >
编程相关推荐