比较从两个excel文件创建的两个数据框，根据

1条回答

网友

1楼 · 发布于 2024-06-16 12:44:19

在删除副本时，您可以选择不保留任何一个副本，这基本上意味着您只保留唯一的值。如果其中一个数据帧是另一个数据帧的严格子集，这将为您提供更新

diff_set = pd.concat([old, new]).drop_duplicates(subset=['Name'], keep=False)

看来你的指数不匹配。如果遇到此问题，可能需要首先设置索引

diff_set = pd.concat([old.set_index("Org"), new.set_index("Org")]).drop_duplicates(subset=['Name'], keep=False).reset_index(drop=False)

其中，最后一个reset_index只是恢复为索引只是一个枚举计数器的格式

编辑：

ll
Out[101]: 
  Name          Org
0  abc  ddc systems
1  sdc  ddc systems
2  csc  ddd systems
3  rdc      kbf org
4  rfc      kbf org

ll2
Out[102]: 
   Name          Org
0   abc  ddc systems
1   sdc  ddc systems
2   csc  ddd systems
3   rdc      kbf org
4   rfc      kbf org
5  Spam  ddc systems
6  John  ddc systems
7   Foo  ddd systems

diff_set = pd.concat([ll.set_index("Org"), ll2.set_index("Org")]).drop_duplicates(subset=['Name'], keep=False).reset_index(drop=False)

diff_set
Out[104]: 
           Org  Name
0  ddc systems  Spam
1  ddc systems  John
2  ddd systems   Foo

我可以添加任意数量的员工，它会继续工作。^^

相关问题更多 >

编程相关推荐

热门问题

热门文章

比较从两个excel文件创建的两个数据框，根据

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >