我有两个excel文件,A和B。主副本,其中有员工姓名和组织名称的更新记录(Name
和Org
)。文件B包含Name
和Org
列,这些列的记录稍旧一些,还有许多我们不感兴趣的其他列
Name Org
0 abc ddc systems
1 sdc ddc systems
2 csc ddd systems
3 rdc kbf org
4 rfc kbf org
我想执行以下操作
1)对于文件B(列Name
和Org
)中的所有现有条目,我想比较文件B和文件A,在文件B中创建另外两列(Newemployee
和Org_change
)
Name
”下的文件B中发现缺少名称条目,则使用“Y
”更新“Newemployee
”列李>Org
”下的组织发生了变化,请将“Org_change
”列更新为“新组织名称(根据与表A的比较)”到目前为止,我已经对这两个数据框进行了concat,以获取新员工的姓名 但没有得到进一步的线索如何继续
full_set = pd.concat([B, A]).drop_duplicates(subset=['Name'])
任何帮助都将不胜感激。谢谢
在删除副本时,您可以选择不保留任何一个副本,这基本上意味着您只保留唯一的值。如果其中一个数据帧是另一个数据帧的严格子集,这将为您提供更新
看来你的指数不匹配。如果遇到此问题,可能需要首先设置索引
其中,最后一个
reset_index
只是恢复为索引只是一个枚举计数器的格式编辑:
我可以添加任意数量的员工,它会继续工作。^^
相关问题 更多 >
编程相关推荐