抱歉,我对这一切都很陌生,所以请原谅我可能会问的任何愚蠢的问题
我正在尝试合并salesforce使用pandas的两份报告
我有两份报告:
并且想要制作:Combined Report
我尝试过合并、连接和对齐数据帧,但是,因为这两个数据帧共享相同的索引,所以我的工厂报告的第一行重复5次,即:
我的下一个想法是使用.align(),然后使用.duplicated()返回一个显示重复行的布尔序列,并清除重复行的内容。如果使用此方法,如何才能清除行的内容
而且这似乎效率很低,很难做到,有没有更优雅的解决方案
干杯
下面是一些示例数据
劳工报告.csv
plant-report.csv
下面的代码可以使用。逻辑是添加一个额外的列来标记行是否需要联接。然后我们可以在pandas上进行左合并,然后在合并后删除这个额外的列
应该产生结果
假设您不需要在最终结果上重复“DJR Number”列。我们可以根据DJR编号连接这两个数据帧。Duplicated函数将返回一系列关于它们是否重复的布尔值。如果它们是真的,我们给它赋值为空
如果您想要更清晰的结果,可以合并到三列上
这不会导致任何重复的列
有关文件,请参阅Pandas Duplicated
相关问题 更多 >
编程相关推荐