我在潜望镜数据中创建图表,然后做熊猫实验,得出我们的结果。我在从结果中删除重复项时遇到了困难
这是我们的数据经过计算后在最后的数据帧中的样子
vendor_ID date opening purchase paid closing
B2345 01/01/2015 5 20 10 15
B2345 01/01/2015 15 50 20 45
B2345 02/01/2015 45 4 30 19
我想删除基于供应商ID和日期的重复条目,但保留开始打开和最后一个条目关闭
即)我想要的预期结果
vendor_ID date opening purchase paid closing
B2345 01/01/2015 5 70 30 45
B2345 02/01/2015 45 4 30 19
我已经尝试下面的代码删除重复,但这给了我们不同的错误
df.drop_duplicates(subset=["vendor_ID", "date"], keep="last", inplace=True)
如何以这种方式编写代码来删除重复项并保留上面示例中提到的第一个和最后一个
将^{} 与为输出的每列指定的^{} 、^{} 和^{} 一起使用:
注意:谢谢@Erfan-如果需要,使用minimal和maximum列代替first和last将dict更改为
{'opening':'min','purchase':'sum','paid':'sum', 'closing':'max'}
如果不确定日期时间是否排序:
您还可以为
sum
所有没有前2个并用于第一个和最后一个的列创建动态字典:相关问题 更多 >
编程相关推荐