我想找到“reference”列的重复值,然后只在找到“amount”列的最大金额的行时避免重复。在
当前:
+----------+---------------------+---------+
| reference | amount | column3 | column4 |
+----------+---------------------+---------+
| test1 | 9 | 45 | ye |
| test1 | 200| 45 | agag |
| test1 | 1 | 45 | aaa |
| test2 | 99 | 45 | bbab |
| test1 | 11 | 45 | value |
+----------+---------------------+----------+
期望:
^{pr2}$请分享关于这种情况的线索。在
pandaps是一个非常好的python模块,用于处理表格数据。它很像R语言,提供了一种内存数据库。对于您的例子,它很简单:
并将结果保存回csv:
^{pr2}$假设测试.csv您的数据文件是这样的:
像下面这样的事情将是一个好的开始:
这将为您提供以下输出:
^{pr2}$下面是一些代码,可以满足您的需要:
相关问题 更多 >
编程相关推荐