ID values
111 reason1
111 reason2
111 reason3
222 reason2
222 reason4
222 reason5
df.drop_duplicates(["ID"], keep='???', inplace=True)
我知道的方法是使用drop\u duplicates,但它只给了我一个选项first
,last
。我想检查一下,如果有原因2,那么用reason2保存记录,否则检查reason3等等。基本上,有特定的顺序,比如reason2、reason3、reason4等
根据注释,这可以是实现之一:(实现@brittenb的思想)
输出:
^{pr2}$使用具有定义的顺序和排序的“category”数据类型:
输出:
^{pr2}$相关问题 更多 >
编程相关推荐