import pandas as pd
df = pd.DataFrame({
'year': [2017, 2018, 2018, 2019, 2019],
'date': ['01.01.2017', '22.04.2018', '31.01.2018', '19.03.2019', '03.12.2019'],
'id': ['72297143', '6de190ee', '0e1e8e89', 'ab4f99ab', '7d81a711']
})
对于year
列中的每个重复值(如2019和2019),我希望保留最新的date
(在上面的示例中是03.12.2019)
最后我想去掉date
列,只保留year
和id
我该怎么做
在
sort_values
之后使用drop_duplicated
然后排序…
非常类似于@WeNYoBen。不同之处在于,我维护现有的
date
不管它是什么,并按转换后的值排序groupby
和idxmax
同样,我保留了
date
中的原始数据类型。如果您想要实际的日期时间,将结果分配给数据帧是很简单的相关问题 更多 >
编程相关推荐