假设我有这样一个数据集:
id_police id_sinistre datesurv
0 p123 s120 01/01/2018
1 p123 s121 03/01/2018
2 p123 s122 05/05/2018
3 p222 s123 04/05/2018
4 p222 s124 02/12/2018
5 p433 s125 07/08/2018
6 p433 s126 08/09/2018
7 p433 s127 10/10/2018
我的目标是找出每一行在过去6个月内最后出现的id_police
,如下所示:
id_police id_sinistre datesurv occ
0 p123 s120 01/01/2018 0
1 p123 s121 03/01/2018 1
2 p123 s122 05/05/2018 2
3 p222 s123 04/05/2018 0
4 p222 s124 02/12/2018 0
5 p433 s125 07/08/2018 0
6 p433 s126 08/09/2018 1
7 p433 s127 10/10/2018 2
我想我需要.duplicated
或.groupby
但我不知道如何使用它们。。。提前感谢您的帮助!你知道吗
另一种选择是^{} 这个} 来创建6个月的组,并使用^{} :
datesurv
,也可以使用^{如果6个月应简化为6*30天,则使用带有
diff
的自定义lambda函数,按值和上次累计和进行比较:相关问题 更多 >
编程相关推荐