Datetime和基于ID的Cumcount

ID Date Mention_of_Yes XDA 11/19/2019 0 XDA 12/19/2019 1 XDA 12/19/2019 1 XDA 1/19/2020 1 XDA 2/19/2020 0 XDA 3/19/2020 1 JJL 11/2/2019 1 JJL 11/2/2019 1 JJL 12/2/20019 0 JJL 1/20/2020 1

ID Date Mention_of_Yes *Correct CumCount XDA 11/19/2019 0 0 XDA 12/19/2019 1 1 XDA 12/19/2019 1 1** Only Counts Once Per Date (12/19/2019 in this case) XDA 1/19/2020 1 2 XDA 2/19/2020 0 2 XDA 3/19/2020 1 3 JJL 19/2/2019 0 0 JJL 10/2/2019 0 0 JJL 11/2/2019 1 1 JJL 11/2/2019 1 1** Only Counts Once Per Date (11/2/2019 in this case) JJL 12/2/20019 0 1 JJL 1/20/2020 1 2

1条回答

网友

1楼 · 发布于 2024-09-30 05:18:00

您可以在drop_duplicates之后使用groupby和cumsum（而不是cumcount），然后使用ffill来执行此操作，如：

df['Correct_CumCount'] = df.drop_duplicates(subset=['ID', 'Date', 'Mention_of_Yes'], 
                                            keep='first')\
                           .groupby('ID')['Mention_of_Yes'].cumsum()
df['Correct_CumCount'] = df['Correct_CumCount'].ffill().astype(int)

print (df)
    ID        Date  Mention_of_Yes  Correct_CumCount
0  XDA  11/19/2019               0                 0
1  XDA  12/19/2019               1                 1
2  XDA  12/19/2019               1                 1
3  XDA   1/19/2020               1                 2
4  XDA   2/19/2020               0                 2
5  XDA   3/19/2020               1                 3
6  JJL   11/2/2019               1                 1
7  JJL   11/2/2019               1                 1
8  JJL  12/2/20019               0                 1
9  JJL   1/20/2020               1                 2

相关问题更多 >

编程相关推荐

热门问题

热门文章