是否可以对数据帧中的行的条件计数使用矢量化？

1条回答

网友

1楼 · 发布于 2024-10-01 07:14:05

这是一个复杂的问题，但我认为有效的解决方案。请注意，您的数据帧的顺序因此被修改，Day列被修改为timedelta数据类型：

从数据帧df开始：

   CallID  Day  PersonID
0       6    2         3
1       3   14         2
2       1    8         1
3       5    1         3
4       2   12         2
5       7  100         3

首先将Day修改为timedelta序列：

df['Day'] = pd.to_timedelta(df['Day'], unit='d')

然后，使用^{}，将数据帧与7天内每个人的调用计数合并。要获得此结果，请使用频率为7天的groupby和^{}：

new_df = (pd.merge_asof(df.sort_values(['Day']),
                        df.sort_values(['Day'])
                        .groupby([pd.Grouper(key='Day', freq='7d'), 'PersonID'])
                        .size()
                        .to_frame('ContactsIN7Days')
                        .reset_index(),
                        left_on='Day', right_on='Day',
                        left_by='PersonID', right_by='PersonID',
                        direction='nearest'))

结果new_df如下所示：

   CallID      Day  PersonID  ContactsIN7Days
0       5   1 days         3                2
1       6   2 days         3                2
2       1   8 days         1                1
3       2  12 days         2                2
4       3  14 days         2                2
5       7 100 days         3                1

相关问题更多 >

编程相关推荐

热门问题

热门文章

是否可以对数据帧中的行的条件计数使用矢量化？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >