我有一个如下所示的数据帧:
df.head(4)
timestamp user_id category
0 2017-09-23 15:00:00+00:00 A Bar
1 2017-09-14 18:00:00+00:00 B Restaurant
2 2017-09-30 00:00:00+00:00 B Museum
3 2017-09-11 17:00:00+00:00 C Museum
我想计算每个类别每小时的访客数量,并有如下数据框
df
year month day hour category count
0 2017 9 11 0 Bar 2
1 2017 9 11 1 Bar 1
2 2017 9 11 2 Bar 0
3 2017 9 11 3 Bar 1
要获取每个类别每小时的用户id计数,您可以在datetime中使用groupby:
当数据帧中有日期时间时,可以使用dt访问器,它允许您访问日期时间的不同部分,即年份
假设您想要
groupby
日期和小时,如果timestamp列是datetime列,则可以使用以下代码相关问题 更多 >
编程相关推荐