使用python pand计算monthyear的发生频率

2024-09-29 01:21:52 发布

您现在位置:Python中文网/ 问答频道 /正文

假设我有以下数据系列:

Date      Category
2014-8    Facebook
2014-8    Vimeo
2014-8    Facebook
2014-8    Facebook
2014-9    Facebook
2014-9    Orkut
2014-9    Facebook
2014-9    Facebook
2014-9    Facebook
...
2014-10    Youtube
2014-10    DailyMotion
2014-10    Facebook
2014-10    Vimeo
2014-10    Facebook
2014-10    Facebook

我想每月和每年对每个类别(时间序列中唯一的值/因子)进行统计。在

^{pr2}$

所以,当我打电话给Facebook时,我可以看到每个月Facebook出现的次数。在

我尝试的是:

df['Date'] = df['Date'].map(lambda x: '{year}-{month}'.format(year=x.year,
                                                              month=x.month,
                                                              day=x.day))
a = df.groupby(['Category','year-month']).size()

提前感谢您的帮助和建议。在


Tags: 数据dfdatefacebookyoutube时间序列类别
1条回答
网友
1楼 · 发布于 2024-09-29 01:21:52

您需要同时按类别和日期分组,然后对日期进行计数:

>>> df.groupby(['Category', 'Date']).Date.count()
Category     Date   
DailyMotion  2014-10    1
Facebook     2014-10    3
             2014-8     3
             2014-9     4
Orkut        2014-9     1
Vimeo        2014-10    1
             2014-8     1
Youtube      2014-10    1
Name: Date, dtype: int64

要获取特定类别(例如“Facebook”)的每月总数,首先需要过滤该类别:

^{2}$

相关问题 更多 >