如何正确分组列?

2024-10-03 02:32:00 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个包含以下列的数据框:

DF.head():
Email           Month    Year
abc@Mail.com      1      2018
abb@Mail.com      1      2018
abd@Mail.com      2      2019
     .   
     .
abbb@Mail.com     6      2019

我想做的是得到2018年和2019年每个月的电子邮件地址总数(知道我不需要过滤,因为我只有这两年)

这就是我所做的,但我要确保这是正确的:

 Stats = DF.groupby(['Year','Month'])['Email'].count()

有什么建议吗


Tags: 数据comdf电子邮件email地址mailyear
1条回答
网友
1楼 · 发布于 2024-10-03 02:32:00

这取决于你需要什么

如果需要排除缺少的值或Email列中不存在缺少的值,则您的解决方案是正确的,请使用^{}

Stats = DF.groupby(['Year','Month'])['Email'].count()

如果需要计算所有也缺少值的组(如果存在),请使用^{}

Stats = DF.groupby(['Year','Month']).size()

相关问题 更多 >