Pandas:如何为其他列中的每个值按时间分组

2024-09-29 19:20:20 发布

您现在位置:Python中文网/ 问答频道 /正文

我有这样一个数据帧:

column-one   column-two      column-3     column-4     column-5    date
 aaa           qqq             cat1         dsj           dak     2010-01-01 20:00:00
 ooo           www             cat2         fnk           qwe     2011-01-02 19:00:00
 oll           wee             cat2         fek           wqw     2011-03-02 22:00:00

第3列包含数据框中的类别。大约有10-12个单独的类别。对于每个类别,我试图在“日期”列中计算每次(小时/日期等)发生的次数。我最终希望能够分别绘制每个类别的结果。以及能够在数据框中存储我的结果

这个问题困扰了我好一阵子。如果有人有任何建议,请告诉我。或者如果你需要更多的信息。谢谢


Tags: 数据datewwwcolumn类别onetwocat1
2条回答

我想你可能在找这个

 df.groupby(['date', 'column-3']).size()

理解你的问题有点困难。这个答案是回应你对@Sina Shabani的评论。如果希望一次仅获取一列的此信息,请使用:

 col_val_i_want = 'cat1' # Define what you want
 mask = df['column-3'].eq(col_val_i_want) # Create a filter
 df[mask].groupby('date').count() # Group by and get the count

相关问题 更多 >

    热门问题