通过使用pandas提取和分组列来汇总数据帧

2024-10-02 22:31:03 发布

您现在位置:Python中文网/ 问答频道 /正文

我想总结一下csv文件中的专栏。几乎可以提取列数据,并将其与相关评级和计数相匹配

还有,我应该如何将预期的数据帧与网站图像匹配

    website   rate
1   two     5
2   two     3
3   two     5
4   one     2
5   one     4
6   one     4
7   one     2
8   one     2
9   two     2

website  rate(over 5)  count     appeal(rate over 5 / count >= 0.5)
one      0             5         0 
two      2             4         1

Tags: 文件csv数据rate网站countwebsiteone
1条回答
网友
1楼 · 发布于 2024-10-02 22:31:03

您可以使用groupby操作:

res = df.assign(rate_over_5=df['rate'].ge(5))\
        .groupby('website').agg({'rate_over_5': ['sum', 'size']})\
        .xs('rate_over_5', axis=1).reset_index()

res['appeal'] = ((res['sum'] / res['size']) >= 0.5).astype(int)

print(res)

  website  sum  size  appeal
0     one  0.0     5       0
1     two  2.0     4       1

相关问题 更多 >