如何计算pandas数据帧中分类数据的子组？

import pandas as pd import numpy as np df = pd.DataFrame({"shops": ["shop1", "shop2", "shop3", "shop4", "shop5", "shop6"], "franchise" : ["franchise_A", "franchise_A", "franchise_A", "franchise_A", "franchise_B", "franchise_B"],"items" : ["dog", "cat", "dog", "dog", "bird", "fish"]}) df = df[["shops", "franchise", "items"]] print(df) shops franchise items 0 shop1 franchise_A dog 1 shop2 franchise_A cat 2 shop3 franchise_A dog 3 shop4 franchise_A dog 4 shop5 franchise_B bird 5 shop6 franchise_B fish

2条回答

网友

1楼 · 编辑于 2024-09-28 20:48:58

您可以将value_counts与^{}一起使用，谢谢Nickil Maveli：

from collections import Counter

print (df.groupby("franchise")['items'].value_counts().unstack(fill_value=0))
items        bird  cat  dog  fish
franchise                        
franchise_A     0    1    3     0
franchise_B     1    0    0     1

另一个带有^{}和^{}的解决方案：

^{pr2}$

print (df.pivot_table(index="franchise", columns='items', aggfunc='size', fill_value=0))
items        bird  cat  dog  fish
franchise                        
franchise_A     0    1    3     0
franchise_B     1    0    0     1

网友

2楼 · 编辑于 2024-09-28 20:48:58

您可以在^{}中包含items列，然后使用^{}。在

>>> df.groupby(['franchise', 'items']).size().unstack(fill_value=0)

items        bird  cat  dog  fish
franchise                        
franchise_A     0    1    3     0
franchise_B     1    0    0     1

（粗略）基准

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章