我有一个数据框形式的表,就像
我需要一个聚合,如:
现在我要为每个功能执行以下操作:
dftotal=df.groupby(['Tree'])["Weight"].agg(['sum']).reset_index()
dfFruit=dfFruit.groupby(['Tree']['Fruit'])['Weight'].sum().reset_index()
dfFrwithTotal=pd.merge(dftotal,dfFruit)
dfFrwithTotal['Weight']=100*dfFrwithTotal['Weight']/dfFrwithTotal["sum"]
dfFrwithTotal['joined'] = dfFrwithTotal.apply(lambda x: str(x.Fruit)+' - '+ str(x.Weight) +'%', axis=1)
dfsummaryFr=dfFrwithTotal.groupby(['Tree']).agg({ "joined": lambda x: ','.join(x)}).reset_index()
这看起来非常难看
我对每一个特性都这样做,然后在树上合并
有一个很好的lambda表达式吗
输入数据:
用于显示结果的格式化功能:
将数据帧转换为按树、果和;颜色:
生成一系列显示字符串:
将
fruits
和colors
合并在一起:印刷品:
相关问题 更多 >
编程相关推荐