将应用的结果转换回原始数据帧

candy = pd.DataFrame({'Name':['Bob','Bob','Bob','Annie','Annie','Annie','Daniel','Daniel','Daniel'], 'Candy': ['Chocolate', 'Chocolate', 'Lollies','Chocolate', 'Chocolate', 'Lollies','Chocolate', 'Chocolate', 'Lollies'], 'Value':[15,15,10,25,30,12,40,40,16]})

chocolate = candy.groupby(['Name']).apply(lambda x: x[x['Candy'] == 'Chocolate']['Value'].sum()).reset_index(name = 'Total_Chocolate_Spend') candy = pd.merge(candy, chocolate, how = 'left',left_on=['Name'], right_on=['Name'])

2条回答

网友

1楼 · 编辑于 2024-09-30 20:28:11

对于您在apply vs.transform上提供的优秀参考资料，我没有太多要补充的内容，但是您可以在不创建单独的数据帧的情况下做任何事情，例如，您可以这样做

candy.groupby(['Name']).apply(lambda x: x.assign(Total_Chocolate_Spend = x[x['Candy'] == 'Chocolate']['Value'].sum()))

这将使用groupby中每个组的assign来填充Total_Chocolate_Spend所需的数字

网友

2楼 · 编辑于 2024-09-30 20:28:11

还有其他方法。例如：

使用df.where创建一个仅包含巧克力值的临时列：

candy["choc_val"] = candy.Value.where(candy.Candy =="Chocolate", other=0)
candy["Total_Chocolate_Spend"] = candy.groupby("Name").choc_val.transform(sum)
candy = candy.drop(columns="choc_val")

输出：

     Name      Candy  Value  Total Spend  Total_Chocolate_Spend
0     Bob  Chocolate     15           40                     30
1     Bob  Chocolate     15           40                     30
2     Bob    Lollies     10           40                     30
3   Annie  Chocolate     25           67                     55
4   Annie  Chocolate     30           67                     55
5   Annie    Lollies     12           67                     55
6  Daniel  Chocolate     40           96                     80
7  Daniel  Chocolate     40           96                     80
8  Daniel    Lollies     16           96                     80

我不知道这是更有效还是更容易阅读

相关问题更多 >

编程相关推荐

热门问题

热门文章