***免责声明:我是一个彻头彻尾的傻瓜。我试图通过解决工作中的问题来学习熊猫。这是我全部问题的一个子集,但我正在尝试在处理项目之前解决这些问题。谢谢你的耐心!***
我试图找出每个基金在各州总数中所占的百分比
概念:我们的基金(部门)设在美国。这些基金对不同的项目有不同的补偿水平。我首先需要合计(分组)基金,以便知道每个基金的总薪酬
我还需要按州对薪酬进行合计(分组),以便以后可以按州计算出基金的百分比
我已在此处将数据转换为示例代码:
import pandas as pd
#样本数据
data = {'Fund':['1000','1000','2000','2000','3000','3000','4000','4000'],
'State':['AL','AL','FL','FL','AL','AL','NC','NC'],
'Compensation':[2000,2500,1500,1750,4000,3200,1450,3000]}
如果照片没有出现在这里,我就是这么做的:
print(employees)
employees.groupby('Fund').Compensation.sum()
employees.groupby('State').Compensation.sum()
我花了一天的大部分时间在实际数据上,试图找出如何获得:
基金的赔偿金为国家赔偿金总额的__% 或者
基金_1000占所有薪酬总额的38%
谢谢你的耐心和帮助
约翰
您还可以计算和合并数据帧
这里有一个解决方案。您可以首先执行groupby以获得最低级别的聚合,然后使用groupby转换将这些值除以状态总数
这应该可以完成以下工作:
相关问题 更多 >
编程相关推荐