如何在pandas dataframe中使用groupby或pivot表查找平均值？

salaries = pd.read_csv('Salaries.csv') salaries = salaries.drop(["Id", "Notes", "Status", "Agency"], axis = 1) salaries = salaries.dropna() salaries.head() jobtitlelist = (salaries.JobTitle.value_counts()>500)[0:10] data_10jobtitle = salaries[salaries.JobTitle.isin(jobtitlelist.index)] avgsalary_10jobtitle = data_10jobtitle.groupby(by=data_10jobtitle.JobTitle).TotalPayBenefits.mean() print(avgsalary_10jobtitle)

2条回答

网友

1楼 · 编辑于 2024-10-16 22:34:46

你需要改变这条线

jobtitlelist = salaries.JobTitle.value_counts()[(salaries.JobTitle.value_counts()>500)][0:10]

网友

2楼 · 编辑于 2024-10-16 22:34:46

在这一行中：

jobtitlelist = (salaries.JobTitle.value_counts()>500)[0:10]

首先找到至少有500条记录的工作，然后选择前10个工作，这些工作用于计算平均总薪酬福利。所以你的工作流程是

只保留至少有500条记录的职称
取前10个职位
计算平均工资总额

但根据你的问题，你的工作流程应该

只保留至少有500条记录的职称
计算步骤1）中工作的平均总薪酬
按升序排序平均工资总额
结果数据帧的前10行将是您要查找的

相关问题更多 >

编程相关推荐

热门问题

热门文章