我有一个国家,地区和收入的数据框架。我试图使用聚合返回平均值、最小值、最大值和计数。我希望能够计算收入大于100的国家。在
raw_data = {'Country': ['A', 'B', 'C', 'D', 'E'],
'Region': ['X', 'X', 'X', 'Y', 'Y'],
'Income': [100, 200, 300, 100, 200]
}
incomeData = pd.DataFrame(raw_data, columns = ['Country', 'Region', 'Income'])
regionGroup = incomeData.groupby(['Region'], as_index=False)
groupCount = lambda x: x.count()
#CountHighIncome = ?
aggregations = {
'Country': {groupCount
},
'Income': {'min', 'max', 'mean', 'median' #, CountHighIncome
}
}
incomeSummary = regionGroup.agg(aggregations)
incomeSummary
^{pr2}$
请让我知道,lambda方法计算一个地区内的国家是否可以扩展到一个地区内收入大于100的国家。或者有更好的方法来解决这个问题。在
提前致谢。在
您可以使用带有sum条件的}相似,对于}函数且仅使用
lambda
的自定义函数,True
的计数与{Country
被删除{count
:相关问题 更多 >
编程相关推荐