我最初有另一个专栏,名为Minor Category,有更多关于犯罪类别的信息。然而,我需要更少的信息来实现我的可视化,所以我放弃了它。这就是为什么有多个具有相同值的主要类别行(Barking和Dagenham中有2起盗窃犯罪) 我试图将这些相似的行合并为一行。这样,numCrimes就可以得到每一个的总数,每个自治区就会有一种主要类别出现一次
你知道怎么做到吗
df.drop('Minor Category', axis='columns', inplace=True)
df
Output:
Borough Major Category numCrimes
Year
2008 Barking and Dagenham Burglary 82.0
2008 Barking and Dagenham Burglary 59.0
2008 Barking and Dagenham Criminal Damage 79.0
2008 Barking and Dagenham Criminal Damage 142.0
2008 Barking and Dagenham Criminal Damage 20.0
... ... ... ...
2018 Westminster Violence Against the Person 386.0
2018 Westminster Violence Against the Person 0.0
2018 Westminster Violence Against the Person 41.0
2018 Westminster Violence Against the Person 38.0
2018 Westminster Violence Against the Person 109.0
我认为您需要的是一个非常简单的groupby操作:
groupby
和agg
是这里使用的正确函数,但是我们应该小心不要丢失看起来像df中的索引的“Year”。所以我们应该这样做;对于您的示例数据,它生成
或其变体。很确定你在寻找groupby的用法
相关问题 更多 >
编程相关推荐