不带多索引的Pandas groupby列

2024-09-28 21:05:42 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个包含一个月火车站数据的数据框,其中三个是索引:车站、日期、小时。 我可以看起来像这样:

Station    Date       Hour    Passengers 
Berlin HBF 2012-12-24 12:00   1000 
Berlin HBF 2012-12-24 13:00   2000  
Berlin HBF 2012-12-24 14:00   1000  
Berlin HBF 2012-12-24 15:00   1000  
....
Stuttgart 2012-12-24 12:00    500  

由于我只对一个月内一个电台的总数感兴趣,我想按电台、日期和小时分组,这样最终结果如下:

^{pr2}$

但我无法让熊猫找到这个解决方案,我尝试了: 车站=列车数据.groupby(['Station','Date','Hour']).agg(np.总和()) 但这只是返回一个包含所有行的多重索引。。。在


Tags: 数据date感兴趣电台小时station车站总数
1条回答
网友
1楼 · 发布于 2024-09-28 21:05:42

看起来你只想按“站”分组,然后在“乘客”列上求和。这里不需要多索引。您的解决方案将创建一个,但由于它与原始数据是相同的,因此它是非常无用的。在

这个应该有用:

traindata.groupby("Station").Passengers.sum()

相关问题 更多 >