我有一个数据框,里面有在接下来的10分钟内进行了多少次传输的信息。我想展示哪些银行在特定的时间最受欢迎(我的结论是,我将能够显示这一点多亏了中位数)。我的轴心是这样的:
bank_name bank1 bank2 bank3 bank4
date
2019-11-03 102 105 78 81
00:00
2019-11-03 108 100 103 77
00:10
2019-11-03
00:20 108 134 55 27
... ... ... ... ...
2019-12-22
15:30 461 312 312 253
2019-12-22
15:40 396 361 376 229
或常规df
date bank_name transfers
2019-11-03 00:00 bank1 102
2019-11-03 00:00 bank2 105
2019-11-03 00:00 bank3 78
2019-11-03 00:00 bank4 81
2019-11-03 00:10 bank1 108
2019-11-03 00:10 bank2 100
... ... ...
我的期望值(我随机输入中值)
hour bank_name median
00 bank2 641
01 bank2 711
02 bank1 668
... ... ...
23 bank3 757
在开始时,我想对2019-11-03 00:00, 00:10, 00:20, 00:30, 00:40, 00:50
的值求和,并将其作为03 00
的值。我是这样做的:
df['date_'] = pd.to_datetime(df['date'].dt.strftime('%d %H'))
df = df.set_index('bank_name').groupby([ 'bank_name', 'date_']).agg({'transfers':np.sum})
。。。但我不知道下一步该怎么办。我将感谢你的帮助。你知道吗
我会这样做的。你知道吗
试试这个:
所以听起来你需要:
像这样:
相关问题 更多 >
编程相关推荐