如何从时间序列中计算特定小时的中位数

bank_name bank1 bank2 bank3 bank4 date 2019-11-03 102 105 78 81 00:00 2019-11-03 108 100 103 77 00:10 2019-11-03 00:20 108 134 55 27 ... ... ... ... ... 2019-12-22 15:30 461 312 312 253 2019-12-22 15:40 396 361 376 229

date bank_name transfers 2019-11-03 00:00 bank1 102 2019-11-03 00:00 bank2 105 2019-11-03 00:00 bank3 78 2019-11-03 00:00 bank4 81 2019-11-03 00:10 bank1 108 2019-11-03 00:10 bank2 100 ... ... ...

3条回答

网友

1楼 · 编辑于 2024-10-03 13:19:13

我会这样做的。你知道吗

import pandas as pd

df.groupby([pd.to_datetime(df['date']).dt.hour, 'bank_name'])['transfers'].median()

网友

2楼 · 编辑于 2024-10-03 13:19:13

试试这个：

# median hourly transfer
hourly_transfers = df.groupby([pd.Grouper(key='date', freq='H'), 'bank_name']).median()

# which bank has the highest median in each hour
idx = hourly_transfers.groupby('date')['transfers'].idxmax()

# the result
hourly_transfers.loc[idx]

网友

3楼 · 编辑于 2024-10-03 13:19:13

所以听起来你需要：

按小时计算每家银行的金额
从日期中提取小时
获取所有日期中该小时的中位数

像这样：

import datetime

df['date_hourly'] = df['date'].apply(lambda L: datetime(L.year, L.month, L.day, L.hour)) //  [From here][1]

df_hourly = df.groupby(['date_hourly', 'bank_name']).transfers.sum().reset_index()

df_hourly['hour'] = df_hourly.date_hourly.apply(lambda x: x.hour)

df_pivot = df_hourly.groupby(['hour', 'bank_name']).transfers.median().reset_index()

相关问题更多 >

编程相关推荐

热门问题

热门文章