如何使用Pandas的时间戳按小时分组数据帧

neg neu norm pol pos date time 1520353341 0.000 1.000 0.0000 0.000000 0.000 1520353342 0.121 0.879 -0.2960 0.347851 0.000 1520353342 0.217 0.783 -0.6124 0.465833 0.000

neg neu norm pol pos date time 1520353341 0.000 1.000 0.0000 0.000000 0.000 2018-03-06 10:22:21 1520353342 0.121 0.879 -0.2960 0.347851 0.000 2018-03-06 10:22:22 1520353342 0.217 0.783 -0.6124 0.465833 0.000 2018-03-06 10:22:22

3条回答

网友

1楼 · 编辑于 2024-10-06 16:15:48

我在发布了我的按小时计算的解决方案后，偶然发现了这个宝石^{}。在

# Construct example dataframe
times = pd.date_range('1/1/2018', periods=5, freq='25min')
values = [4,8,3,4,1]
df = pd.DataFrame({'val':values}, index=times)

# Resample by hour and calculate medians
df.resample('H').median()

或者，如果不想将时间作为索引，可以将^{}与^{}一起使用：

^{pr2}$

网友

2楼 · 编辑于 2024-10-06 16:15:48

您可以将时间戳列向下舍入到最接近的小时：

import math
df.time = [math.floor(t/3600) * 3600 for t in df.time]

或者更简单，使用整数除法：

^{pr2}$

您可以按此列分组，从而保留时间戳。在

网友

3楼 · 编辑于 2024-10-06 16:15:48

您是否尝试通过以下方式创建小时列：

data_frame['hour'] = data_frame.date.dt.hour

然后按小时分组如下：

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章