重新采样赫兹在pandas数据框中

Name Timestamp Data A1 259 [1.1,1.0,0.1] A1 260 [-0.1,1.2,0.3] A1 261 [0.1,0.2,-0.3] ... A1 14895 [1.4,0.3,1.8] ... A2 278 [-1.1,1.2,0.4] A2 353 [-0.1,1.2,0.3] A2 409 [-0.1,1.2,0.3] ... A2 14900 [-0.1,1.2,0.3] ... A1140 107 [-0.5,-1.0,-1.0] A1140 107 [0.6,0.1,0.3] A1140 114 [-1.1,-1.2,0.3] ... A1140 14995 [-1,1.2,0.4]

1条回答

网友

1楼 · 发布于 2024-09-28 20:56:59

我不能完整地回答这个问题，因为即使你也不确定时间戳，但我会给你一些一般性的指导。
这里的数据称为面板数据，每个“名称”有许多不同的时间序列。
groupby(['Name']).apply(<func>)确实是一种有用的方法，因为它允许分别操作每个不同的名称，允许您使用时间序列的更简单的数据类型时间序列是以下类型的数据：

Date                  Value
2000-01-01 00:00:00   3
2000-01-01 00:03:00   12
2000-01-01 00:06:00   21

如您所见，每个样本的采样时间是3分钟。我们可以调用resample()并将其转换为10分钟，如下所示：

^{pr2}$
请注意，您可以使用.apply(<func>)来选择下采样方法，而不是mean。有关频率的更多信息，请考虑this问题。
总之，最好的办法是找出时间戳的确切含义，将其转换为日期时间，然后使用其中之一
df.groupby(['Name']).resample('20L').mean()
或者使用for循环遍历每个名称并分别对每个序列使用重采样。在

相关问题更多 >

编程相关推荐

热门问题

热门文章