不同时间窗的移动平均

import pandas my_data = pandas.DataFrame({ 'values': [5.0, 4.0, 3.0, 5.0, 5.0, 6.0, 4.0, 6.0, 7.0, 4.0, 5.0, 5.0] }) my_data values 0 5.0 1 4.0 2 3.0 3 5.0 4 5.0 5 6.0 6 4.0 7 6.0 8 7.0 9 4.0 10 5.0 11 5.0 N=2 Q=3 get_moving_average(my_data, lagging=N, leading=Q) values mavg 0 5 4.250000 1 4 4.400000 2 3 4.666667 3 5 4.500000 4 5 4.833333 5 6 5.500000 6 4 5.333333 7 6 5.333333 8 7 5.166667 9 4 5.400000 10 5 5.250000 11 5 4.666667

1条回答

网友

1楼 · 发布于 2024-10-03 19:25:19

我不确定这将适用于所有情况下没有进一步的测试。你知道吗

让我们发挥创意。在“滚动窗口”中向后使用rolling和shift，以获得适当的尾随行和前导行计数。为了在滚动平均值处处理NaN，让我们向后滚动fillna。你知道吗

N=2
Q=3
T = N+Q+1
my_data.rolling(T, min_periods=1).mean().shift(-Q)\
       .fillna(my_data[::-1].rolling(T, min_periods=Q).mean().shift(-N)[::-1])

输出：

      values
0   4.250000
1   4.400000
2   4.666667
3   4.500000
4   4.833333
5   5.500000
6   5.333333
7   5.333333
8   5.166667
9   5.400000
10  5.250000
11  4.666667

步骤：

在你的例子中，用N（滞后）+Q（超前）和总电流（T）在整个时间间隔内进行滚动计算。你知道吗

my_data.rolling(T, min_periods=1).mean()

现在，让我们使用shift向后移动计算，使窗口如预期的那样，N滞后，Q超前，所以shift-Q

my_data.rolling(T, min_periods=1).mean().shift(-Q)

输出：

      values
0   4.250000
1   4.400000
2   4.666667
3   4.500000
4   4.833333
5   5.500000
6   5.333333
7   5.333333
8   5.166667
9        NaN
10       NaN
11       NaN

现在要处理数据帧末尾的那些NaN值，我们反向进行滚动计算，并使用fillna填充原始值。[：：-1]是一个反转元素，从末尾开始滚动到开头，然后使用[：：-1]再次翻转以与原始结果对齐。你知道吗

my_data[::-1].rolling(T, min_periods=Q).mean().shift(-N)[::-1]

输出：

      values
0        NaN
1        NaN
2   4.666667
3   4.500000
4   4.833333
5   5.500000
6   5.333333
7   5.333333
8   5.166667
9   5.400000
10  5.250000
11  4.666667

使用fillna在第一个序列上搜索第二个序列以获得：

N=2
Q=3
T = N+Q+1
my_data.rolling(T, min_periods=1).mean().shift(-Q)\
       .fillna(my_data[::-1].rolling(T, min_periods=Q).mean().shift(-N)[::-1])

输出：

      values
0   4.250000
1   4.400000
2   4.666667
3   4.500000
4   4.833333
5   5.500000
6   5.333333
7   5.333333
8   5.166667
9   5.400000
10  5.250000
11  4.666667

相关问题更多 >

编程相关推荐

热门问题

热门文章