如何使用多列参数调用pandas.rolling.apply？

3条回答

网友

1楼 · 编辑于 2024-05-28 11:16:55

尝试此操作以传递要应用的多个列

df['new_column'] = df.apply(lambda x: your_function(x['High'],x['Low'],x['Close']), axis=1)

网友

2楼 · 编辑于 2024-05-28 11:16:55

由于滚动窗口不太大，我认为您也可以将它们放在同一个数据帧中，然后使用apply函数来减少。

例如，数据集df如下所示

            Open    High        Low     Close
Date                
2017-11-07  258.97  259.3500    258.09  258.67
2017-11-08  258.47  259.2200    258.15  259.11
2017-11-09  257.73  258.3900    256.36  258.17
2017-11-10  257.73  258.2926    257.37  258.09
2017-11-13  257.31  258.5900    257.27  258.33

您只需使用

window = 2
df1 = pd.DataFrame(index=df.index)
for i in range(window):
    df_shifted = df.shift(i).copy()
    df_shifted.columns = ["{}-{}".format(s, i) for s in df.columns]
    df1 = df1.join(df_shifted)
df1

           Open-0   High-0      Low-0   Close-0 Open-1  High-1      Low-1   Close-1
Date                                
2017-11-07  258.97  259.3500    258.09  258.67  NaN     NaN         NaN     NaN
2017-11-08  258.47  259.2200    258.15  259.11  258.97  259.3500    258.09  258.67
2017-11-09  257.73  258.3900    256.36  258.17  258.47  259.2200    258.15  259.11
2017-11-10  257.73  258.2926    257.37  258.09  257.73  258.3900    256.36  258.17
2017-11-13  257.31  258.5900    257.27  258.33  257.73  258.2926    257.37  258.09

然后你就可以用你想要的所有滚动数据轻松地应用它

df1.apply(AccumulativeSwingIndex, axis=1)

网友

3楼 · 编辑于 2024-05-28 11:16:55

定义自己的`roll`

我们可以创建一个接受窗口大小参数w和任何其他关键字参数的函数。我们使用它来构建一个新的DataFrame，在其中，我们将调用groupby，同时通过kwargs传递关键字参数。

注意：我不需要使用stride_tricks.as_strided，但它很简洁，在我看来是合适的。

from numpy.lib.stride_tricks import as_strided as stride
import pandas as pd

def roll(df, w, **kwargs):
    v = df.values
    d0, d1 = v.shape
    s0, s1 = v.strides

    a = stride(v, (d0 - (w - 1), w, d1), (s0, s0, s1))

    rolled_df = pd.concat({
        row: pd.DataFrame(values, columns=df.columns)
        for row, values in zip(df.index, a)
    })

    return rolled_df.groupby(level=0, **kwargs)

roll(df, 2).mean()

       Open      High       Low    Close
0  133.0350  133.2975  132.8250  132.930
1  132.9325  133.1200  132.6750  132.745
2  132.7425  132.8875  132.6075  132.710
3  132.7075  132.7875  132.6000  132.720

我们还可以使用pandas.DataFrame.pipe方法来实现相同的效果：

df.pipe(roll, w=2).mean()

旧答案

已弃用{}。有关更新的答案，请参见上文。

见https://stackoverflow.com/a/37491779/2336654

定义我们自己的roll

def roll(df, w, **kwargs):
    roll_array = np.dstack([df.values[i:i+w, :] for i in range(len(df.index) - w + 1)]).T
    panel = pd.Panel(roll_array, 
                     items=df.index[w-1:],
                     major_axis=df.columns,
                     minor_axis=pd.Index(range(w), name='roll'))
    return panel.to_frame().unstack().T.groupby(level=0, **kwargs)

你应该能够：

roll(df, 2).apply(your_function)

使用mean

roll(df, 2).mean()

major      Open      High       Low    Close
1      133.0350  133.2975  132.8250  132.930
2      132.9325  133.1200  132.6750  132.745
3      132.7425  132.8875  132.6075  132.710
4      132.7075  132.7875  132.6000  132.720

f = lambda df: df.sum(1)

roll(df, 2, group_keys=False).apply(f)

   roll
1  0       532.345
   1       531.830
2  0       531.830
   1       531.115
3  0       531.115
   1       530.780
4  0       530.780
   1       530.850
dtype: float64

定义自己的`roll`

旧答案

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何使用多列参数调用pandas.rolling.apply？

定义自己的roll

旧答案

相关问题 更多 >

编程相关推荐

热门问题

热门文章

定义自己的`roll`

相关问题更多 >