Pandas数列加权平均和标准差的求取

import numpy as np import pandas as pd df = pd.DataFrame({"Date": pd.date_range(start='2018-01-01', end='2018-01-03 18:00:00', freq='6H'), "Weight": np.random.uniform(3, 5, 12), "V1": np.random.uniform(10, 15, 12), "V2": np.random.uniform(10, 15, 12), "V3": np.random.uniform(10, 15, 12)})

Date V1 V2 V3 Weight 0 2018-01-01 11.421749 13.090178 11.639424 3.630196 1 2018-01-02 12.142917 11.605284 12.187473 4.056303 2 2018-01-03 12.034015 13.159132 11.658969 4.318753

1条回答

网友

1楼 · 发布于 2024-05-08 23:18:24

您可以使用EOL's NumPy-based code 计算加权平均数和标准差。要在Pandasgroupby/apply操作中使用它，请使weighted_average_std返回一个数据帧：

import numpy as np
import pandas as pd


def weighted_average_std(grp):
    """
    Based on http://stackoverflow.com/a/2415343/190597 (EOL)
    """
    tmp = grp.select_dtypes(include=[np.number])
    weights = tmp['Weight']
    values = tmp.drop('Weight', axis=1)
    average = np.ma.average(values, weights=weights, axis=0)
    variance = np.dot(weights, (values - average) ** 2) / weights.sum()
    std = np.sqrt(variance)
    return pd.DataFrame({'mean':average, 'std':std}, index=values.columns)

np.random.seed(0)
df = pd.DataFrame({
    "Date": pd.date_range(start='2018-01-01', end='2018-01-03 18:00:00', freq='6H'),
    "Weight": np.random.uniform(3, 5, 12),
    "V1": np.random.uniform(10, 15, 12),
    "V2": np.random.uniform(10, 15, 12),
    "V3": np.random.uniform(10, 15, 12)})

df.index = df["Date"]
df_agg = df.groupby(pd.Grouper(freq='1D')).apply(weighted_average_std).unstack(-1)
print(df_agg)

收益率

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章