考虑到以下高频但稀疏的时间序列:
#Sparse Timeseries
dti1 = pd.date_range(start=datetime(2015,8,1,9,0,0),periods=10,freq='ms')
dti2 = pd.date_range(start=datetime(2015,8,1,9,0,10),periods=10,freq='ms')
dti = dti1 + dti2
ts = pd.Series(index=dti, data=range(20))
我可以使用pandas函数计算半衰期为5ms的指数加权移动平均值,如下所示:
^{pr2}$然而,在幕后,这个函数是以1ms的间隔重新采样我的时间序列(这是我提供的‘freq’)。这将导致输出中包含数千个额外的数据点。在
In [118]: len(ts)
Out[118]: 20
In [119]: len(ema)
Out[119]: 10010
这是不可伸缩的,因为我的real Timeseries包含数十万个间隔数分钟或数小时的高频观测。在
有没有一种Pandas/numpy的方法来计算稀疏时间序列的EMA而不需要重新采样?与此类似:http://oroboro.com/irregular-ema/
或者,我必须自己写吗?谢谢!在
您可以使用
reindex
将ewma
结果与原始系列对齐。在相关问题 更多 >
编程相关推荐