分布时间序列d

days_to_spread_over = 4 results=[] for datevalue, value in ts.iteritems(): new = pd.Series(index = pd.date_range(start=datevalue, end = datevalue+timedelta(days=days_to_spread_over), freq='D'), data = [value/float(days_to_spread_over+1)]*(days_to_spread_over+1)) results.append(new) f = pd.concat(results).groupby(level=0).sum() print f 2017-01-01 20.0 2017-01-02 20.0 2017-01-03 60.0 2017-01-04 60.0 2017-01-05 60.0 2017-01-06 40.0 2017-01-07 40.0 2017-01-10 100.0 2017-01-11 100.0 2017-01-12 100.0 2017-01-13 100.0 2017-01-14 100.0 dtype: float64

2条回答

网友

1楼 · 编辑于 2024-09-30 03:25:46

您可以使用除法和np.repeat调用来优化值的计算，但是计算日期范围将需要一个循环。你知道吗

这无疑是一个更干净的方法。首先，通过执行除法计算序列的值，然后重复5次（在-

i = (ts.values / 5).repeat(5)

现在，在每个索引上运行一个循环，调用pd.date_range并将值添加到列表j

j = []

for x, y in zip(ts.index, ts.index + pd.Timedelta(days=4)):
    j.extend(pd.date_range(x, y))

现在，初始化序列，并执行groupby。你知道吗

pd.Series(i, index=j).groupby(level=0).sum()

2017-01-01     20.0
2017-01-02     20.0
2017-01-03     60.0
2017-01-04     60.0
2017-01-05     60.0
2017-01-06     40.0
2017-01-07     40.0
2017-01-10    100.0
2017-01-11    100.0
2017-01-12    100.0
2017-01-13    100.0
2017-01-14    100.0
dtype: float64

i

array([  20.,   20.,   20.,   20.,   20.,   40.,   40.,   40.,   40.,
         40.,  100.,  100.,  100.,  100.,  100.])

j

DatetimeIndex(['2017-01-01', '2017-01-02', '2017-01-03', '2017-01-04',
           '2017-01-05', '2017-01-03', '2017-01-04', '2017-01-05',
           '2017-01-06', '2017-01-07', '2017-01-10', '2017-01-11',
           '2017-01-12', '2017-01-13', '2017-01-14'],
          dtype='datetime64[ns]', freq=None)

网友

2楼 · 编辑于 2024-09-30 03:25:46

我将使用apply+groupby

df=ts.to_frame('Val').reset_index()
df['index']=df['index'].apply(lambda x : pd.date_range(start=x,periods=5).tolist())
df.Val/=5
ts_new=df.set_index('Val')['index'].apply(pd.Series).stack().reset_index().groupby(0).Val.sum()
ts_new
Out[33]: 
0
2017-01-01     20.0
2017-01-02     20.0
2017-01-03     60.0
2017-01-04     60.0
2017-01-05     60.0
2017-01-06     40.0
2017-01-07     40.0
2017-01-10    100.0
2017-01-11    100.0
2017-01-12    100.0
2017-01-13    100.0
2017-01-14    100.0
Name: Val, dtype: float64

相关问题更多 >

编程相关推荐

热门问题

热门文章