考虑这个简单的例子
data = pd.DataFrame({'mydate' : [pd.to_datetime('2016-06-06'),
pd.to_datetime('2016-06-02')],
'value' : [1, 2]})
data.set_index('mydate', inplace = True)
data
Out[260]:
value
mydate
2016-06-06 1
2016-06-02 2
我想对每一行进行迭代,以便数据帧围绕当前行的每个索引值(即日期)被“放大”几天(前2天,后2天)。你知道吗
例如,如果您考虑第一行,我想告诉Pandas再添加4行,对应于天2016-06-04
、2016-06-05
、2016-06-07
和2016-06-07
。这些额外行的value
可以是该行的value
中的值(在本例中:1)。这个逻辑应用于每一行,最后的数据帧是所有这些放大的数据帧的串联。你知道吗
我在apply(., axis = 1)
中尝试了以下函数:
def expand_onerow(df, ndaysback = 2, nhdaysfwd = 2):
new_index = pd.date_range(pd.to_datetime(df.name) - pd.Timedelta(days=ndaysback),
pd.to_datetime(df.name) + pd.Timedelta(days=nhdaysfwd),
freq='D')
newdf = df.reindex(index=new_index, method='nearest') #New df with expanded index
return newdf
但不幸的是我在跑步
data.apply(lambda x: expand_onerow(x), axis = 1)
提供:
File "pandas/_libs/tslib.pyx", line 1165, in pandas._libs.tslib._Timestamp.__richcmp__
TypeError: ("Cannot compare type 'Timestamp' with type 'str'", 'occurred at index 2016-06-06 00:00:00')
我尝试的另一种方法是:首先重置索引
data.reset_index(inplace = True)
data
Out[339]:
mydate value
0 2016-06-06 1
1 2016-06-02 2
然后我对我的函数稍加修改
def expand_onerow_alt(df, ndaysback = 2, nhdaysfwd = 2):
new_index = pd.date_range(pd.to_datetime(df.mydate) - pd.Timedelta(days=ndaysback),
pd.to_datetime(df.mydate) + pd.Timedelta(days=nhdaysfwd),
freq='D')
newdf = pd.Series(df).reindex(index = new_index).T #New df with expanded index
return newdf
这给了
data.apply(lambda x: expand_onerow_alt(x), axis = 1)
Out[338]:
2016-05-31 2016-06-01 2016-06-02 2016-06-03 2016-06-04 2016-06-05 2016-06-06 2016-06-07 2016-06-08
0 nan nan nan nan nan nan nan nan nan
1 nan nan nan nan nan nan nan nan nan
更近但还没到。。。你知道吗
我不明白这里怎么了。我错过了什么?我在这里寻找最泛化的方法。你知道吗
谢谢!你知道吗
我修改了你的一点点功能
更多信息
基本上一条线等于
相关问题 更多 >
编程相关推荐