展开datafram中的每一行

data = pd.DataFrame({'mydate' : [pd.to_datetime('2016-06-06'), pd.to_datetime('2016-06-02')], 'value' : [1, 2]}) data.set_index('mydate', inplace = True) data Out[260]: value mydate 2016-06-06 1 2016-06-02 2

def expand_onerow(df, ndaysback = 2, nhdaysfwd = 2): new_index = pd.date_range(pd.to_datetime(df.name) - pd.Timedelta(days=ndaysback), pd.to_datetime(df.name) + pd.Timedelta(days=nhdaysfwd), freq='D') newdf = df.reindex(index=new_index, method='nearest') #New df with expanded index return newdf

def expand_onerow_alt(df, ndaysback = 2, nhdaysfwd = 2): new_index = pd.date_range(pd.to_datetime(df.mydate) - pd.Timedelta(days=ndaysback), pd.to_datetime(df.mydate) + pd.Timedelta(days=nhdaysfwd), freq='D') newdf = pd.Series(df).reindex(index = new_index).T #New df with expanded index return newdf

data.apply(lambda x: expand_onerow_alt(x), axis = 1) Out[338]: 2016-05-31 2016-06-01 2016-06-02 2016-06-03 2016-06-04 2016-06-05 2016-06-06 2016-06-07 2016-06-08 0 nan nan nan nan nan nan nan nan nan 1 nan nan nan nan nan nan nan nan nan

1条回答

网友

1楼 · 发布于 2024-09-28 17:03:14

我修改了你的一点点功能

def expand_onerow(df, ndaysback = 2, nhdaysfwd = 2):

    new_index = pd.date_range(pd.to_datetime(df.index[0]) - pd.Timedelta(days=ndaysback),
                              pd.to_datetime(df.index[0]) + pd.Timedelta(days=nhdaysfwd),
                              freq='D')

    newdf = df.reindex(index=new_index, method='nearest')     #New df with expanded index
    return newdf

pd.concat([expand_onerow(data.loc[[x],:], ndaysback = 2, nhdaysfwd = 2) for x ,_ in data.iterrows()])


Out[455]: 
            value
2016-05-31      2
2016-06-01      2
2016-06-02      2
2016-06-03      2
2016-06-04      2
2016-06-04      1
2016-06-05      1
2016-06-06      1
2016-06-07      1
2016-06-08      1

更多信息

基本上一条线等于

l=[]
for x ,_ in data.iterrows():

    l.append(expand_onerow(data.loc[[x],:], ndaysback = 2, nhdaysfwd = 2))# query out each row by using their index(x is the index for each row) and append then into a empty list


pd.concat(l)# concat the list to one df at the end

相关问题更多 >

编程相关推荐

热门问题

热门文章