由hou上的开始和结束时间戳定义的拆分持续时间

Start End 0 2019-01-01 00:59 2019-01-01 01:00 1 2019-01-01 01:00 2019-01-01 01:01 2 2019-01-01 01:10 2019-01-01 02:00 3 2019-01-01 02:00 2019-01-01 03:00 4 2019-01-01 03:00 2019-01-01 03:10

start = pd.DataFrame({ 'Start': ['2019-01-01 00:59', '2019-01-01 01:10'], 'End': ['2019-01-01 01:01', '2019-01-01 03:10'] }) finish = pd.DataFrame({ 'Start': ['2019-01-01 00:59', '2019-01-01 01:00', '2019-01-01 01:10', '2019-01-01 02:00', '2019-01-01 03:00'], 'End': ['2019-01-01 01:00', '2019-01-01 01:01', '2019-01-01 02:00', '2019-01-01 03:00', '2019-01-01 03:10'] })

1条回答

网友

1楼 · 发布于 2024-05-18 18:22:17

使用listcomp，pd.date_range并从date_range的结果构造序列s。最后，从s构造最终的df

a = [pd.date_range(s.ceil('H'), e, freq='H').insert(0,s) for s, e in zip(df.Start, df.End)]
s = pd.Series(a, index=df.index).explode()

df_final = (pd.DataFrame({'Start': s, 'End': s.groupby(level=0).shift(-1).fillna(df.End)})
              .reset_index(drop=True))

Out[41]:
                Start                 End
0 2019-01-01 00:59:00 2019-01-01 01:00:00
1 2019-01-01 01:00:00 2019-01-01 01:01:00
2 2019-01-01 01:10:00 2019-01-01 02:00:00
3 2019-01-01 02:00:00 2019-01-01 03:00:00
4 2019-01-01 03:00:00 2019-01-01 03:10:00

如果希望输出Start和End为字符串格式，只需添加strftime

df_final = pd.DataFrame({'Start': s.dt.strftime('%Y-%m-%d %H:%M'), 
                         'End': s.groupby(level=0).shift(-1).fillna(df.End).dt.strftime('%Y-%m-%d %H:%M')})

Out[40]:
              Start               End
0  2019-01-01 00:59  2019-01-01 01:00
0  2019-01-01 01:00  2019-01-01 01:01
1  2019-01-01 01:10  2019-01-01 02:00
1  2019-01-01 02:00  2019-01-01 03:00
1  2019-01-01 03:00  2019-01-01 03:10

注意：如果您的pandas版本不支持explode，您可以使用df.index.repeat和np.concatenate来创建s

s = pd.Series(np.concatenate(a), index=df.index.repeat(list(map(len, a))))

相关问题更多 >

编程相关推荐

热门问题

热门文章