如何根据列的数据按时间序列重新采样/重新索引/分组？

Index hotIn(gpm) hotOut(pulse=1gal) 2019-03-23T00:00:00 4 0 2019-03-23T00:00:01 5 0 2019-03-23T00:00:02 4 0 2019-03-23T00:00:03 4 0 2019-03-23T00:00:04 3 0 2019-03-23T00:00:05 4 1 2019-03-23T00:00:06 4 0 2019-03-23T00:00:07 5 0 2019-03-23T00:00:08 3 0 2019-03-23T00:00:09 3 0 2019-03-23T00:00:10 4 0 2019-03-23T00:00:11 4 0 2019-03-23T00:00:12 5 0 2019-03-23T00:00:13 5 1

2条回答

网友

1楼 · 编辑于 2024-09-28 20:43:21

IIUC，你可以做：

s = df['hotOut(pulse=1gal)'].shift().ne(0).cumsum()
(df.groupby(s)
   .agg({'Index':'last', 'hotIn(gpm)':'sum'})
   .reset_index(drop=True)
)

输出：

                 Index  hotIn(gpm)
0  2019-03-23T00:00:05          24
1  2019-03-23T00:00:13          33

网友

2楼 · 编辑于 2024-09-28 20:43:21

您不想在索引上分组。只要'hotOut(pulse=1gal)'发生更改，您就要分组

s = df['hotOut(pulse=1gal)'].cumsum().shift().bfill()

(df.reset_index()
   .groupby(s, as_index=False)
   .agg({'Index': 'last', 'hotIn(gpm)': 'sum', 'hotOut(pulse=1gal)': 'last'})
   .set_index('Index'))

                     hotIn(gpm)  hotOut(pulse=1gal)
Index                                              
2019-03-23T00:00:05          24                   1
2019-03-23T00:00:13          33                   1

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何根据列的数据按时间序列重新采样/重新索引/分组？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >