我有一个外形良好的数据框
df_总计=
这只是一个伪表,因为数据集太长。我想根据索引计算时间差。就是
如何在python中高效地实现这一点?时差可以是天或分钟
指数1、2等的出现次数差别很大。(8000375,…)
我尝试了以下方法:
df_total['diff'] = df_total.sort_values(['index','time']).groupby('index'['time'].diff()
df_total= df_total.dropna(subset=['diff'])
这给了我在每个实例上的差异,而我需要每个索引
Tags:
不需要排序,只需为每个索引组取max-min
请注意,我稍微修改了示例数据,以便可以看到索引的传播:
使用下面的groupby命令以单个代码获取输出
确保Time列是日期时间
希望这能解决你的疑问
相关问题 更多 >
编程相关推荐