有没有一种快速的方法可以避免基于另一个数据帧的数据生成新数据帧的for循环？

timestamp_x start_trig id timestamp_y end_trig 0 1592724037612 1.0 12 1592724068408 -1.0 1 1592724459283 1.0 23 1592724490290 -1.0 2 1592724514246 1.0 17 1592724545450 -1.0

timestamp id param1 0 1592724037612 23 56.1 1 1592724037712 23 56.1 2 1592724037812 23 56.0 ... 100 1592724047612 17 54.7

2条回答

网友

1楼 · 编辑于 2024-05-06 11:46:52

我做了一些没有for循环的代码。据我所知，使用pandas库的内置函数比使用for循环更快。但是，我不确定这对你来说是否足够快

设立

数据帧触发器

数据帧数据

对数据进行合并触发，如笛卡尔积样式。这就是行的所有情况。我在堆栈溢出中发现了实现这一点的技巧，它使用临时密钥
data.assign（key=1）.merge（trig.assign（key=1））.drop（columns='key'）
它产生了

符合触发器的屏幕行
data.assign（key=1）.merge（trig.assign（key=1））.drop（columns='key'）.query（'timestamp_x<；timestamp<；timestamp_y'））
它产生了

网友

2楼 · 编辑于 2024-05-06 11:46:52

我找到了一个基于列表理解的解决方案，加快了处理时间：

list_cycles = [data[(data['timestamp'] > low_lim) & (data['timestamp'] < upp_lim)] for low_lim,upp_lim in zip(df_trig['timestamp_x'], df_trig['timestamp_y'])]
new_df = pd.concat(list_cycles,ignore_index = True)

相关问题更多 >

编程相关推荐

热门问题

热门文章

有没有一种快速的方法可以避免基于另一个数据帧的数据生成新数据帧的for循环？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >