在Python中如何用更快的选项替换for循环

a Out[9]: end start 0 4.0 3 1 5.5 5 2 7.5 7 3 9.5 9 4 11.5 11 5 15.0 14 6 18.0 17 7 21.0 20 8 26.0 25 9 31.0 30 b Out[10]: status moment 8.0 o 10.0 o 14.5 o 16.0 o 19.0 o 27.0 o 28.0 o 30.5 o 35.0 o 40.0 o 50.0 o

n [12]: b Out[12]: status moment 8.0 o 10.0 o 14.5 m 16.0 o 19.0 o 27.0 o 28.0 o 30.5 m 35.0 o 40.0 o 50.0 o

2条回答

网友

1楼 · 编辑于 2024-06-01 13:43:38

这里有一个没有for循环的选项，它不避免矢量扫描，而是矢量化的：

b[b.index.map(lambda m: ((m > a.start) & (m < a.end)).any())] = "m"

b

#   status
# moment    
# 8.0   o
# 10.0  o
# 14.5  m
# 16.0  o
# 19.0  o
# 27.0  o
# 28.0  o
# 30.5  m
# 35.0  o
# 40.0  o
# 50.0  o

网友

2楼 · 编辑于 2024-06-01 13:43:38

您的解决方案是运行时的O(n^2)。就我所见，所有的数据帧都是排序的，如果整个DF都是这种情况，您可以使用分而治之的方法使之成为O(nlogn)。但是编码并不容易，您必须查找它，理解D&C方法并将其作为递归函数编写。我认为您可以为这个问题创建一个所谓的BinarySearch算法，每个元素都是O（logn），所以O（nlogn）。你知道吗

如果我错了，而且DF没有排序，但是您必须多次执行这种搜索，我建议您首先对它进行排序。排序也可以在D&C中完成，它通常被称为MergeSort和O（nlogn）。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章