我有一个函数,执行多边形点测试。它以两个2dnumpy数组作为输入(一系列点和一个多边形)。函数返回一个布尔值作为输出(如果点位于多边形内部,则返回True,否则返回False)。代码是从this SO answer借用的。下面是一个例子:
from numba import jit
from numba.pycc import CC
cc = CC('nbspatial')
import numpy as np
@cc.export('array_tracing2', 'b1[:](f8[:,:], f8[:,:])')
@jit(nopython=True, nogil=True)
def array_tracing2(xy, poly):
D = np.empty(len(xy), dtype=numba.boolean)
n = len(poly)
for i in range(1, len(D) - 1):
inside = False
p2x = 0.0
p2y = 0.0
xints = 0.0
p1x,p1y = poly[0]
x = xy[i][0]
y = xy[i][1]
for i in range(n+1):
p2x,p2y = poly[i % n]
if y > min(p1y,p2y):
if y <= max(p1y,p2y):
if x <= max(p1x,p2x):
if p1y != p2y:
xints = (y-p1y)*(p2x-p1x)/(p2y-p1y)+p1x
if p1x == p2x or x <= xints:
inside = not inside
p1x,p1y = p2x,p2y
D[i] = inside
return D
if __name__ == "__main__":
cc.compile()
上面的代码可以通过运行python numba_src.py
进行编译并用以下方法进行测试:
我的尝试是将上面的代码并行化,以便利用所有可用的CPU。在
我尝试从numba
official documentation中使用@njit
的示例
import numba
@njit(parallel=True)
def array_tracing3(xy, poly):
D = np.empty(len(xy), dtype=numba.boolean)
n = len(poly)
for i in range(1, len(D) - 1):
inside = False
p2x = 0.0
p2y = 0.0
xints = 0.0
p1x,p1y = poly[0]
x = xy[i][0]
y = xy[i][1]
for i in range(n+1):
p2x,p2y = poly[i % n]
if y > min(p1y,p2y):
if y <= max(p1y,p2y):
if x <= max(p1x,p2x):
if p1y != p2y:
xints = (y-p1y)*(p2x-p1x)/(p2y-p1y)+p1x
if p1x == p2x or x <= xints:
inside = not inside
p1x,p1y = p2x,p2y
D[i] = inside
return D
上面的代码是为预编译串行版本的55''
vs1' 33''
中的N=1000000
完成的。系统监视器显示只有一个CPU以100%的速度运行。在
如何利用整个可用的CPU,并将结果返回到一个booleansd数组中?在
Numba的
parallel=True
只为某些函数启用自动并行,而不是为所有循环启用。您应该用range()
替换一个range()
表达式来启用多核计算。在参见:https://numba.pydata.org/numba-doc/dev/user/parallel.html
相关问题 更多 >
编程相关推荐