我正在尝试并行化我编写的一个Python函数以同时在多个GPU内核上运行,但似乎当前的并行化方法(如numba的vectorize和guvectorize)不允许在函数(https://github.com/numba/numba/issues/2736)中进行任何比简单算术运算更复杂的操作。你知道吗
我的问题是,除了numba之外,是否有一个包或技术能够处理调用numpy函数的函数,比如努比。哪里或者numpy.1d?你知道吗
完全新的GPU编程在这里,不知道什么国家的最先进的能力,所以抱歉,如果这个问题似乎愚蠢。你知道吗
非常感谢!你知道吗
目前没有回答
相关问题 更多 >
编程相关推荐