纯python上的Numba与numpython上的Numpa问题的回答

纯python上的Numba与numpython上的Numpa

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

使用numba比使用纯python生成的程序快得多： <ul> <li><a href="https://www.ibm.com/developerworks/community/blogs/jfp/entry/A_Comparison_Of_C_Julia_Python_Numba_Cython_Scipy_and_BLAS_on_LU_Factorization?lang=en" rel="nofollow noreferrer">https://www.ibm.com/developerworks/community/blogs/jfp/entry/A_Comparison_Of_C_Julia_Python_Numba_Cython_Scipy_and_BLAS_on_LU_Factorization?lang=en</a></li> <li><a href="https://www.ibm.com/developerworks/community/blogs/jfp/entry/Python_Meets_Julia_Micro_Performance?lang=en" rel="nofollow noreferrer">https://www.ibm.com/developerworks/community/blogs/jfp/entry/Python_Meets_Julia_Micro_Performance?lang=en</a></li> <li><a href="https://murillogroupmsu.com/numba-versus-c/" rel="nofollow noreferrer">https://murillogroupmsu.com/numba-versus-c/</a></li> </ul> 现在看来，纯python上的numba甚至（大多数时候）比numpy python快，例如<a href="https://jakevdp.github.io/blog/2015/02/24/optimizing-python-with-numpy-and-numba/" rel="nofollow noreferrer">https://jakevdp.github.io/blog/2015/02/24/optimizing-python-with-numpy-and-numba/</a>。在 根据<a href="https://murillogroupmsu.com/julia-set-speed-comparison/" rel="nofollow noreferrer">https://murillogroupmsu.com/julia-set-speed-comparison/</a>，在纯python代码中使用numba比在使用numpy的python代码上使用更快。这是真的吗？为什么？在 在<a href="https://stackoverflow.com/a/25952400/4533188">https://stackoverflow.com/a/25952400/4533188</a>中，解释了为什么纯python上的numba比numpy python快：numba看到更多的代码，并且有更多的方法来优化代码，而numpy只看到一小部分。在 这能回答我的问题吗？我是否妨碍numba在使用numpy时完全优化我的代码，因为numba被迫使用numpy例程，而不是找到一个更优化的方法？我曾希望麻木能意识到这一点，如果没有好处的话，就不要使用numpy程序。然后它会使用numpy例程，只是这是一个改进（毕竟numpy已经过很好的测试）。毕竟<a href="http://numba.pydata.org/numba-doc/0.15.1/arrays.html" rel="nofollow noreferrer">"Support for NumPy arrays is a key focus of Numba development and is currently undergoing extensive refactorization and improvement."</a>

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

<blockquote> According to <a href="https://murillogroupmsu.com/julia-set-speed-comparison/" rel="nofollow noreferrer">https://murillogroupmsu.com/julia-set-speed-comparison/</a> numba used on pure python code is faster than used on python code that uses numpy. Is that generally true and why? In <a href="https://stackoverflow.com/a/25952400/4533188">https://stackoverflow.com/a/25952400/4533188</a> it is explained why numba on pure python is faster than numpy-python: numba sees more code and has more ways to optimize the code than numpy which only sees a small portion. </blockquote> Numba只是用它自己的实现替换numpy函数。它们可以更快/更慢，结果也可能不同。问题在于这种替换是如何发生的。经常会涉及不必要的临时数组和循环，它们可以被融合在一起。在 循环融合和移除临时阵列不是一件容易的事。如果为并行目标（循环融合效果更好）或单线程目标编译，则行为也会有所不同。在 [编辑] 在并行加速器中完成的优化<a href="https://numba.pydata.org/numba-doc/dev/user/parallel.html" rel="nofollow noreferrer">Section 1.10.4. Diagnostics</a>（如循环融合）也可以通过设置<code>parallel=True</code>和<code>nb.parfor.sequential_parfor_lowering = True</code>来启用。<a href="https://github.com/numba/numba/issues/3092" rel="nofollow noreferrer">1</a> 示例 <pre><code>#only for single-threaded numpy test import os os.environ["OMP_NUM_THREADS"] = "1" import numba as nb import numpy as np a=np.random.rand(100_000_000) b=np.random.rand(100_000_000) c=np.random.rand(100_000_000) d=np.random.rand(100_000_000) #Numpy version #every expression is evaluated on its own #the summation algorithm (Pairwise summation) isn't equivalent to the algorithm I used below def Test_np(a,b,c,d): return np.sum(a+b*2.+c*3.+d*4.) #The same code, but for Numba (results and performance differ) @nb.njit(fastmath=False,parallel=True) def Test_np_nb(a,b,c,d): return np.sum(a+b*2.+c*3.+d*4.) #the summation isn't fused, aprox. the behaiviour of Test_np_nb for #single threaded target @nb.njit(fastmath=False,parallel=True) def Test_np_nb_eq(a,b,c,d): TMP=np.empty(a.shape[0]) for i in nb.prange(a.shape[0]): TMP[i]=a[i]+b[i]*2.+c[i]*3.+d[i]*4. res=0. for i in nb.prange(a.shape[0]): res+=TMP[i] return res #The usual way someone would implement this in Numba @nb.njit(fastmath=False,parallel=True) def Test_nb(a,b,c,d): res=0. for i in nb.prange(a.shape[0]): res+=a[i]+b[i]*2.+c[i]*3.+d[i]*4. return res </code></pre> 计时 ^{pr2}$ 结果 <pre><code>#single-threaded res_1=Test_nb(a,b,c,d) 499977967.27572954 res_2=Test_np(a,b,c,d) 499977967.2756622 res_3=Test_np_nb(a,b,c,d) 499977967.2756614 res_4=Test_np_nb_eq(a,b,c,d) 499977967.2756614 #multi-threaded res_1=Test_nb(a,b,c,d) 499977967.27572465 res_2=Test_np(a,b,c,d) 499977967.2756622 res_3=Test_np_nb(a,b,c,d) 499977967.27572465 res_4=Test_np_nb_eq(a,b,c,d) 499977967.27572465 </code></pre> 结论 这取决于用例什么是最好的使用。有些算法可以很容易地用Numpy写成几行，而另一些算法则很难或不可能以矢量化的方式实现。在 我还特意用了一个求和的例子。一次完成这一切很容易，而且速度也快得多，但是如果我想要最精确的结果，我肯定会使用一个已经在Numpy中实现的更复杂的算法。当然，你也可以在Numba做同样的事情，但那将是更多的工作要做。在

纯python上的Numba与numpython上的Numpa

1 个回答

相关Python问题