可怜的纽比·克罗斯()表演

2024-06-26 17:39:21 发布

您现在位置:Python中文网/ 问答频道 /正文

我一直在做一些性能测试,以提高我正在编写的一个pet项目的性能。这是一个需要大量处理数字的应用程序,所以我一直在使用Numpy来提高计算性能。在

然而,以下性能测试的结果令人惊讶。。。。在

测试源代码(更新了提升和批量提交的测试用例)

import timeit

numpySetup = """
import numpy
left = numpy.array([1.0,0.0,0.0])
right = numpy.array([0.0,1.0,0.0])
"""

hoistSetup = numpySetup +'hoist = numpy.cross\n'

pythonSetup = """
left = [1.0,0.0,0.0]
right = [0.0,1.0,0.0]
"""

numpyBatchSetup = """
import numpy

l = numpy.array([1.0,0.0,0.0])
left = numpy.array([l]*10000)

r = numpy.array([0.0,1.0,0.0])
right = numpy.array([r]*10000)
"""

pythonCrossCode = """
x = ((left[1] * right[2]) - (left[2] * right[1]))
y = ((left[2] * right[0]) - (left[0] * right[2]))
z = ((left[0] * right[1]) - (left[1] * right[0]))
"""

pythonCross = timeit.Timer(pythonCrossCode, pythonSetup)
numpyCross = timeit.Timer ('numpy.cross(left, right)' , numpySetup)
hybridCross = timeit.Timer(pythonCrossCode, numpySetup)
hoistCross = timeit.Timer('hoist(left, right)', hoistSetup)
batchCross = timeit.Timer('numpy.cross(left, right)', numpyBatchSetup) 

print 'Python Cross Product : %4.6f ' % pythonCross.timeit(1000000)
print 'Numpy Cross Product  : %4.6f ' % numpyCross.timeit(1000000) 
print 'Hybrid Cross Product : %4.6f ' % hybridCross.timeit(1000000) 
print 'Hoist Cross Product  : %4.6f ' % hoistCross.timeit(1000000) 
# 100 batches of 10000 each is equivalent to 1000000
print 'Batch Cross Product  : %4.6f ' % batchCross.timeit(100) 

原始结果

^{pr2}$

最终结果

Python Cross Product : 0.894334 
Numpy Cross Product  : 21.099040 
Hybrid Cross Product : 4.467194 
Hoist Cross Product  : 20.896225 
Batch Cross Product  : 0.262964 

不用说,这不是我期望的结果。纯Python版本的性能几乎比Numpy快30倍。在其他测试中,Numpy的性能比Python的同类性能要好(这是预期的结果)。在

所以,我有两个相关的问题:

  • 有人能解释为什么纽比在这件事上表现如此糟糕吗?在
  • 有什么我能做的吗?在

Tags: importrightnumpyproduct性能arrayleftprint
3条回答

您可以在这里看到源代码:http://www.google.com/codesearch/p?hl=en#5mAq98l-MUw/trunk/dnumpy/numpy/core/numeric.py&q=cross%20package:numpy&sa=N&cd=1&ct=rc

在纽比·克罗斯只需要处理大量的案件和做一些额外的副本。在

一般来说,numpy对于像矩阵乘法或求逆这样的慢操作来说足够快了,但是在小向量上的操作会有很多开销。在

为了减少numpy调用开销,您可以尝试使用cython作为中介来调用numpy函数。在

有关详细信息,请参见Fast numerical computations with Cython (SciPy 2009)。在

用更大的数组试试这个。我认为,仅仅调用numpy方法的开销就超出了Python版本所需的简单的几个列表访问。如果您处理更大的数组,我想您将看到numpy的大赢家。在

相关问题 更多 >